Anthropic sicurezza AI: cambia la promessa chiave
Anthropic ha cambiato in modo importante la sua Responsible Scaling Policy (RSP) e ha rimosso quella che, finora, era la promessa più forte del suo impianto di sicurezza: l’idea di non andare avanti con training o rilascio se le misure di mitigazione non erano adeguate in anticipo. La notizia arriva da un’esclusiva pubblicata da TIME, con dichiarazioni del Chief Science Officer Jared Kaplan.
È un passaggio pesante — non tanto per lo slogan, ma per il significato pratico: Anthropic, infatti, era percepita come una delle realtà più rigorose sul fronte AI safety; proprio per questo, il cambio di rotta farà discutere molto nelle prossime settimane.
Anthropic e RSP 3.0: cosa cambia davvero
Secondo quanto riportato da TIME, la nuova versione della policy non mantiene più il vecchio vincolo duro che impediva di procedere oltre certe soglie senza garanzie preventive sulle mitigazioni. Al suo posto arriva un approccio più flessibile, con maggiore enfasi su trasparenza, reporting e confronto con il livello di sicurezza dei concorrenti.
In pratica: meno tripwire rigido, più valutazione continua del rischio. È una differenza tecnica, sì; però cambia anche il messaggio pubblico dell’azienda, prima il perno era un limite autoimposto molto forte, adesso il focus si sposta su processi, documenti e disclosure periodiche.
Perché Anthropic ha cambiato la promessa sulla sicurezza AI
La motivazione dichiarata ruota intorno a tre elementi: corsa competitiva più intensa, assenza di regole pubbliche realmente vincolanti e maggiore incertezza scientifica nel definire soglie nette di rischio. Kaplan, nell’intervista a TIME, spiega che un impegno unilaterale non avrebbe senso se altri laboratori continuano a correre.
Nel pezzo si legge anche che l’azienda considera più difficile, rispetto al 2023, tracciare una linea rossa chiara; il rischio, secondo questa lettura, appare meno binario e più graduale, ed è proprio qui che nasce il cambio di impostazione: non più una soglia unica da superare o no, ma una gestione progressiva del rischio.
RSP 3.0 di Anthropic: più trasparenza, meno vincolo unilaterale
La nuova impostazione include impegni su documenti periodici come Frontier Safety Roadmaps e Risk Reports, pensati per spiegare meglio obiettivi, minacce considerate e mitigazioni in corso.
Questo punto è importante perché Anthropic non sta dicendo “la sicurezza non conta più”; sta dicendo, invece, che vuole gestirla con una struttura diversa — più orientata a reporting e accountability pubblica, meno a uno stop autoimposto in solitaria. È una distinzione reale; allo stesso tempo, non elimina le critiche.
Le critiche: perché questo cambio preoccupa
Nel report di TIME emergono anche timori molto chiari: il passaggio da soglie più nette a un modello graduale potrebbe rendere più facile sottovalutare escalation progressive del rischio. In sintesi, il timore è quello dell’effetto “acqua che bolle lentamente”, senza un momento preciso che faccia scattare l’allarme.
Ed è qui il nodo vero della notizia: non si discute solo una policy interna, ma un precedente. Se anche il laboratorio che più ha costruito la propria identità su una narrativa di safety-first allenta un impegno simbolico, il segnale per il settore è forte — e apre un dibattito serio su quanto possano bastare gli impegni volontari senza un quadro regolatorio condiviso.
Cosa significa adesso per Claude e per il mercato AI
Nel breve periodo, questa novità non cambia direttamente l’esperienza d’uso di Claude per l’utente finale; non è una funzione nuova, né un update di prodotto. Però cambia il contesto in cui Anthropic racconta il proprio sviluppo futuro, e questo pesa sulla percezione del brand — soprattutto lato enterprise, policy e governance.
In altre parole: è una notizia da policy, ma con effetti concreti sulla fiducia, e proprio per questo va seguita bene, senza semplificare troppo; perché il punto non è solo se Anthropic sia diventata meno prudente, ma come intende dimostrarlo pubblicamente d’ora in avanti.