In un contesto di crescente preoccupazione per la sicurezza dei sistemi di intelligenza artificiale, Anthropic ha introdotto i "constitutional classifiers", un'iniziativa destinata a bloccare fino al 95% dei tentativi di jailbreak.
Indice dei contenuti L'approccio innovativo di AnthropicFunzionamento dei constitutionalclassifiers Addestramento attraverso datisintetici Rilevamento delle minacce in temporeale Efficacia contro i tentativi dijailbreak Adattamento alle minacce in continuaevoluzione La strada da percorrere per la sicurezza dell'IA L'approccio innovativo di Anthropic Il concetto alla base dei constitutional classifiers si basa sul framework di "Constitutional AI", lanciato da Anthropic nel dicembre 2022, poco dopo l'uscita di ChatGPT.