Ecco Anthropic lancia Claude 3: è davvero il nuovo rivale di Gemini e ChatGpt?

Nella competizione tra le Ai generative, oltre i soliti noti Google con Gemini e OpenAi con GPT, c’è un terzo incomodo: si chiama Anthropic e Claude è il chabot che con la sua ultima release getta il guanto di sfida ai suoi diretti concorrenti. Sono tre le versioni del chatbot annunciate dalla start up acquisita da Amazon e capitanata dai fondatori Dario e Daniela Amodei: Opus, con in Llm più potente, disponibile solo con l’accesso a pagamento “Pro” e i fratelli minori Sonnet e Haiku.

L’annuncio di “Un nuovo standard per l’intelligenza”

La versione pro, secondo gli sviluppatori, dimostra “Livelli quasi umani di comprensione e fluidità in compiti complessi” e promette di alzare l’asticella in un’ampia gamma di compiti cognitivi, superando i colleghi nella maggior parte dei benchmark di valutazione usati per valutare i sistemi di intelligenza artificiale, tra cui la conoscenza degli esperti a livello universitario (Mmlu), il ragionamento esperto a livello di laurea (Gpqa) e la matematica di base (Gsm8k). Opus, in particolare, il modello più performante del terzetto, viene presentata come una “Intelligenza superiore a qualsiasi altro modello ora disponibile” e può essere impiegata per pianificare ed eseguire azioni complesse su interfacce di programmazione (Api), codifica interattiva e database. A livello strategico può anche effettuare revisioni delle ricerche, brainstorming e generare ipotesi. Farà inoltre la felicità di chi lavora con una grande mole di numeri, grazie all’analisi avanzata di dati finanziari, compresi diagrammi e grafici, generando tendenze di mercato e previsioni di scenari futuri. A tutto questo si aggiunge anche la scoperta di farmaci.

Tutti gli upgrade di Claude: dalla velocità, ai rifiuti fino alla sicurezza

Rispetto alle precedenti generazioni i miglioramenti della terza versione del chatbot sono significativi. Nella presentazione, Anthropic ha sottolineato di aver raggiunto una maggior accuratezza, con errori meno frequenti e con una migliore capacità di comprendere e rispondere a domande complesse e fattuali, raggiungendo un tasso di scarto e rifiuto delle richieste trascurabile. Il lavoro svolto dal team di Anthropic ha comportato la suddivisione delle risposte alle richieste in tre categorie: corrette, errate (o allucinazioni) e le cosiddette “ammissioni di incertezza”. In quest’ultimo caso Claude afferma di non conoscere la risposta evitando di fornire informazioni errate. Ancora, si è riscontrata una maggiore fluidità nelle lingue diverse dall’inglese, compreso l’italiano.Lavoro di migliorie che ha riguardato anche i pregiudizi e la sicurezza. Secondo quanto riferito dal cofondatore, Claude 3 presenta meno pregiudizi rispetto ai modelli precedenti, assicurando un livello di sicurezza AI 2 (ASL-2), in linea con gli impegni presi con la Casa Bianca e l’Ordine Esecutivo degli Usa del 2023. Il chatbot presenterebbe, al momento, “un trascurabile potenziale di rischio catastrofico”, con i ricercatori che intendono innalzare il livello di sicurezza a 3.

Oltre Opus: Sonnet e Haiku

Sonnet è presentato come il chatbot in grado di raggiungere un equilibrio ideale tra intelligenza e velocità, offrendo prestazioni elevate a un costo inferiore rispetto ai suoi concorrenti. In ambito aziendale può essere usato per avere consigli sui prodotti, previsioni di mercato e marketing mirato. Haiku, la versione meno performante, è invece perfetta per le aziende che vogliono migliorare le interazioni con i clienti (supporto rapido e accurato nelle interazioni live e per le traduzioni) e nella moderazione dei contenuti, rilevando comportamenti rischiosi o richieste dei clienti, oltre che per tutte quelle attività di risparmio sui costi (logistica ottimizzata, gestione dell’inventario e nell’estrazione della conoscenza da dati non strutturati).

Disponibilità dei modelli

Opus è già disponibile per l’uso con Api di Anthropic per gli abbonati a Claude Pro, mentre Sonnet è disponibile gratis su claude.ai e tramite Amazon Bedrock. Per Haiku bisognerà attendere ancora un po’ visto che non stata ancora stata rivelata una data di uscita.

Fonte: Il Sole 24 Ore