NEW YORK – Meta Platforms ha rilasciato le prime versioni del suo ultimo modello di linguaggio di grandi dimensioni, Llama 3, e un generatore di immagini che le aggiorna in tempo reale mentre gli utenti digitano i messaggi. Una chiara strategia per raggiungere OpenAI, leader del mercato dell’intelligenza artificiale generativa.

I modelli saranno integrati nel suo assistente virtuale Meta AI, che l’azienda definisce come il più sofisticato tra i suoi concorrenti gratuiti, citando confronti delle prestazioni su argomenti come ragionamento, codifica e scrittura creativa rispetto alle offerte di rivali tra cui Google di Alphabet e la startup francese Mistral AI.

L’assistente Meta AI aggiornato avrà un posizionamento più prominente all’interno delle app Facebook, Instagram, WhatsApp e Messenger di Meta, nonché un nuovo sito Web autonomo che la posiziona per competere più direttamente con il successo di ChatGPT di OpenAI sostenuta da Microsoft.

Una pagina di destinazione che accoglie i visitatori su quel sito li spinge a provare a chiedere all’assistente di creare una lista di cose da fare per le vacanze, riprodurre con loro curiosità sulla musica degli anni ’90, fornire aiuto per i compiti e dipingere immagini dello skyline di New York City.

Meta si è impegnata a spingere i prodotti di intelligenza artificiale generativa verso i suoi miliardi di utenti per sfidare la posizione di leader di OpenAI nella tecnologia, comportando una costosa revisione dell’infrastruttura informatica e il consolidamento di team di ricerca e prodotto precedentemente distinti.

Il colosso dei social media ha rilasciato apertamente i suoi modelli Llama affinché possano essere utilizzati dagli sviluppatori che creano app di intelligenza artificiale come parte del suo sforzo di recupero, poiché una potente opzione gratuita potrebbe ostacolare i piani dei rivali di guadagnare entrate dalla loro tecnologia proprietaria. La strategia ha suscitato preoccupazioni sulla sicurezza da parte dei critici diffidenti nei confronti di ciò che attori senza scrupoli potrebbero fare, utilizzando il modello.

Meta ha dotato Llama 3 di nuove capacità di codifica del computer e questa volta gli ha fornito immagini e testo durante l’addestramento, anche se per ora il modello produrrà solo testo, ha detto Chris Cox, Chief Product Officer di Meta, in un’intervista.

Ragionamenti più avanzati, come la capacità di elaborare piani più lunghi in più fasi, seguiranno nelle versioni successive, ha aggiunto. Le versioni previste per il rilascio nei prossimi mesi saranno anche capaci di “multimodalità”, nel senso che potranno generare sia testo che immagini, ha affermato Meta nei post del suo blog.

“L’obiettivo alla fine è quello di aiutarti a toglierti le cose dal piatto, semplicemente aiutarti a semplificarti la vita, sia che si tratti di interagire con le aziende, sia che si stia scrivendo qualcosa, sia che si stia pianificando un viaggio”, ha detto Cox.

Cox ha affermato che l’inclusione di immagini nell’addestramento di Llama 3 migliorerebbe un aggiornamento lanciato quest’anno sugli occhiali intelligenti Ray-Ban Meta, un prodotto realizzato con il produttore di occhiali Essilor Luxottica, consentendo a Meta AI di identificare gli oggetti visti da chi li indossa e rispondere domande su di loro.

Giovedì le azioni Meta sono aumentate dell’1,8%.

Meta ha inoltre annunciato una partnership con Google per includere i risultati della ricerca in tempo reale nelle risposte dell’assistente, integrando un accordo esistente con il motore di ricerca Bing di Microsoft.

Con l’aggiornamento l’assistente Meta AI si sta espandendo in più di una dozzina di mercati al di fuori degli Stati Uniti, tra cui Australia, Canada, Singapore, Nigeria e Pakistan. Meta sta “ancora lavorando sulla strada giusta per farlo in Europa”, ha detto Cox, dove le norme sulla privacy sono più rigorose e l’imminente legge sull’intelligenza artificiale è pronta a imporre requisiti come la divulgazione dei dati di addestramento dei modelli.

Il vorace bisogno di dati dei modelli di intelligenza artificiale generativa è emerso come una delle principali fonti di tensione nello sviluppo della tecnologia.

Il CEO di Meta Mark Zuckerberg ha fatto un cenno alla concorrenza con OpenAI in un video che accompagnava l’annuncio, in cui ha definito Meta AI “l’assistente AI più intelligente che puoi usare liberamente”.

Zuckerberg ha affermato che le due versioni più piccole di Llama 3 ora in fase di lancio, con 8 miliardi e 70 miliardi di parametri, hanno ottenuto punteggi favorevoli rispetto ad altri modelli gratuiti sui benchmark delle prestazioni comunemente utilizzati per valutare la qualità del modello. La versione più grande di Llama 3 è ancora in fase di addestramento, con 400 miliardi di parametri, ha detto.

Questi risultati sono stati “senza dubbio impressionanti”, ma anche indicativi di un crescente divario prestazionale tra i modelli gratuiti e quelli proprietari, ha affermato Nathan Benaich, fondatore della società di venture capital focalizzata sull’intelligenza artificiale Air Street Capital.

Gli sviluppatori si sono lamentati del fatto che la precedente versione Llama 2 del modello non riusciva a comprendere il contesto di base, confondendo le domande su come “uccidere” un programma per computer con richieste di istruzioni su come commettere un omicidio. Il rivale Google si è imbattuto in problemi simili e ha recentemente sospeso l’uso del suo strumento di generazione di immagini Gemini AI dopo aver attirato critiche per aver sfornato rappresentazioni imprecise di personaggi storici.

Meta ha affermato di aver ridotto questi problemi in Llama 3 utilizzando “dati di alta qualità” per far sì che il modello riconosca le sfumature. Non ha fornito dettagli sui set di dati utilizzati, anche se ha affermato di aver inserito in Llama 3 una quantità di dati sette volte superiore a quella utilizzata per Llama 2.

Fonte: Reuters