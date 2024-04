L’articolo descrive dettagliatamente il ‘gpt2-chatbot’, un modello di lingua di grandi dimensioni, recentemente messo a disposizione su https://chat.lmsys.org per interazioni di chat. Questo modello mostra capacità notevolmente superiori a quelle degli altri modelli GPT-2 conosciuti, ponendosi almeno allo stesso livello di modelli avanzati come GPT-4 e Claude Opus.

Il ‘gpt2-chatbot’ è accessibile per dialoghi diretti e per valutazioni anonime in modalità “Arena (Battle)”, utilizzata per benchmark iniziali. Nonostante la mancanza di informazioni dettagliate sul nome del modello specifico, l’articolo suggerisce che potrebbe essere una versione precoce di GPT-4.5, considerando l’incremento qualitativo nei risultati.

Il modello si avvale del tokenizer ‘tiktoken’ di OpenAI, come confermato dal confronto dell’uso di token speciali con altri modelli. Inoltre, il modello fornisce dettagli di contatto estremamente precisi a OpenAI quando richiesti, e si identifica coerentemente con l’architettura di GPT-4. Tuttavia, l’articolo invita a mantenere uno scetticismo sano e a basare le conclusioni su prove concrete, evitando il bias di conferma.

La discussione online suggerita dall’articolo ha attirato l’attenzione generale, inclusa una reazione ambigua via tweet da parte di Sam Altman, che non sembra confermare né smentire direttamente il coinvolgimento di OpenAI. Ciò potrebbe indicare che OpenAI ha rilasciato questo modello di nascosto su lmsys.org per testare senza pregiudizi le prestazioni del modello, evitando aspettative elevate che potrebbero influenzare negativamente le valutazioni degli utenti.

Titolo dell’articolo: “GPT-2?”

Fonte: rentry.co

