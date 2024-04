LINGO-2 rappresenta un’evoluzione significativa nel campo della guida autonoma, integrando la visione, il linguaggio e l’azione in un modello unico. Questo modello, il primo del suo genere a essere testato su strade pubbliche, mira a migliorare l’affidabilità e la personalizzazione dell’esperienza di guida autonoma.

Dopo aver introdotto il modello LINGO-1, che forniva commenti sulla guida basati unicamente sul linguaggio e non interagiva direttamente con le decisioni di guida, LINGO-2 avanza integrando pienamente commenti e azioni.

Utilizzando sia input visivi che linguistici, il modello genera azioni di guida e commenti in tempo reale, offrendo una visione dettagliata del processo decisionale dell’IA. Questa capacità di generare narrazioni continue delle decisioni aiuta a costruire fiducia nei sistemi di guida assistita e autonoma, rendendo più comprensibili le operazioni dell’IA.

La struttura di LINGO-2 comprende un modello di visione che elabora immagini in sequenze di token, integrati poi in un modello linguistico che predice traiettorie e testi descrittivi. Questa architettura consente al veicolo di adattare il suo comportamento in base a comandi linguistici, dimostrando una notevole adattabilità in scenari simulati come l’attraversamento di incroci o la navigazione in aree urbane dense.

Le interazioni tra veicolo e linguaggio apportano nuove possibilità per il miglioramento dell’interazione uomo-macchina e per la formazione di modelli AI, come dimostrano esperimenti nel simulatore Ghost Gym di Wayve. LINGO-2 non solo migliora la comprensione e la fiducia nelle tecnologie di guida autonoma, ma apre anche la strada a futuri sviluppi dove il linguaggio potrebbe controllare direttamente il comportamento del veicolo in ambienti di guida reali.

Titolo dell’articolo: “LINGO-2: Driving with Natural Language”

Fonte: Wayve

a cura di Recomb.ai