La matematica è un duro rompicapo per l’intelligenza artificiale

Apple ha recentemente confermato alcune gravi carenze logiche nell’Intelligenza Artificiale generativa (AI), specialmente per quanto riguarda la capacità di ragionamento matematico. Una nuova ricerca dimostra che l’AI non è così “intelligente” come si credeva, rivelando difficoltà persino nel risolvere semplici problemi di matematica di livello elementare.

Il documento, intitolato “GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models”, redatto da sei ricercatori di Apple, evidenzia come i modelli linguistici avanzati possano risultare inaccurati e fragili nella logica matematica.

I ricercatori hanno utilizzato GSM8K, un dataset contenente 8.000 problemi matematici di livello scolastico, riconosciuto come un benchmark standard per testare le LLM. Hanno poi leggermente modificato il linguaggio dei problemi senza alterarne la logica, creando il test GSM-Symbolic.

I risultati hanno mostrato un significativo calo delle prestazioni, registrando una riduzione che varia dallo 0,3% al 9,2% nel primo set di test. Un ulteriore test, che includeva affermazioni irrilevanti rispetto alla soluzione del problema, ha rivelato cali di performance “catastrofici”, con decrementi dal 17,5% al 65,7%.

Questo non sorprende completamente. Personalmente, ho notato che l’AI fatica con compiti semplici legati ai numeri. In effetti, l’AI non risolve correttamente i problemi matematici, ma utilizza un metodo di “pattern matching” per trasformare le affermazioni in operazioni, senza realmente comprendere il significato.

Sembra che l’AI tenda a fallire nel risolvere semplici problemi matematici perché le parole possono essere troppo confuse o non seguire il pattern esatto. In definitiva, l’AI dà solo l’illusione di “ragionare”, affidandosi piuttosto all’accumulo di dati e al loro processo.

Ma cosa significa questo per il quadro più ampio? Recentemente, ci siamo concentrati eccessivamente sull’AI, e sembra che alcuni si aspettino miracoli da essa (anche io mi sono lasciato trasportare da questo pensiero). Purtroppo presenta limitazioni serie e non è chiaro se queste potranno essere mitigate. Non sono uno scienziato dell’AI, ma sarà molto interessante vedere dove l’evoluzione dell’AI potrà inciampare, oltre che nella matematica.

VIA

Tags: AI e matematica elementare AI scolastica algoritmi AI Apple ricerca AI Apple Tech capacità AI critica AI critiche AI dataset GSM8K efficienza AI errore AI matematica errori logici AI fallimenti AI future AI GSM-Symbolic illusione AI Intelligenza Artificiale Large Language Models limitazioni AI limiti AI LLM pattern matching AI prestazioni AI problemi di matematica AI processamento dati AI progresso AI ragionamento matematico AI studi AI sviluppi AI test AI

Batista70

La matematica è un duro rompicapo per l’intelligenza artificiale

Lascia un commento Annulla risposta

La matematica è un duro rompicapo per l’intelligenza artificiale

Articoli che potrebbero interessarti

OpenAI Codex: vietato parlare dei…goblin?

IT4LIA: un nuovo supercomputer arriva a Bologna

Anthropic indaga su Mythos dopo un accesso non autorizzato

Lascia un commento Annulla risposta