Dagli assistenti vocali agli smartphone, passando per i chatbot all’avanguardia come ChatGPT fino agli elettrodomestici, l’Intelligenza Artificiale si è diffusa ampiamente nella vita di tutti i giorni.
In linea con le evoluzioni storiche, molte tecnologie, comprese quelle basate sulle reti neurali profonde, si sono sviluppate senza ancora avere basi teoriche solide. La comprensione del funzionamento di tali modelli di apprendimento automatico è ancora in fase embrionale, nonostante gli sforzi della comunità scientifica.
Sfruttando la ricca tradizione italiana nella Fisica statistica, un team di giovani ricercatori coordinati da Pietro Rotondo presso il Dipartimento di Scienze Matematiche, Fisiche e Informatiche dell’Università di Parma ha presentato una nuova teoria innovativa in grado di predire con notevole precisione le performance di una particolare classe di reti neurali profonde completamente connesse.
La ricerca è stata pubblicata su “Nature Machine Intelligence”. In particolare, la teoria avanzata riesce a valutare l’abilità di astrazione di una rete basandosi esclusivamente sui parametri fondamentali che la descrivono (come la larghezza dei “layer nascosti” e la funzione di attivazione) e sui dati utilizzati per il suo addestramento.
Questa scoperta contribuisce a colmare il divario tra teoria e applicazioni pratiche dell’Intelligenza Artificiale, aprendo la strada all’esplorazione di sistemi sempre più complessi, avvicinandosi sempre di più a quelli integrati nella nostra vita quotidiana.
Il progetto fa parte dell’iniziativa Pnrr Mnesys e coinvolge il gruppo di Fisica statistica e dei sistemi complessi guidato dalla professoressa Raffaella Burioni dell’Università di Parma. La collaborazione ha visto la partecipazione di ricercatori provenienti da diverse istituzioni italiane ed estere, con un contributo significativo da parte di Rosalba Pacelli (Politecnico di Torino e Università Bocconi) e Sebastiano Ariosto (Università dell’Insubria).