Minerva, la ‘ChatGPT’ della Sapienza, ha raddoppiato le sue capacità con un nuovo modello, Minerva 7B, che ha ben 15 milioni di token, equivalenti a 15 milioni di libri. Questo avanzamento è stato presentato dal gruppo di ricerca Sapienza NLP, diretto da Roberto Navigli, e ha visto la collaborazione con CINECA e il supercomputer Leonardo. Minerva rappresenta il primo modello di intelligenza artificiale completamente aperto, ideale per le Pubbliche Amministrazioni, grazie alla trasparenza nelle fonti e nel processo di addestramento.
Rispetto alla versione precedente, Minerva 7B si distingue per la sua potenza, avendo 7 miliardi di parametri rispetto ai 3 miliardi della versione precedente, il che migliora la sua capacità di memorizzazione e rielaborazione dei testi, sempre basata su dati aperti. Dopo mesi di lavoro, il team è arrivato a creare oltre 2 trilioni di token, equivalenti a circa 1,5 trilioni di parole. La versione 7B è stata affinata attraverso una tecnica di instruction tuning, migliorando la sua capacità di comprendere e rispondere alle richieste in italiano, producendo risposte più pertinenti, coerenti e contestualmente appropriate, riducendo al minimo errori e contenuti problematici.
Per costruire la base del modello, i ricercatori hanno utilizzato un ampio corpus di dati dal web, una rete neurale complessa e elevate capacità di calcolo, perfezionando ulteriormente Minerva con istruzioni di sicurezza e un processo di allineamento. I numeri che caratterizzano Minerva 7B includono 2.500 miliardi di token, 580 mila esempi di instruction tuning, 7,4 miliardi di parametri e oltre 300 mila ore di addestramento GPU.
Navigli ha annunciato l’intenzione di creare un laboratorio permanente per sostenere e ampliare le ricerche nel campo dell’intelligenza artificiale. Mentre il progetto prosegue, i risultati ottenuti finora rappresentano solo l’inizio. La Sapienza intende concentrarsi su temi cruciali come la mancanza di dati di qualità in italiano e aprirsi a collaborazioni con il mondo editoriale e le Pubbliche Amministrazioni.
Antonella Polimeni, rettrice della Sapienza, ha ribadito l’impegno dell’ateneo verso l’innovazione e lo sviluppo dell’intelligenza artificiale, considerando il progetto Minerva un motore di progresso al servizio della società. Giuseppe De Pietro di FAIR ha sottolineato l’importanza del modello come riferimento per la Pubblica Amministrazione, mentre CINECA ha espresso entusiasmo per il contributo al progetto di ricerca avanzato.