Emma, l'IA italiana finita nei meme: perché i modelli piccoli sbagliano così tanto

Un modello linguistico da 550 milioni di parametri, addestrato in italiano e sviluppato da una PMI quotata a Milano, è diventato un tormentone della rete. Non per i suoi successi, ma per le risposte assurde mostrate dagli utenti. La storia di Emma è l'occasione per capire come funziona davvero un modello piccolo.

L'IA italiana che voleva renderci indipendenti

Si chiama Emma, è nata in Italia e può girare anche su un normale laptop. È sviluppata da Egomnia, PMI innovativa quotata sull'Euronext Growth di Milano e fondata da Matteo Achilli, ed è una famiglia di modelli linguistici (LLM) pensata per rispondere a una domanda ambiziosa: è possibile costruire un'intelligenza artificiale «sovrana», italiana, meno dipendente dai grandi colossi stranieri?

La comunicazione del progetto è coerente con questa visione, con riferimenti alla «sovranità tecnologica nazionale» e a un'IA che non dipenda da «pochi attori stranieri», come racconta Economy Magazine. Poi, però, sono arrivati i meme.

Il test che ha fatto crollare l'hype

Tutto è esploso quando utenti e commentatori hanno cominciato a mettere il modello alla prova con domande elementari. Il caso più citato: chiedere quante «r» ci siano nella parola «giallo» (la risposta corretta è zero). Stando alla ricostruzione di Pasquale Pillitteri, Emma ha risposto con una frase priva di senso, mentre lo stesso quesito sottoposto a un modello di punta come Gemini di Google ha prodotto una risposta corretta.

A fare da scintilla alla viralità è stato anche il contrasto, troppo ghiotto per la rete, tra la retorica della «liberazione dalla tirannia delle aziende americane» e un modello che gira su un computer da ufficio e inciampa su domande banali.

Perché Emma sbaglia: è una questione di scala

La spiegazione tecnica è meno romantica della narrativa sulla sovranità, ma è la chiave per non trarre conclusioni sbagliate. Emma ha circa 550 milioni di parametri e una finestra di contesto di poche migliaia di token: una dimensione sperimentale, quasi didattica. I modelli di frontiera come quelli di OpenAI, Anthropic o Google operano con un numero di parametri di ordini di grandezza superiore, finestre di contesto enormemente più ampie e un addestramento incomparabile per dati e potenza di calcolo.

I parametri non sono «regole» programmate, ma pesi numerici che emergono dall'addestramento su grandi quantità di testo. Più sono, più il modello può rappresentare relazioni complesse tra parole e concetti. Un modello piccolo fatica proprio con i compiti che richiedono ragionamento a livello di singoli caratteri (contare le lettere), calcolo, coerenza logica su sequenze lunghe: è qui che si manifestano le cosiddette allucinazioni, affermazioni generate con sicurezza ma prive di corrispondenza con la realtà.

Emma, peraltro, nasce con un obiettivo dichiaratamente diverso da quello dei modelli generalisti: ottimizzare l'italiano per contesti aziendali e istituzionali, dove la localizzazione e la conformità normativa contano più del sapere enciclopedico.

Il vero problema è lo scarto tra racconto e realtà

Il punto più interessante della vicenda Emma non è tecnico, ma comunicativo. Quando si presenta un modello linguistico con il lessico della liberazione nazionale, si generano aspettative che un modello leggero non può soddisfare. Lo scarto tra il frame epico e le risposte sgangherate diventa il combustibile perfetto per l'ironia online.

Il problema, in fondo, non è Emma in sé: è legittimo e utile che esistano modelli leggeri, italofoni e conformi alle normative europee, pensati per usi specifici e controllati. Vestirli però dei panni del salvatore tecnologico è una scommessa rischiosa. I meme passano; le domande serie che la vicenda solleva — su chi controlla l'infrastruttura dell'IA e su come comunicarne con onestà i limiti — restano sul tavolo.