Quanta energia consuma l’Ai? Un prompt di Gemini equivale a 9 secondi davanti alla Tv

Quanta energia consuma l’Ai? Un prompt di Gemini equivale a 9 secondi davanti alla Tv

I limiti dello studio di Google

Come ha tenuto a precisare Partha Ranganathan, che si occupa principalmente delle infrastrutture di calcolo e dei data center dell’azienda, con particolare attenzione all’efficienza e alla sostenibilità, lo studio si concentra solo su domande testuali medie. L’analisi abbraccia un arco temporale di 12 mesi e quindi include una più ampia diversità di prompt. In particolare, è stato misurato il “prompt mediano” che viene definito come il prompt che si posiziona al 50° percentile in termini di consumo energetico. Il processo funziona così: per ogni modello di AI, si calcola l’energia media consumata per elaborare un singolo prompt (una singola richiesta dell’utente). Si crea una classifica: tutti i prompt inviati dagli utenti vengono messi in una lista e ordinati in base al consumo energetico necessario per elaborarli. A questo punto si identifica il 50° percentile cioè si individua il prompt che si trova esattamente a metà di questa classifica. Questo è il “prompt mediano”. Il limite di questo studio è che non ci dice nulla sui sistemi text-to-image e text-to-video, quelli, per intenderci, che generano immagini e video e proprio per questo considerati più energivori. I ricercatori a questo proposito hanno spiegato che c’è poco consenso su come misurare l’impatto di altri tipi di generazione. Inoltre, sarebbe scientificamente scorretto fornire stime per confrontare in termini di impatto energetico le domande al motore di ricerca di Google con una query a Gemini.

«I modelli di interazione sono diversi – ha affermato Ranganathan – sarebbe come confrontare mele con le pere».

Quanta acqua consuma una query?

Una query media cioè un prompt mediano di Gemini utilizza 0,26 ml d’acqua (circa 5 gocce). Gli esperti di Google hanno tenuto a precisare che l’uso di acqua può ridurre del 10% i consumi energetici rispetto al raffreddamento ad aria. Nei siti in zone a stress idrico, come Mesa in Arizona, viene scelto il raffreddamento ad aria per non pesare sulle risorse locali. Oltre il 25% dei data center usa acqua non potabile o riciclata.

Quindi quanto è 0,24 Wh a domanda? Tanto o poco?

0,24 Wh per query potrebbe sembrare poco, ma questa cifra è solo per un prompt molto semplice, come «ciao»? Il consumo energetico aumenta man mano che una conversazione si sviluppa, le query diventano più complesse e la memoria richiesta cresce di conseguenza. Molti analisti sostengono che misurare l’impatto ambientale dell’IA generativa per singola query è una informazione fondamentale, ma non aiuta a stimare il reale impatto dell’AI inteso come volume di domande che gli utenti effettuano ogni giorno. Leggendo tra i dati della trimestrale di Google relativa al secondo trimestre del 2025 abbiamo contezza degli utenti ma non sui volumi di traffico. L’app Gemini ha più di 450 milioni di utenti attivi mensili mentre le richieste giornaliere che sono aumentate di oltre il 50% rispetto al primo trimestre. Quindi non sappiamo quanto consuma energia consuma l’uso di Gemini. Dobbiamo accontentarci di avere una unità di misura che ha però il merito se venisse adottata di aiutare a comparare gli LLM sul mercato.

Il nodo dell’efficienza sui consumi energetici?

La dimensione dei modelli di IA, come Gemini, è cresciuta esponenzialmente (raddoppiando ogni circa 3 mesi e mezzo). Google, hanno spiegato, sta innovando per migliorare l’efficienza energetica, implementando controlli intelligenti e riprogettando i sistemi di distribuzione dell’energia. Stanno anche spostando i carichi di lavoro di IA per usare l’elettricità durante i periodi di minor stress sulla rete.

Fonte: Il Sole 24 Ore