L’intelligenza artificiale generativa è davvero un pessimo lavoratore?
In contrasto con il benchmark di OpenAI
I risultati del Remote Labor Index si pongono in netto contrasto con altri benchmark, come GDPval, sviluppato da OpenAI, secondo cui modelli di ultima generazione come Gpt-5 si avvicinano ormai alle performance umane in diversi lavori d’ufficio, specialmente nelle attività di scrittura e analisi.
La differenza, spiegano gli autori dello studio del Cais, sta nel contesto: GDPval misura la competenza linguistica e cognitiva in ambienti controllati, mentre il Remote Labor Index valuta la capacità operativa in scenari realistici, che richiedono coordinamento, pianificazione e adattamento.
Produttività aumentata, ma non sostituzione
Il messaggio che emerge è duplice. Da un lato, l’AI può potenziare la produttività dei freelance umani — accelerando la produzione di bozze, analisi e il brainstorming.
Dall’altro, la sua autonomia è ancora limitata. Le piattaforme di lavoro online, dove il successo dipende da interazioni complesse con clienti, scadenze e feedback, restano oggi un dominio eminentemente umano.
Uno studio del Mit Sloan (2024) aveva già rilevato un effetto simile: l’uso dell’AI generativa aumenta la produttività del 14% tra gli impiegati che svolgono compiti cognitivi standardizzati, ma non migliora — e talvolta peggiora — le performance nei lavori che richiedono autonomia o creatività.
Fonte: Il Sole 24 Ore