Finora la percezione comune è che per giocare la partita dell’AI sono necessari investimenti e infrastrutture talmente enormi da scoraggiare qualsiasi tentativo in questa direzione. La Cina ha dimostrato che non è così. E ora può avanzare anche alla conquista delle ‘intelligenze naturali’ di Andrea Monti – Inizialmente pubblicato su LaRepubblica – Italian Tech
Il rumore suscitato dall’ultima versione di DeepSeek, il modello AI sviluppato dall’omonima azienda cinese ha coperto una serie di segnali che forniscono indicazioni abbastanza chiare su come sta cambiando il mercato dell’AI.
Questo è vero, in modo particolare, per la reazione di OpenAI e di altri giganti del settore che, come riporta la BBC, hanno subito una sorta di “ridimensionamento reputazionale” e potenziali problemi di mercato per via della capacità dimostrata da DeepSeek di competere con gli equivalenti occidentali a costi minori e maggiori livelli di efficienza.
L’AI non è (solo) forza bruta
Per capire quello che sta succedendo è necessario innanzi tutto partire dalle questioni più astratte, che riguardano il rapporto fra potenza di calcolo e capacità del software di sfruttarla.
DeepSeek dimostra che, pur avendo accesso a un numero relativamente ridotto di GPU e per di più non di ultimissima generazione, è possibile competere con i modelli occidentali, o meglio, americani, più capaci. Una delle ragioni di questo risultato è la gestione più efficiente della componente software, che dimostra come una maggiore intelligenza possa compensare la minore “forza bruta”.
A questo proposito, è importante ricordare che la natura problematica del rapporto fra bloatware —o, in generale, fra la scrittura di codice sgrammatico e inefficiente— e l’impatto negativo sulle prestazioni del hardware che lo esegue esiste da sempre, e non riguarda soltanto l’AI. Basta pensare alle ultra decennali querelle fra il mondo Windows e quello *NIX già documentate nel 1999 da Neil Stephenson nel suo breve saggio In the beginning was the command line e all’altrettanto storica definizione di spaghetti code pubblicata sul sito della Free Software Foundation.
Anche l’AI, dunque, non si sottrae alla regola empirica che caratterizza l’evoluzione delle tecnologie emergenti: all’inizio fa ricorso alla “forza bruta”, sfruttando in modo rozzo le risorse disponibili, per poi ottimizzarne gradualmente l’uso attraverso innovazioni ed evoluzioni tecniche basate sull’esperienza.
Questo processo, come detto, è evidente anche nel campo dell’intelligenza artificiale dove, però, le regole del gioco sono ancora basate sulla capacità di accumulare GPU sempre più potenti. Tuttavia, una convinzione del genere trascura il fatto che la crescita della potenza di calcolo non è lineare rispetto al consumo energetico e ad altre variabili, come appunto la capacità di inventare nuovi approcci software, che definiscono ciò che serve per sviluppare un LLM. Il che ci porta ad affrontare il tema dell’effettiva economicità di DeepSeek e del perché questo è un problema per i suoi concorrenti.
L’attacco di DeepSeek alle strategie di marketing di OpenAI &C.
Nonostante l’emergere di approcci come la cosiddetta “frugal AI” — che promuove un utilizzo più parsimonioso e intelligente delle risorse — rimane diffusa la convinzione che più potenza di calcolo equivalga a più intelligenza artificiale. Con una coazione a ripetere da incubo, il settore dell’AI ha adottato strategie di marketing per nulla diverse da quelle praticate in altri comparti tecnologici. Basta pensare, per esempio, al modo di promuovere PC, macchine fotografiche e smartphone, tutte basate sul “più grosso” (il processore, il sensore, lo schermo, ecc.) è sul “più meglio”.
Il perché della scelta è chiaro: “più grosso è più meglio” sono concetti molto più facili da capire per chi detiene i cordoni della borsa e deve allentarli, rispetto a unique selling proposition basate su argomenti matematici o ingegneristici – lasciamo perdere quelli relativi al software – che sono complessi, difficili da riassumere in qualche frase ad effetto e difficilmente comprensibili da parte di utenti, investitori e decisori.
Fino ad ora, per quanto riguarda l’AI, questa strategia si è dimostrata in grado di creare barriere all’ingresso nel mercato. Ad oggi, infatti, la percezione comune è che per giocare la partita dei LLM sono necessari investimenti e infrastrutture talmente enormi da scoraggiare qualsiasi tentativo in questa direzione. Dunque, sostenendo questa narrativa i giganti del settore riescono, da un lato, a monopolizzare risorse finanziare e, dall’altro, a tenere fuori potenziali nuovi arrivati.
Tuttavia, grazie a DeepSeek, si è improvvisamente percepito che potrebbe essere possibile “fare di più” ma “spendendo meno” e che, di conseguenza, potrebbe non avere molto senso investire su tecnologie e hardware inutilmente costose da acquistare e gestire. Questo vale, a maggior ragione, se si considera che ci sono avvisaglie del genere anche nel settore dei chip, dove i nuovi processori ARM promettono economicità e prestazioni, tanto che già nel 2020nVIDIA aveva tentato, non riuscendoci, di acquisire il chipmaker inglese.
DeepSeek è stato sviluppato per destabilizzare le imprese USA?
È chiaro che il ragionamento appena svolto sulla maggiore appetibilità di DeepSeek funziona se e solo se i costi di sviluppo sono quelli dichiarati pubblicamente, cioè una frazione di quelli sostenuti dai concorrenti americani. Benché, infatti, l’approccio alla progettazione complessiva del modello cinese sia evidentemente orientato all’efficienza, non è chiaro se, e se si in che misura, ci sia stato un supporto anche indiretto del governo di Pechino, per esempio in termini di accesso all’energia e alla potenza di calcolo necessarie per addestrare il modello o di altre forme di sostegno.
Se, infatti, il minor costo per lo sviluppo di DeepSeek fosse stato anche in parte possibile per via di aiuti di Stato, sarebbe lecito avanzare qualche dubbio sulla reale migliore sostenibilitàdel progetto rispetto ai concorrenti americani e chiedersi se, invece, non siamo di fronte all’uso della leva economica per sconvolgere il mercato abbattendo il valore dei concorrenti. Questi ultimi, infatti, rischiano di trovarsi nella condizione di dover rincorrere DeepSeek invece di dettare il passo e di subire l’immissione di nuove tecnologie sul mercato invece di controllarle. Inoltre, perderebbero il proprio status privilegiato di fornitori di “materia prima” per il resto della filiera che sviluppa prodotti e servizi basati su LLM, dal momento che DeepSeek è più efficiente, più economico ma, soprattutto, “open source”.
La weaponizzazione dell’open source
Da tempo il concetto di open source —termine generico che, sommariamente, indica il diritto di accedere alle informazioni necessarie a comprendere una tecnologia e quello di utilizzarle liberamente — si è avviato verso la perdita del ruolo originario di strumento che favorisce la circolazione libera della conoscenza per diventare un componente importante dell’arsenale geopolitico degli Stati.
Non è un mistero che DeepSeek sia stato palesemente sviluppato nel rispetto delle direttive stabilite dalle autorità cinesi in relazione al modo di rispondere a questioni che riguardano i valori e le politiche socialiste. In questo senso, una scelta del genere è il perfetto corrispondente degli “ethical constraint” incorporati nei LLM proprietari e open source già disponibili in Occidente.
Tuttavia, la decisione di rilasciare Deepseek in open source non solo potrebbe ridurre il valore dei giganti dell’AI, ma rischia anche di sottrarre loro quote del mercato degli utenti. Aziende, sviluppatori e ricercatori potrebbero, infatti, essere interessati ad accedere a tecnologie sofisticate senza dover pagare costose licenze o subire limitazioni di altro tipo.Saremmo di fronte a una situazione complementare a quella creata dalla scelta compiuta daHuawei di rilasciare HarmonyOSNext (il sistema operativo concorrente di Android) in versione “libera”, capace di funzionare su una vasta gamma di dispositivi, dai wearable ai terminali, potenzialmente consentendo di realizzare un’infrastruttura tecnologica globale indipendente dalle tecnologie occidentali. Ed è appena il caso di ricordare che Huawei produce anche GPU per AI ottimizzate per DeepSeek.
L’impatto sulle “intelligenze” naturali
Infine, se si diffondesse sufficientemente, DeepSeek potrebbe diventare parte di una strategia per la diffusione in di idee non necessariamente conformi ai principi e ai valori occidentali.
Licurgo, scrive Plutarco, nelle Vite parallele, bandì da Sparta tutti i forestieri che non avevano una buona ragione per rimanere avendo il timore “che diffondessero qualcosa di contrario ai buoni costumi. Gli stranieri portano parole straniere; queste producono idee nuove; e su queste si costruiscono opinioni e sentimenti il cui carattere discordante distrugge l’armonia dello stato”.
Facile —non poi così tanto— a farsi con le persone, estremamente più difficile se le “idee nuove”, o meglio “diverse” sono veicolate da un software che può essere duplicato, modificato e fatto circolare senza alcuna limitazione. Difficile non pensare alla questione TikTok e alle ragioni, reali o supposte, che hanno portato l’amministrazione USA a ordinare la sua vendita forzata.
Sebbene un impatto diretto, immediato e su vasta scala di questo genere sia improbabile, è altrettanto ragionevole pensare che nel lungo periodo idee “eterodosse” possano più facilmente infiltrarsi nel pensiero comune passando dagli schermi degli smartphone e contribuire, se non a ridefinirlo, quantomeno ad orientarlo in modo più favorevole alla Cina o, che è lo stesso, più critico rispetto ai propri governi.
D’altra parte, il softpower non si esercita soltanto con la musica, i film e il look.
Possibly Related Posts:
- Il Garante dei dati personali ha veramente “bloccato” DeepSeek?
- L’infodemia contagia anche gli Stati oltre agli utenti delle piattaforme social
- L’inconciliabile dilemma fra etica e guerra, che l’AI non può risolvere
- Chatbot troppo umani, i rischi che corriamo
- La sentenza TikTok e il futuro delle multinazionali cinesi high-tech. L’opinione di Monti