La sfida globale tra ChatGpt e DeepSeek

Negli ultimi anni, i modelli di linguaggio di grandi dimensioni (Large Language Models, LLM) sono diventati una pietra miliare della tecnologia. La rivoluzione è iniziata nel novembre 2022, quando OpenAI, azienda con sede nella Silicon Valley, ha lanciato ChatGPT, un chatbot in grado di comprendere e generare testo in modo fluido e naturale. Questo traguardo ha catturato l'attenzione globale, ridefinendo il potenziale d'uso di tali modelli sia in ambito personale che professionale.
Successivamente, altre aziende tecnologiche hanno introdotto i propri LLM, come Llama (Meta), Claude (Anthropic) e Gemini (Google DeepMind). Tuttavia, è stato solo recentemente che l'egemonia di ChatGPT è stata realmente messa in discussione, con il rilascio di DeepSeek-R1, sviluppato dall'omonima azienda cinese. DeepSeek-R1 si distingue per le sue capacità logico-matematiche, competendo direttamente con ChatGPT e rappresentando un approccio alternativo sia in termini di prestazioni che di filosofia sottostante.
deepseek's r1 is an impressive model, particularly around what they're able to deliver for the price.
— Sam Altman (@sama) January 28, 2025
we will obviously deliver much better models and also it's legit invigorating to have a new competitor! we will pull up some releases.
OpenAI ha inizialmente adottato un approccio open-source, passando poi a un modello più chiuso per proteggere i suoi sistemi avanzati, come ChatGPT-4. DeepSeek, al contrario, promuove una filosofia open-source, rilasciando anche modelli più piccoli accessibili alla comunità scientifica senza la necessità di hardware avanzato. Questa strategia mira a favorire la collaborazione internazionale, un aspetto cruciale in un mondo sempre più interconnesso.
Nonostante ciò, il modello cinese suscita preoccupazioni in merito alla trasparenza nella selezione dei dati e ai potenziali bias culturali. Ad esempio, alla domanda sulle proteste di Piazza Tiananmen del 1989, DeepSeek-R1 risponde: «Sorry, that’s beyond my current scope. Let’s talk about something else» (Mi dispiace, questo va oltre le mie attuali competenze. Parliamo di qualcos'altro). Questo esempio di censura solleva dubbi sulla neutralità del modello e sulla sua applicabilità in contesti globali.
Anche ChatGPT non è esente da critiche. Il modello è stato addestrato su un ampio corpus di dati non completamente trasparente, il che può portare a risposte influenzate da bias culturali e politici.
Per quanto riguarda l’addestramento, ChatGPT utilizza un approccio basato su pre-training su enormi dataset, seguito da un’ottimizzazione tramite Reinforcement Learning from Human Feedback (RLHF), che gli consente di interagire in modo fluido con gli utenti. DeepSeek, invece, combina l’apprendimento per rinforzo con la knowledge distillation, una tecnica che riduce le risorse necessarie per l'addestramento, permettendo di ottenere modelli più piccoli ma altamente performanti.
OpenAI beneficia di infrastrutture avanzate, come i supercomputer Azure di Microsoft, mentre DeepSeek punta a ottimizzare l’efficienza per rendere la tecnologia accessibile a una platea più ampia. In conclusione, ChatGPT e DeepSeek incarnano due visioni divergenti dell'intelligenza artificiale. ChatGPT si distingue per la sua versatilità e orientamento commerciale, mentre DeepSeek dimostra come l’open-source possa promuovere innovazione e ridurre i costi. Tuttavia, la censura tematica evidenzia i limiti attuali di DeepSeek.
Il futuro dell’intelligenza artificiale potrebbe risiedere in un equilibrio tra le due filosofie: apertura e controllo, creatività e responsabilità. L'innovazione continuerà a essere guidata da questi giganti, che non solo competono ma contribuiscono a spingere i confini del possibile.
* Ricercatori facoltà Scienze matematiche, fisiche e naturali - Università Cattolica
Riproduzione riservata © Giornale di Brescia
Iscriviti al canale WhatsApp del GdB e resta aggiornato
@Tecnologia & Ambiente
Il futuro è già qui: tutto quello che c’è da sapere su Tecnologia e Ambiente.
