

Dalla Cina l'IA addestrata riducendo l'intervento umano
Si chiama DeepSeek-R1,apprende per rinforzo
C'è un ridotto intervento umano nell'addestramento di DeepSeek-R1, l'innovativo modello di Intelligenza Artificiale liberamente accessibile rilasciato all'inizio di quest'anno. A raccontarne i dettagli sulla rivista Nature sono i ricercatori che l'hanno progettato, guidati da Wenfeng Liang, di DeepSeek-AI. Le capacità di questo modello di replicare il ragionamento umano, attraverso passaggi intermedi, sono basate sul cosiddetto apprendimento per rinforzo. La tecnica permette cioè di addestrare l'IA affrontando i problemi che incontra risolvendoli passo dopo passo e migliora ogni volta grazie all'ottenimento di una ricompensa quando individua la soluzione corretta. Il tutto avviene in modo automatizzato e senza intervento umano. Un metodo che, in questa fase cruciale, elimina la necessità di intervento umano riducendo così i costi e i tempi di sviluppo. Pubblicato a gennaio 2025, DeepSeek-R1 ha creato un vero e proprio terremoto nel settore che fino a quel momento era quasi interamente dominato da OpenAI e altri pochi colossi americani. Il nuovo modello linguistico (Llm) è progettato da un'azienda cinese con risorse economiche e di calcolo molto più limitate rispetto a quelle degli analoghi americani e allo stesso tempo ha prestazioni di altissimo livello e, in alcuni aspetti, persino più avanzato. Le prime informazioni sull'architettura del nuovo modello erano state fornite dallo studio degli autori di DeepSeek inserito su ArXiv, la piattaforma che raccoglie lavori non ancora revisionati dalla comunità scientifica, ora l'articolo pubblicato su Nature contiene un maggior numero di informazioni. "Con il nostro lavoro - scrivono gli autori della ricerca - dimostriamo che le capacità di ragionamento degli Llm possono essere incentivate attraverso l'apprendimento per rinforzo puro, eliminando la necessità di usare le etichettature da parte di esseri umani".
U.Sparacello--IM