Insegnare, ma all’intelligenza artificiale. Allenarla a dare risposte precise e accurate, sostenendo conversazioni complesse con un utilizzatore umano. Per questo lavoro c’è una figura professionale apposita, l’AI trainer: un mestiere nuovo, la cui importanza va di pari passo con il progresso incalzante dei modelli di intelligenza artificiale.
Molto richiesto in ambito aziendale, l’AI trainer lavora sulla qualità: dei dati da inserire nel modello AI, dei prompt a cui il modello deve rispondere, delle risposte fornite dalla macchina. E nel fare tutto questo l’«addestratore» dell’intelligenza artificiale può ancora far valere la propria competenza di essere umano.
Ma cosa fa di preciso e come si sta evolvendo il lavoro di questo nuovo professionista?
Lavorare sulla qualità
«L’AI trainer è una figura che deve generare dei dati di alta qualità che vadano a migliorare i modelli di AI», spiega Flavio Giobergia, ricercatore del Politecnico di Torino, membro del Centro interdipartimentale su data science e big data dell’università piemontese. «AI trainer è il nome nuovo che si dà alla precedente mansione dell’annotatore, cioè quella figura che prende dei dati, li etichetta e li utilizza per migliorare le performance dei modelli di AI».
Il mestiere dell’AI trainer così come è oggi – racconta – si è sviluppato con il progresso dei più recenti modelli di intelligenza artificiale: «In passato i dati su cui lavorava l’annotatore erano più semplici: ad esempio, c’era un’immagine e l’AI doveva riconoscere se si trattasse di una persona o di un animale. Adesso, invece, questi modelli sono più grossi e più ricchi: gli si può chiedere di raccontare una storia o spiegare un concetto nel dettaglio. Sono attività più sofisticate, con più aspetti da considerare. L’AI trainer è quindi un generatore di dati più complessi, che poi verranno utilizzati per migliorare questi modelli».
Nel concreto
Ma cosa si intende per dati di qualità? E com’è, nel concreto, il lavoro di un addestratore di AI?
«Prima il dato da inserire era più semplice, anche solo un’immagine con scritto “questo è un gatto”. Adesso invece il dato si riferisce a intere conversazioni, quindi l’AI trainer riceve delle domande e produce delle risposte anche molto dettagliate dai modelli di intelligenza artificiale. Di fatto, sostiene delle vere e proprie conversazioni con i modelli, creando degli esempi di risposta adeguata oppure, dopo aver presentato più risposte, indicando all’AI quale è la migliore».

Si prenda ad esempio un chatbot utilizzato nella vita di tutti i giorni: «A volte capita che chieda all’utente quale risposta preferisce: è un tipo di informazione che gli AI trainer utilizzano per decidere che cos'è fatto bene e che cos'è fatto male, quindi per insegnare al modello a dare risposte più piacevoli per l'essere umano – spiega Giobergia –. C’è un filone di ricerca che si chiama proprio “allineamento al feedback umano o ai valori umani”: l'AI trainer genera delle risposte che piacciono alle persone e che vengono date a questi modelli per migliorare la loro performance».
Tante competenze
Più qualità, più complessità, ma anche più competenze richieste a chi deve addestrare l’Intelligenza artificiale: «L’AI trainer crea delle risposte articolate che il modello deve imparare, ma spesso deve avere anche una conoscenza di dominio perché si trova a lavorare in un’azienda, quindi deve essere in grado di rispondere a domande che siano pertinenti per l'impresa in questione. E poi chiaramente deve avere delle conoscenze linguistiche e conoscenze del funzionamento di questi modelli: bisogna che sappia almeno che tipo di terminologia utilizzare, più tutta una serie di conoscenze che hanno alzato l'asticella sul livello che l'AI trainer deve avere rispetto alla precedente figura dell'annotatore».
Nelle aziende
Si è detto del ruolo degli AI trainer nelle aziende: «Oggi molte stanno assumendo queste figure professionali localmente, mentre fino a qualche anno fa gli annotatori venivano presi all’estero, anche in paesi più poveri: c’erano dei grossi centri di annotatori in Africa e in India, paesi dove la manodopera è spesso più economica ma non necessariamente altrettanto specializzata – racconta il ricercatore del Politecnico di Torino –. Il fatto che oggi si cerchino queste figure professionali a livello locale si riflette anche nel fatto che questi dataset e questi elenchi di conversazioni generati sono un grossissimo valore aggiunto per l'azienda. Perché se io ho accesso a tutto l'internet e i miei competitor pure, creiamo lo stesso modello. Invece avere accesso a dataset più rifiniti, più dettagliati e con risposte migliori è ciò che distingue un modello dall'altro, e quindi il grosso valore aggiunto di queste aziende».

Il valore umano
Se da un lato c’è la specializzazione, dall’altro lato c’è l’importanza della componente umana: «Questa figura è necessaria perché i modelli per essere addestrati hanno bisogno di un testo scritto da esseri umani».
Una necessità resa oggi più urgente da un fenomeno nuovo: «Su internet e sui social network sta diventando un grosso problema il fatto che molti contenuti siano generati da altri modelli: e si è osservato che modelli addestrati su un testo generato da altri modelli, dopo un po’ di generazioni, conducono a una situazione di degrado, con risposte più sterili e meno ricche – conclude Giobergia –. Ma visto che la direzione presa da internet è quella di avere sempre più dati generati da questi modelli, per mantenere un livello alto sulla qualità dei dati disponibili adesso tutte le aziende rincorrono la necessità di generare dati in casa: si tende quindi a privatizzare la generazione di dati di alta qualità».



