Nel cuore della trasformazione digitale, gli agenti AI non sono più solo strumenti teorici: sono entità operative che si muovono continuamente nel paesaggio aziendale, influenzando operazioni, costi e governance. Ma come funzionano davvero? Quali modelli scegliere? E quanto ci costano realmente? Queste domande, se gestite male, possono far fallire interi progetti sin da prima di un reale inizio.
Che cos'è davvero un agente AI
Un singolo agente AI non è un semplice chatbot evoluto. Si tratta di un'entità che interagisce col mondo seguendo un ciclo operativo continuo: percezione, decisione, azione ed osservazione. Questo loop non è mai identico, e ogni iterazione è cognitivamente distinta da quella precedente. L'agente non si limita ad eseguire un prompt: percorre passi logici, analizza contesti, e agisce in modo autonomo, aprendo la strada a decisioni complesse.
Il loop ha quattro fasi fondamentali:
- Percezione: l’agente raccoglie informazioni dall’ambiente esterno, spesso tramite API, database o file.
- Decisione: il modello analizza i dati e sceglie l’azione più appropriata.
- Azione: il risultato della decisione viene eseguito.
- Osservazione: l’agente legge i risultati e decide cosa fare prossimamente.
Costi nascosti del ciclo d'operazione
Il ciclo operativo di un agente non è solo un processo intellettuale: incide direttamente sui costi. Ogni strumento chiamato (un tool call) implica latenza e costo in termini economici. Un agente che effettua cinque chiamate API dove bastano due, raddoppia in media i tempi di risposta e moltiplica per tre i costi di inferenza.
Benché sembri lineare, il loop agente può essere complesso. Per esempio, la ricerca dello Stevens Institute Of Technology mostra che un reasoning loop che effettua dieci cicli completi consuma fino a cinquanta volte di più i token rispetto a una chiamata unica.
Questo richiama l’importanza di un tetto massimo al numero di iterazioni del loop: senza di esso, un agente può andare in loop infinito, bruciando risorse token fino a quando non interviene un intervento umano.
Scelta del modello AI: i tre bivi fondamentali
Un momento cruciale progettuale è la scelta del modello linguistico sottostante su cui implementare l’agente. Ci sono principalmente tre opzioni disponibili, ognuna con caratteristiche tecniche, strategiche, di costi e conformità distintive:
1. Modelli proprietari
I modelli proprietari, come Claude Opus, GPT-5.5 o Gemini 3.1 Pro, sono spesso i top performer in termini di qualità. Offrono una governance più semplice e integrata con gli strumenti del fornitore. I loro costi però sono notevolmente elevati, con tariffe che vanno da 5 dollari per un milione di token in input a 25 dollari per lo stesso milione in output.
Essi sono adatti quando si ha bisogno di una soluzione ad alta performance e si può sopportare un costo maggiore, in particolare in contesti governativi o aziendali critici dove la conformità AI Act e l’alto livello tecnico sono prioritari.
2. Modelli open source
I modelli open source, come Llama 4, Mistral Large 3, DeepSeek o Qwen, offrono una soluzione più flessibile e controllabile per chi non vuole dipendere da fornitori esterni per i propri dati. Consentono un controllo totale sui prompt, un deployment su infrastruttura privata e costi significativamente ridotti per chiamata token.
Pur non sendo tecnici di punta come i modelli proprietari, in molti casi (in particolare nei task basati su strutturazione, chiamate API e ragionamento) oggi sono paragonabili in termini performanti.
3. Modelli sovrani
I modelli sovrani rappresentano una sottocategoria di modelli open source con una missione esplicita: fornire un ambiente digitale sovrano e conforme, con addestramento su dati locali. In Europa si sta diffondendo una crescente attenzione alla sovranità digitale, con iniziative come OpenEuroLLM e Mistral leader in questo settore.
In Italia, il modello Minerva, sviluppato da Sapienza NLP nell’ambito di FAIR, è un progetto di rilievo nazionale. Costruito dal zero e addestrato su dati locali, ha 7 miliardi di parametri e 1,5 trilioni di parole di contesto. L'autore del modello, Roberto Navigli, precisa chiaramente la specificità: «La caratteristica distintiva dei modelli Minerva è il fatto di essere stati costruiti e addestrati da zero usando testi ad accesso aperto, al contrario dei modelli italiani esistenti ad oggi, che sono basati sull’adattamento di modelli come LLaMA e Mistral, i cui dati di addestramento sono tuttora sconosciuti».
In parallelo con Minerva, si stanno sviluppando modelli verticali come il Velvet (Almawave per sanità e PA), Modello Italia di iGenius per la pubblica amministrazione e modelli specifici per settori specializzati, per traduzione, finanza pubblica e privata.
Il ruolo critico del contesto e della governance
Ogni decisione che un agente AI prende dipende in maniera cruciale dal system prompt: l’istruzione iniziale che lo guida. Chiaramente definita, tale istruzione diventa il document of role, ossia il ruolo che l’agente si dovrà interpretare durante l’esecuzione.
Anche il contesto, raccolto durante la percezione, influenza le decisioni. Un’assenza di informazioni chiare può rendere il loop operativo inutile o errato, costringendo il ciclo a richiamare ulteriormente dati esterni, aumentando latenze e costi.
Per chi lavora in settori regolati (ad esempio sanità, finanza o settori governativi), la sovranità del modello e della catena dei dati diventa una priorità. I dati devono rimanere in giurisdizione italiana, e la traccia auditabile e riservata devono essere garantite.
Quali domande strategiche da affrontare prima di procedere?
Quali sono i criteri decisionali per scegliere un modello?
- Che livello di controllo voglio avere sui dati?
- Quali sono i costi di inferenza che posso sopportare?
