OpenAI ha recentemente evoluto Codex da semplice agente cloud ad applicazione desktop general purpose in grado di supportare compiti più vasti rispetto ai limiti del codice. Con il browser integrato, capacità di esecuzione su dispositivi locali, generazione di immagini e integrazione con strumenti di terza parte, Codex sta emergendo come un agente operativo per il quotidiano, non solo per lo sviluppo software.

Le origini di Codex

Il 16 maggio 2025, OpenAI ha rilasciato la prima versione integrata di Codex all’interno dell’interfaccia di ChatGPT. L’agente era progettato per aiutare i programmatori a svolgere compiti specifici sui repository GitHub. L’implementazione iniziale seguiva da poco (un mese) la versione open-source CodexCLI, e a differenza del modello principale di OpenAI lanciato nel 2021, era incentrata esclusivamente sull’aspetto cloud.

Il rilascio seguiva di poco il ClaudeCode di Anthropic, agente simile ma molto apprezzato e in breve divenuto popolare. La natura esclusivamente cloud del primo Codex scoraggiò molti utenti, pur con la possibilità di usare il CodexCLI in locale.

Da Cloud a Desktop: l’evoluzione

Nel corso dell’anno, OpenAI ha introdotto un’applicazione desktop per MacOS e Windows. Successivamente ha annunciato supporto anche per Linux. L’app desktop consente di eseguire Codex direttamente dal proprio computer, permettendo maggiore controllo e un’esperienza più vicina a strumenti tradizionali.

Di recente OpenAI si concentra su rendere Codex un agente general purpose, in grado di svolgere non solo compiti legati al codice ma anche documentazione, analisi e compiti arbitrari. Questo ha aperto nuove opportunità, come la generazione di diagrammi, l’organizzazione della documentazione e la possibilità di automatizzare routine quotidiane.

Interfaccia e funzionalità principali

L’applicazione Codex ha un’interfaccia decisamente diversa rispetto a quella tradizionale di ChatGPT. Le conversazioni non vengono elencate cronologicamente ma organizzate per cartella, in base al compito assegnato.

Il pannello centrale mostra la conversazione, ma con interazioni estese, come modifiche apportate ai file, generazione di codice e integrazione con plugin e strumenti esterni di terza parte. Codex può lavorare sia in contesti preesistenti (es. cartelle di codice) che da zero.

Competenze e plugin

Le competenze o skills sono risorse specifiche, integrate in contesto modellistico, che espandono il vocabolario e le capacità dell’agente. Per esempio, con ASP.NET Core, l’agente può comprendere e generare codice .NET.

I plugin invece, sono risorse esterne che devono essere registrate autonomamente. Possono includere, ad esempio, API integrate di GitHub o Hugging Face, per migliorare le azioni svolte in contesto.

Rendere visibili le modifiche

Sul lato tecnico, una delle particolarità è la possibilità di utilizzare il browser integrato dell’app per visualizzare modifiche e renderizzare graficamente lo stato. Questo è particolarmente utile quando si sviluppa interfacce web o si esegue una UI design.

Una caratteristica interessante, specialmente per gli utenti MacOs, è la capacità di Codex di interagire con finestre native del sistema operativo. Ciò permette di simulare interazioni come clic, apertura di file, o manipolazione del contenuto di documenti locali.

Generazione di immagini e documentazione

Una funzionalità distintiva è il supporto a GPT-Images 2.0, utilizzato per generare grafiche, diagrammi e immagini rappresentative del codice. Un esempio concreto è il progetto Eligere (https://github.com/Unipisa/Eligere), che utilizza immagini generate da Codex per supportare la comprensione tecnica dell’architettura del software.

La documentazione diventa parte integrante del supporto fornito da Codex. Esso genera documentazione automatica, aggiornata, e schemi grafici, come diagrammi UML, di flusso o di stato, riconoscendo in tempo reale cambiamenti nel codice.

Esempi concreti di utilizzo

    • Con un file AGENTS.md, si può istruire il modello ad agire seguendo requisiti specifici, rispettando norme predefinite.
    • Si può chiedere a Codex di generare una mappa di un insieme di documenti esistenti, raggruppandoli in base al tipo di contenuto.
    • Le automazioni permettono di impostare orari per eseguire compiti periodici, ad esempio l’analisi di una cartella o la creazione di un briefing giornaliero.

Uno scenario concreto è stato il test di OpenAI sull’utilizzo di Codex per mappare articoli tecnologici scritti negli ultimi anni. L’agente ha generato una rappresentazione in formato mermaid, analizzando automaticamente il contenuto, la data di creazione e raggruppando contesti simili per argomento.

Limiti di utilizzo e costi

Sebbene Codex sia disponibile per tutti i livelli di ChatGPT, anche compreso il gratuito, l’utilizzo è soggetto a limiti di token. Questi variano in base al piano scelto, con un fattore di circa 20x tra il modello base e il piano Plus.

OpenAI ha anche introdotto un piano Pay per use con l’acquisto di API keys dedicate. Questo permette un utilizzo flessibile a chi ne necessita in maniera intensiva ma non ha bisogno di un piano dedicato.

Esecuzione di compiti arbitri e sicurezza

Per evitare esecuzioni dannose, Codex richiede esplicitamente l’approvazione per ogni comando di shell o modifica non pianificata. L’esecuzione di azioni potenzialmente pericolose (rm -rf, per esempio) richiede conferma, evitando azioni irreversibili.

Funzionalità come il click sui finestre locali o l’interazione con API esterne sono bloccate da una sandboxing, che limita l’accesso a risorse critiche e garantisce la sicurezza del sistema.

Confronto con Anthropic

Sebbene Anthropic abbia lanciato ClaudeCode e integrato <