Governare l’AI agentica nelle imprese italiane

Andrea Viliotti
3 apr
Tempo di lettura: 13 min

Valore, rischi, responsabilità e costi organizzativi alla luce del corpus GDE e del quadro UE–Italia

White paper analitico • Freeze fonti esterne: 3 aprile 2026 (Europe/Rome)

L’AI agentica può accelerare ricerca documentale, primo drafting, instradamento operativo e coordinamento di task multi-step. Ma quando un sistema combina planner, executor, tool use e memoria, il vero punto non è più la qualità del singolo output: è la qualità del governo della catena che produce quell’output. Questo white paper traduce in chiave manageriale un corpus di paper concettuali e un caso pubblico di collaborazione uomo–LLM. La tesi è netta: conviene partire, ma solo dove l’azienda sa documentare chi decide, quali fonti l’agente può usare, dove il flusso si ferma e come l’errore viene ricostruito, contestato e corretto.

Nota di trasparenza autoriale. Andrea Viliotti è l’autore umano responsabile di questo white paper. “Framework GDE” designa il nome pubblico del workflow/progetto usato in questa elaborazione e non un secondo autore umano indipendente. Una parte del corpus citato è riconducibile allo stesso progetto pubblico: per questo i documenti vengono trattati come corpus sorgente e companion materials, non come validazione terza indipendente.

Tesi

1. L’AI agentica non è un copilota potenziato. È una catena di pianificazione, memoria, tool use e handoff che sposta il perimetro della responsabilità.

2. Il valore nasce su compiti delimitati e reversibili. Dove il lavoro è verificabile e il rollback è possibile, l’automazione intelligente può comprimere tempi e lavoro cognitivo standardizzabile.

3. Il rischio cresce quando il sistema tocca persone, diritti o processi critici. HR, compliance, credito, sicurezza, procurement strategico e decisioni verso l’esterno richiedono soglie di controllo molto più alte.

4. Nelle imprese italiane il problema decisivo è l’habitat. Ruoli, logging, procurement, cyber, formazione, DPO, CISO, auditors, vendor e assicuratori contano quanto il modello.

5. Il board deve chiedere prove, non solo demo. Perimetro, owner umano, fonti consentite, log recuperabili e sedi di contestazione devono essere espliciti prima dell’estensione dei permessi.

1. Che cosa stiamo leggendo

Il corpus alla base di questo white paper non è un campione di deployment aziendali italiani. È composto da dieci documenti con peso diverso: due paper concettuali su habitat cognitivo ed economia del giudizio; due testi su collaborazione uomo–LLM e costi della verifica; sei documenti del ramo fisico del progetto GDE, utili soprattutto come case object sul metodo, sulla dichiarazione dei limiti e sulla separazione fra claim centrali e claim derivati.

Per il management, la conseguenza è semplice ma cruciale: le lezioni enterprise sono una traduzione controllata, non una prova empirica diretta sulle imprese italiane. Questo non indebolisce il documento; lo rende più onesto. Il valore del corpus non sta nel dire “questo funziona già nelle aziende italiane”, ma nel mostrare dove si spostano i costi della verifica, come cresce l’opacità della provenienza e perché la contestabilità diventa il criterio più importante quando l’AI smette di essere solo un assistente conversazionale.

Grafico osservato costruito sul corpus citato nel white paper: 2 documenti concettuali di base, 2 testi sul caso uomo–LLM e sui costi della verifica, 6 documenti del ramo fisico richiamati come case object metodologico.

Registro essenziale del corpus citato nel MAIN

Documento	Perché conta qui	Link	Status di indipendenza
Diritti cognitivi come diritti di habitat nell’era dell’IA. Scuole, archivi, biblioteche, musei e territori come infrastrutture delle comunità educanti	Fornisce la nozione di habitat cognitivo: il problema non è solo l’accesso all’AI, ma la tenuta delle condizioni che rendono possibile giudicare, verificare e ricordare.	DOI / link https://doi.org/10.5281/zenodo.18925752	Precedente lavoro del progetto; non validazione esterna.
L’economia del giudizio nelle società mediate dall’IA. Diritti cognitivi come diritti di habitat tra autorità interpretativa, costi della verifica e istituzioni del giudizio	Introduce i tre layer e i sei assi che qui vengono tradotti in linguaggio business: tempo di interpretazione, visibilità, provenienza, capability, contestabilità, pluralismo istituzionale.	DOI / link https://doi.org/10.5281/zenodo.19164007	Precedente lavoro del progetto; non validazione esterna.
AI-Assisted Theoretical-Physics Programme Construction by a Non-Physicist. A falsifiable analytic case study from the GDE emergent-gravity branch	Caso pubblico più utile per capire che cosa cambia quando la produzione di output complessi è rapida ma la provenienza resta solo parzialmente ricostruibile.	DOI / link https://doi.org/10.5281/zenodo.19373683	Companion manuscript dello stesso progetto.
Who Pays the Cost of Verification? The Economy of Judgment in AI-Mediated Scientific Production	Spinge la lezione dal caso alla governance: la produttività può salire mentre il costo della verifica viene scaricato a valle su comunità, archivi e istituzioni del giudizio.	DOI / link https://doi.org/10.5281/zenodo.19387902	Manoscritto locale del progetto; non validazione esterna.

I titoli completi del ramo fisico richiamato come case object e le fonti normative ufficiali sono riportati nelle appendici.

2. La tesi operativa: l’AI agentica sposta il costo del giudizio

Nel lessico operativo di questo documento, “AI agentica” indica sistemi multi-agent o planner–executor che usano strumenti, memoria e handoff tra componenti per completare sequenze di lavoro. Questo passaggio è decisivo: la valutazione non riguarda più soltanto l’accuratezza di una risposta, ma la governabilità di una catena. È qui che l’AI diventa tema di board e non solo di innovazione o IT.

Il corpus mostra con chiarezza tre cose. Primo: l’AI può comprimere lavoro cognitivo standardizzabile molto più velocemente di quanto comprima il lavoro di verifica. Secondo: quando la provenienza del processo non è ricostruibile in modo pieno, l’output può restare utile e persino brillante, ma non per questo già affidabile. Terzo: l’autonomia apparente dell’agente nasconde spesso un deficit distribuito di capacità: chi progetta il flusso, chi usa il tool, chi revisiona il testo e chi approva l’esito non coincidono, e nessuno dei quattro, da solo, possiede tutta la competenza necessaria per certificare il risultato finale.

Per l’impresa italiana la lezione è netta. Il problema non è solo l’errore puntuale, ma la sequenza opaca: chi ha aperto la pratica, quali fonti erano abilitate, quale tool è stato chiamato, che cosa la memoria ha trascinato da interazioni precedenti, chi ha concesso il via libera e dove il sistema poteva essere fermato. Più la catena diventa lunga, più il presidio deve spostarsi da “prompting” a architettura del giudizio.

Diagramma concettuale. La catena minima di governo non serve a spiegare il modello in astratto, ma a rendere visibili i punti in cui l’impresa deve decidere permessi, fonti, stop umano e prova documentale.

3. Dove crea valore e dove non va lasciata sola

L’AI agentica crea valore soprattutto in quattro famiglie di compiti. La prima è la raccolta guidata e la sintesi di materiali interni autorizzati: procedure, knowledge base, manuali, contratti standard, cataloghi, ticket storici. La seconda è il drafting di prime versioni: memo, note interne, verbali, checklist, procedure, pre-analisi. La terza è il routing operativo: classificare, assegnare, completare dati mancanti, aprire un flusso, chiedere conferme. La quarta è il monitoraggio di eccezioni entro un perimetro stretto.

In tutte queste aree il valore non viene dalla “magia” del modello, ma da una combinazione più prosaica e più utile: compressione dei tempi, maggiore uniformità delle prime lavorazioni, riduzione dei passaggi a basso valore e recupero di attenzione umana per i casi non standard. Per questo i casi d’uso migliori hanno quasi sempre quattro proprietà: perimetro definito, fonti note, esito reversibile e revisione umana economicamente sostenibile.

Al contrario, l’AI agentica non dovrebbe chiudere in autonomia flussi che toccano diritti, reputazione, sicurezza, lavoro o relazioni esterne senza un presidio forte. La domanda corretta non è “il sistema è abbastanza bravo?”, ma “il costo della prova resta sopportabile quando il sistema sbaglia?”. Dove la risposta è no, l’autonomia non va aumentata: va ristretta.

Matrice di uso consigliato per classi di compito

Classe di compito	Potenziale di valore	Onere di verifica	Modalità raccomandata
Ricerca interna e primo drafting su fonti autorizzate	Alto	Medio	Agentico solo con revisione finale umana e fonti whitelisted
Knowledge operations e instradamento di ticket o pratiche	Alto	Medio–alto	Pilot controllato con log, rollback e soglie di eccezione
Workflow interfunzionali con ERP/CRM/tool esterni	Medio–alto	Alto	Permessi progressivi; review umana sui passaggi irreversibili
HR, performance, pricing individuale, credito, decisioni verso l’esterno	Selettivo	Molto alto	Human-led; autonomia solo ancillare e mai di chiusura
Sicurezza, compliance, incident response e funzioni safety-critical	Selettivo	Molto alto	No autonomia piena; forte segregazione di ruoli e audit trail

4. Habitat Italia 360: chi deve poter vedere la catena

In Italia il tema dell’habitat pesa più che altrove non perché esista una “eccezione italiana” in senso astratto, ma perché molte imprese operano con strutture snelle, forte dipendenza da fornitori esterni, filiere distribuite e funzioni di controllo non sempre ridondanti. In questo contesto l’AI agentica tende a far emergere una domanda scomoda: chi vede davvero l’intera catena e chi è in grado di fermarla?

L’habitat non coincide con l’IT. Coincide con il sistema di osservatori che rende un flusso aziendale governabile: board, process owner, legale, DPO, CISO, HR, system integrator, vendor, auditor, assicuratore, cliente, autorità. Se uno di questi attori entra tardi o resta invisibile, il problema non è solo di compliance: diventa un problema di contestabilità e di qualità della decisione.

Attore / cluster	Che cosa deve restare visibile	Rischio se resta invisibile
Board / CEO / Direzione generale	Perché il caso d’uso esiste, quali rischi accetta, dove si ferma il sistema	Ambiguità strategica, delega implicita, assenza di owner
Process owner / Operations / Procurement	Fonti consentite, eccezioni, SLA, rollback, casi non standard	Errore ripetuto, rework, blocchi operativi
IT / Data / Innovation	Permessi, integrazioni, segregazione, logging, identità e accessi	Escalation di permessi, dipendenza vendor, perdita di tracciabilità
Legal / Compliance / DPO / CISO	Basi giuridiche, limiti d’uso, sicurezza, audit trail, data lineage	Violazioni, contenzioso, impossibilità di prova
HR / L&D / Lavoratori	Nuovi ruoli, formazione per ruolo, criteri di supervisione, impatto sul lavoro	Resistenza, uso improprio, under-review o over-reliance
Vendor / Model provider / System integrator	Responsabilità contrattuali, log disponibili, supporto agli audit, gestione incidenti	Black box contrattuale, clausole deboli, scarico del rischio
Clienti / Partner / Auditor / Assicuratori / Autorità	Trasparenza sufficiente, sedi di challenge, evidenza dei controlli	Danno reputazionale, contestazioni non gestibili, aumento del premio di rischio

5. Costi qualitativi: dove si concentra lo sforzo

I costi dell’AI agentica non sono soltanto tecnici. Si distribuiscono su tre piani. I costi implementativi riguardano integrazioni, identità, accessi, data governance, logging e test. I costi organizzativi riguardano ruoli, escalation, nuovi confini decisionali, auditabilità e procurement. I costi di formazione riguardano AI literacy, capacità di revisione, uso corretto dei tool e comprensione dei limiti del sistema.

La tabella seguente usa solo ordini qualitativi. Non misura la spesa assoluta, ma lo sforzo di governo richiesto. Una microimpresa può sostenere una spesa totale inferiore a una grande impresa, ma subire un costo relativo più alto perché ha meno funzioni separate, meno ridondanza e meno persone in grado di fare review specialistica.

Taglia d’impresa	Costi implementativi	Costi organizzativi	Costi formativi	Lettura manageriale
Micro impresa	Medio	Alto	Medio–alto	La criticità non è la complessità tecnica in sé, ma la scarsità di ruoli separati e la dipendenza dal vendor.
PMI	Medio	Medio	Medio	Buona area di partenza per use case circoscritti; diventa fragile quando mancano logging, policy e ownership chiara.
Mid-cap	Medio–alto	Alto	Alto	La sfida cresce con l’integrazione tra funzioni, sistemi e sedi; servono governance e audit trail più strutturati.
Grande impresa	Alto	Alto	Alto	La capacità di investimento aiuta, ma aumenta il rischio di propagazione su filiere, dati, diritti e funzioni critiche.

6. Quadro UE e Italia: che cosa un board deve assumere adesso

Il quadro regolatorio europeo non vieta l’AI agentica in quanto tale; la inquadra in base al rischio e al contesto d’uso. Per un board questo significa una cosa molto concreta: non basta dire “stiamo usando un modello generale”. Bisogna chiedersi quale funzione aziendale viene toccata, quali diritti o interessi possono essere incisi, che cosa va documentato e chi resta il deployer responsabile dell’uso.

Al momento del freeze esterno di questo white paper, i divieti e gli obblighi di AI literacy sono già applicabili; le regole di governance e gli obblighi per i modelli GPAI sono anch’essi già in applicazione; la piena applicazione generale dell’AI Act resta fissata al 2 agosto 2026, mentre per i sistemi ad alto rischio incorporati in prodotti regolati vale un periodo più lungo fino al 2 agosto 2027. La Commissione ha proposto nel novembre 2025 un aggiustamento di calendario per una parte del regime high-risk, ma la proposta è ancora in discussione: per il board, oggi, non è prudente pianificare come se il rinvio fosse già acquisito.

Timeline osservata su fonti ufficiali UE e italiane. La proposta di Digital Omnibus richiede cautela: ai fini di governo aziendale il riferimento resta il calendario oggi vigente.

Sul lato italiano, la legge 23 settembre 2025, n. 132 ha introdotto il quadro nazionale in materia di intelligenza artificiale e ha designato AgID e ACN come Autorità nazionali per l’IA, fermi i ruoli di vigilanza di mercato di Banca d’Italia, CONSOB e IVASS nei rispettivi settori. In parallelo, la normativa NIS è in vigore dal 16 ottobre 2024 e rende ancora più evidente che, quando l’AI agentica entra in processi digitali critici, la questione cyber non è un allegato: è parte della governance del caso d’uso.

Come cornice di principio restano rilevanti la Convenzione quadro del Consiglio d’Europa sull’IA e la Raccomandazione UNESCO sull’etica dell’intelligenza artificiale. Il loro valore, per l’impresa, non è offrire una check-list unica, ma fissare un orientamento costante: dignità, supervisione, trasparenza, accountability, non discriminazione, diritto alla contestazione e qualità istituzionale dell’ambiente in cui il sistema viene usato.

7. Una regola di decisione pubblicabile per il board

Se si prende sul serio il corpus, la regola di decisione per il board è più semplice di quanto sembri. Primo: partire da compiti delimitati, reversibili e con fonti autorizzate. Secondo: vietare chiusure autonome su processi che toccano persone, sicurezza, diritti o relazioni esterne senza una review qualificata. Terzo: trattare logging, provenance e contestabilità come investimento produttivo, non come burocrazia posticcia.

Questo sposta anche il procurement. Un agente “potente” ma opaco è meno utile di un agente più sobrio che permette recupero dei log, controllo sui permessi, gestione dei confini e prova del processo. Il vendor non può essere l’unico luogo in cui la spiegazione del flusso resta possibile. Se succede, il costo di verifica viene semplicemente scaricato sull’azienda.

Piano 30/60/90 per un primo ciclo di adozione controllata

Timebox	Priorità	Owner esplicito	Evidenze / KPI da vedere
30 giorni	Inventario dei casi d’uso; classificazione in perimetri ammessi / ammessi con controllo / non delegabili	CEO o COO con Legal e CIO/CISO	Lista casi d’uso; owner nominato; fonti autorizzate; criteri di stop
60 giorni	Disegno dei pilot: permessi, log, escalation, rollback, clausole vendor, AI literacy per ruolo	Process owner + CIO/CISO + DPO/Legal + HR/L&D	Percentuale di flussi con log recuperabile; ruoli formati; eccezioni instradate
90 giorni	Board pack di governo: reporting periodico, incident review, audit trail, decisioni su estensione o blocco	CEO / comitato rischi / internal audit	Numero di casi con review umana finale; incidenti e near miss; stato contratti e controlli

La lezione più utile del corpus GDE, tradotta senza overclaim, è questa: l’AI agentica non va giudicata solo per quello che produce, ma per il tipo di giudizio che redistribuisce. Può aumentare produttività e coordinamento, ma sposta a valle i costi della verifica, della provenienza e della contestazione. Per un’impresa italiana, quindi, la domanda non è se adottarla in assoluto, ma in quali flussi convenga autorizzarla, con quali confini, con quali log e con quale punto di arresto umano. Un white paper serio non promette autonomia in astratto. Chiede un habitat capace di governarla.

Appendice A — Titoli completi e link del corpus richiamato

Le appendici che seguono servono a tenere insieme tre esigenze: dare al lettore i titoli completi e i link dei documenti citati; rendere esplicito il confine fra corpus di progetto e validazione esterna; congelare il layer normativo e dichiarare i principali limiti inferenziali del pezzo.

A1. Documenti citati direttamente nel MAIN

ID	Titolo completo	Ruolo nel pezzo	Link	Nota
A1	Diritti cognitivi come diritti di habitat nell’era dell’IA: Scuole, archivi, biblioteche, musei e territori come infrastrutture delle comunità educanti	Paper concettuale di base sul concetto di habitat cognitivo	DOI / linkhttps://doi.org/10.5281/zenodo.18925752	Precedente lavoro d’autore; non validazione esterna
A2	L’economia del giudizio nelle società mediate dall’IA: Diritti cognitivi come diritti di habitat tra autorità interpretativa, costi della verifica e istituzioni del giudizio	Paper concettuale di base sui tre layer e i sei assi	DOI / linkhttps://doi.org/10.5281/zenodo.19164007	Precedente lavoro d’autore; non validazione esterna
A3	AI-Assisted Theoretical-Physics Programme Construction by a Non-Physicist: A falsifiable analytic case study from the GDE emergent-gravity branch	Caso pubblico uomo–LLM usato come caso analitico, non forense	DOI / linkhttps://doi.org/10.5281/zenodo.19373683	Companion manuscript dello stesso progetto
A4	Who Pays the Cost of Verification? The Economy of Judgment in AI-Mediated Scientific Production	Manoscritto di ponte sui costi della verifica in AI-mediated science	DOI / link https://doi.org/10.5281/zenodo.19387902	Manoscritto locale del progetto; non validazione esterna

A2. Ramo fisico richiamato come case object metodologico

ID	Titolo completo	Link / DOI
B1	Local Strong Hyperbolicity in a Patched Single-Medium Effective Theory for Emergent Gravity	DOI / linkhttps://doi.org/10.5281/zenodo.19319073
B2	The Einstein Window in a Patched Single-Medium Effective Theory for Emergent Gravity: Reduction theorem, gravitational-wave corollary, and confirmatory protocol	DOI / linkhttps://doi.org/10.5281/zenodo.19320413
B3	From a Local Quantum Medium to a Patched Effective Theory: RG closure and an explicit hedgehog defect in emergent gravity	DOI / linkhttps://doi.org/10.5281/zenodo.19320527
B4	The Deep Acceleration Scale in a Single-Medium Emergent Gravity: ξ = 1.38 ± 0.11 from SPARC, Planck, and cross-habitat constraints	DOI / link https://doi.org/10.5281/zenodo.19348070
B5	Per-galaxy RAR residuals in a Single-Medium Emergent Gravity: Testing the non-equilibrium prediction against the external field effect on SPARC	DOI / link https://doi.org/10.5281/zenodo.19353740
B6	A Single Quantum Medium as the Source of Gravity, Matter, and Cosmic Acceleration: A comparative foundations assessment of novelty, competitive positioning, and distinguishable predictions	DOI / link https://doi.org/10.5281/zenodo.19373599

Appendice B — Fonti normative ufficiali (freeze esterno 3 aprile 2026)

Le fonti di questa appendice servono a distinguere il layer normativo attuale dal corpus di progetto. Sono tutte istituzionali o ufficiali.

ID	Fonte ufficiale	Link	Uso nel white paper
N1	Commissione europea, AI Act — regulatory framework page	Linkhttps://digital-strategy.ec.europa.eu/en/policies/regulatory-framework-ai	Timeline generale dell’AI Act
N2	Commissione europea, AI Literacy — Questions & Answers	Linkhttps://digital-strategy.ec.europa.eu/en/faqs/ai-literacy-questions-answers	Obbligo di AI literacy e finestra di enforcement
N3	Commissione europea, Navigating the AI Act / Digital Omnibus status	Linkhttps://digital-strategy.ec.europa.eu/en/faqs/navigating-ai-act	Stato corrente delle proposte di semplificazione e del calendario
N4	Gazzetta Ufficiale, Legge 23 settembre 2025, n. 132	Linkhttps://www.gazzettaufficiale.it/eli/id/2025/09/25/25G00143/sg	Quadro nazionale italiano sull’IA
N5	ACN, quadro NIS	Linkhttps://www.acn.gov.it/portale/nis	Rilevanza cyber e ruolo dell’ACN
N6	Council of Europe, Framework Convention on Artificial Intelligence	Linkhttps://rm.coe.int/1680afae3c	Cornice di principi su diritti, democrazia e rule of law
N7	UNESCO, Recommendation on the Ethics of Artificial Intelligence	Linkhttps://www.unesco.org/en/artificial-intelligence/recommendation-ethics	Cornice etica internazionale

Appendice C — Audit, disclosure e limiti

Questa appendice concentra il layer di trasparenza per evitare che invada il MAIN. È il luogo in cui il lettore trova disclosure, limiti di generalizzazione e statuto dei claim.

C1. Statuto di alcuni claim load-bearing

Claim	Statuto	Nota audit
Il corpus non è uno studio campionario sulle imprese italiane	Diretto dal corpus	Il white paper usa una traduzione manageriale, non una generalizzazione empirica automatica
L’AI agentica sposta i costi verso verifica, provenienza e contestabilità	Diretto + traduzione enterprise	È la tesi più portabile dei paper su habitat cognitivo, economia del giudizio e caso uomo–LLM
Il valore è più alto in compiti delimitati, reversibili e verificabili	Inferenza enterprise controllata	È una regola di governance derivata, non una misura statistica del mercato italiano
L’obbligo di AI literacy è già applicabile	Fonte normativa attuale	Dipende dal freeze esterno del 3 aprile 2026
AgID e ACN sono le Autorità nazionali italiane per l’IA	Fonte normativa attuale	La legge italiana tiene fermi anche i ruoli di vigilanza di Banca d’Italia, CONSOB e IVASS

C2. Disclosure autoriale e collisione byline∩fonti

La byline del deliverable resta quella richiesta dal progetto: “Andrea Viliotti e Framework GDE”. Ai fini editoriali e di accountability, Andrea Viliotti va però letto come unico autore umano responsabile; Framework GDE designa il workflow/progetto pubblico utilizzato in questa elaborazione. Poiché una parte del corpus sorgente è attribuita agli stessi nomi, i documenti vengono trattati come corpus di progetto e companion materials, non come validazione esterna indipendente.

C3. Limiti dichiarati

• Questo white paper non misura ROI, payback o riduzioni di costo monetarie: i costi sono espressi solo in forma qualitativa/ordinale.

• Il corpus non offre un campione indipendente di deployment aziendali italiani; le lezioni enterprise sono inferenze controllate.

• Il caso uomo–LLM è trattato in modalità analytic, not forensic: non sono disponibili session logs completi, model-specific task ledgers o bracci controfattuali congelati.

• Una parte del corpus citato è riconducibile agli stessi nomi della byline: questo conflitto è dichiarato e gestito, non eliminato.

• Le note normative hanno finalità informative e di orientamento manageriale; non sostituiscono consulenza legale