Un Large Language Model (LLM) è un tipo di intelligenza artificiale addestrato su miliardi di parole per comprendere, generare e manipolare il linguaggio umano.
Come funziona un LLM
Gli LLM usano una architettura chiamata Transformer, inventata da Google nel 2017. Il modello analizza le relazioni tra le parole in una frase (e tra frasi diverse) per prevedere la parola successiva più probabile.
Durante l'addestramento, il modello legge internet: libri, articoli, codice, conversazioni. Da questo impara grammatica, fatti, ragionamento e persino creatività.
Esempi di LLM
- GPT-4 (OpenAI) — alla base di ChatGPT
- Claude (Anthropic) — focalizzato su sicurezza e ragionamento
- Gemini (Google) — integrato in Google Search e Workspace
- Llama (Meta) — open source, scaricabile gratuitamente
A cosa serve nella pratica
Scrivere email, riassumere documenti, generare codice, tradurre, analizzare dati, creare contenuti. Ogni volta che usi ChatGPT o Claude, stai interagendo con un LLM.
Limitazioni
Gli LLM possono "allucinare" — inventare fatti con sicurezza. Non hanno memoria persistente tra conversazioni (a meno che non sia implementata esternamente). E il loro addestramento ha una data di taglio: non sanno cosa è successo dopo.