RAG (Retrieval-Augmented Generation) è una tecnica che migliora le risposte di un modello AI collegandolo a una base di dati esterna. Invece di affidarsi solo alla "memoria" del modello, il sistema prima cerca i documenti rilevanti, poi genera la risposta basandosi su quelli.

Come funziona

  1. Query: l'utente fa una domanda
  2. Retrieval: il sistema cerca documenti pertinenti nel database
  3. Augmentation: i documenti trovati vengono inseriti nel prompt
  4. Generation: il modello genera la risposta usando quei documenti come fonte

Perché serve

Un LLM "puro" sa solo ciò su cui è stato addestrato. RAG gli permette di accedere a dati aziendali privati, documenti aggiornati, knowledge base interne — senza dover ri-addestrare il modello.

Uso pratico

Chatbot aziendali che rispondono usando la documentazione interna. Assistenti legali che citano articoli specifici. Motori di ricerca AI che forniscono risposte con fonti verificabili.