RAG (Retrieval-Augmented Generation) è una tecnica che migliora le risposte di un modello AI collegandolo a una base di dati esterna. Invece di affidarsi solo alla "memoria" del modello, il sistema prima cerca i documenti rilevanti, poi genera la risposta basandosi su quelli.
Come funziona
- Query: l'utente fa una domanda
- Retrieval: il sistema cerca documenti pertinenti nel database
- Augmentation: i documenti trovati vengono inseriti nel prompt
- Generation: il modello genera la risposta usando quei documenti come fonte
Perché serve
Un LLM "puro" sa solo ciò su cui è stato addestrato. RAG gli permette di accedere a dati aziendali privati, documenti aggiornati, knowledge base interne — senza dover ri-addestrare il modello.
Uso pratico
Chatbot aziendali che rispondono usando la documentazione interna. Assistenti legali che citano articoli specifici. Motori di ricerca AI che forniscono risposte con fonti verificabili.