¿Qué es el RAG? o como crear el mejor asistente para tu empresa

Actualmente, con la IA podemos fabricar un asistente que nos ayude en multitud de tareas. Este asistente puede ser aún mucho más útil en las empresas que utilizan un gran volumen de información. Pero para crear un asistente que nos ayude a consultar nuestra base de datos necesitamos no solo un LLM (ChatGPT, Gemini, etc.)  sino también la ayuda de una tecnología llamada RAG.

El RAG o generación aumentada por recuperación, es una arquitectura que conecta un modelo de LLM con bases de datos externas al modelo. Este sistema permite que los LLM no solo se basen en su conocimiento interno, sino que también utilicen datos de una base externa para proporcionar respuestas precisas y actualizadas. No olvidemos que un LLM no es una base de datos sino un motor de razonamiento. Si a este motor o LLM lo conectamos con la base de datos idónea, el resultado es muy potente, veamos algunos ejemplos de casos reales:

1)  Agencia de Viajes

La agencia tiene cientos de folletos en PDF, itinerarios pasados, políticas de cancelación de distintos hoteles y guías de destinos dispersas. Los agentes pierden mucho tiempo buscando datos específicos para responder a los clientes.

La Solución RAG:

  • Fuente de datos: Todos los PDFs de proveedores, Excels con precios actualizados y manuales de procedimientos internos.
  • Uso real: Un cliente pregunta por WhatsApp: «¿Si cancelo mi viaje a Tailandia con 15 días de antelación, recupero el depósito?».
  • Resultado: El asistente busca en la carpeta de «Políticas 2026», encuentra el contrato específico de ese tour y responde: «Para el tour ‘Esencias de Siam’, la cancelación con menos de 20 días conlleva una penalización del 50%. Sin embargo, si tienes el seguro ‘TravelPlus’ que contrataste, podrías recuperar el total. ¿Quieres que revise tu póliza?».

2) Empresa Instaladora

El Problema: Los técnicos a menudo se encuentran con códigos de error de maquinaria que no conocen. Consultar los manuales técnicos de 500 páginas en medio de una reparación es inviable.

La Solución RAG:

  • Fuente de datos: Manuales técnicos de todas las marcas que instalan (Daikin, Mitsubishi, etc.) y un histórico de reparaciones hechas por la empresa en los últimos 5 años.
  • Uso real: El técnico le dice a la tablet: «Error E7 en unidad exterior multi-split de 2022».
  • Resultado: El asistente no solo explica qué significa el error E7 según el manual, sino que añade una nota del dueño del taller: «Ojo, en este modelo suele ser el ventilador bloqueado por suciedad. Revisa primero el conector de la placa BC, ya que en el caso del cliente ‘Gómez’ el año pasado fue eso».

3) Despacho de Abogados o Asesoría Fiscal

El Problema: Gestionar miles de sentencias, convenios colectivos y la propia base de datos de casos ganados del despacho.

La Solución RAG:

  • Fuente de datos: Jurisprudencia relevante, el BOE diario y las demandas redactadas anteriormente por el despacho.
  • Uso real: El abogado está preparando una demanda por despido improcedente y pregunta: «Busca en nuestras demandas de 2025 casos donde hayamos ganado usando el argumento de la falta de preaviso en el sector metalúrgico».
  • Resultado: El asistente redacta un borrador citando textualmente los párrafos que tuvieron éxito en casos anteriores del propio despacho, asegurando la coherencia en el estilo legal de la firma.

En la práctica, cuando un usuario hace una pregunta a un sistema RAG, ocurren dos cosas antes de que llegue la respuesta. Primero, el sistema busca en la documentación interna de la empresa los fragmentos más relevantes para esa pregunta. Segundo, le entrega esos fragmentos al modelo de IA junto con la pregunta original. El modelo responde usando esa información como contexto, no desde el vacío. El resultado es una respuesta que combina la capacidad de comprensión y redacción del modelo con el conocimiento específico y actualizado de la empresa. Y lo más importante: una respuesta que puede citarse, trazarse hasta el documento original y verificarse.

Aclaraciones:

Hay una serie de ideas que se propagan cuando leemos sobre el RAG y que desde Gana Inteligencia vemos que es necesario aclarar:

1) Datos: La calidad de las respuestas que ofrece un RAG depende de la calidad de la información o datos que contiene. Datos incompletos, desactualizados o inconsistentes llevarán a respuestas deficientes. Como se suele decir garbage in, garbage out.

2) Alucinaciones: Cuando un LLM no tiene la información específica para responder una pregunta, puede «inventar» una respuesta que suena convincente pero es incorrecta, es lo que se conoce como alucinación. Es cierto que un sistema RAG puede citar las fuentes de donde obtuvo la información, lo que permite a los usuarios verificar la veracidad de la respuesta y fomenta la confianza en el sistema, pero por desgracia, las alucinaciones o errores no desaparecen por completo.

3) Overengineering: RAG no siempre es la solución correcta, ya que es una arquitectura compleja. RAG compensa cuando el corpus o conocimiento de una empresa es grande, cambia con frecuencia o está disperso en múltiples fuentes. Sino siempre hay soluciones más fáciles y asequibles.

4) Coste de implementar RAG: Hay dos partes muy distintas: el arranque y el mantenimiento. El arranque incluye horas de desarrollo e integración, que según la complejidad pueden ir de decenas a varios centenares de horas, más la infraestructura inicial. El mantenimiento es el coste más infraestimado y el más crítico para que el sistema siga siendo útil. Como podemos ver, no es una opción económica.

Previous Article

Anthropic abre su Academia de IA con cursos gratuitos (nivel básico y pro)

Gana Inteligencia
Política de Privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Más info sobre la Política de Privacidad