En este artículo
- 1. Por qué la IA genérica no sirve para contratación pública
- 2. Qué es RAG en términos prácticos
- 3. La arquitectura RAG en cuatro pasos
- 4. Por qué RAG es seguro para administraciones
- 5. Cómo se prepara un RAG con el histórico del ayuntamiento
- 6. Caso práctico: redactar un PPT con RAG vs ChatGPT puro
- 7. Reducción de alucinaciones gracias a las fuentes citadas
- 8. Cumplimiento normativo: ENS, RGPD y Ley 40/2015
- 9. Limitaciones reales del RAG
- 10. Cómo evaluar si tu organismo está listo
- 11. Preguntas frecuentes
1. Por qué la IA genérica no sirve para contratación pública
Un modelo de lenguaje generalista como ChatGPT, Gemini o Claude en su versión pública conoce la LCSP 9/2017 porque formaba parte de sus datos de entrenamiento, pero no conoce los pliegos aprobados por tu ayuntamiento en los últimos cinco años, ni las observaciones del interventor sobre el último contrato de servicios, ni la plantilla interna de criterios de adjudicación que usa tu unidad. Y tampoco puede citar fuentes verificables cuando afirma algo.
El resultado es que el técnico recibe un texto correcto en apariencia pero plagado de formulaciones genéricas, referencias normativas a veces inventadas y cero trazabilidad. Cualquier responsable de contratación con experiencia sabe que eso no se puede firmar. El problema no es la calidad del modelo: es que la arquitectura es la equivocada.
Riesgo habitual: al pegar texto de un pliego en una herramienta pública como ChatGPT, ese contenido puede ser usado, según la versión del servicio, para mejorar modelos futuros. En documentos que todavía no son públicos (borradores, memorias internas, informes del interventor) esto es incompatible con el deber de confidencialidad del personal al servicio de la administración.
2. Qué es RAG en términos prácticos
RAG significa Retrieval-Augmented Generation, o generación aumentada por recuperación. En lenguaje llano: antes de responder, el sistema busca en una biblioteca de documentos tuyos los fragmentos más relevantes y solo entonces pide al modelo de lenguaje que redacte una respuesta apoyándose en esos fragmentos.
La diferencia es equivalente a la que hay entre pedir a un letrado que redacte un informe de memoria o pedirle que lo redacte con el expediente completo encima de la mesa. El letrado es el mismo. Su resultado no.
Idea clave: en un RAG, el conocimiento específico del organismo no está dentro del modelo de lenguaje. Está en una base documental separada que se consulta en cada petición. Eso significa que el modelo no tiene que ser reentrenado cada vez que se aprueba un nuevo pliego; basta con indexarlo.
3. La arquitectura RAG en cuatro pasos
Un sistema RAG aplicado a contratación pública se sostiene sobre cuatro fases. Entenderlas ayuda al responsable de contratación a formular las preguntas correctas al proveedor.
Indexación: los documentos del organismo (pliegos, memorias, PCAP, PPT, resoluciones, informes de necesidad) se parten en fragmentos y se convierten en vectores numéricos mediante un modelo de embeddings. Estos vectores se guardan en una base vectorial.
Recuperación: cuando el técnico formula una consulta, el sistema la convierte también en un vector y busca en la base los fragmentos más similares. Recupera típicamente entre cinco y veinte fragmentos.
Aumento: esos fragmentos se inyectan en el prompt que va al modelo de lenguaje, junto con la consulta original y las instrucciones de estilo y formato.
Generación: el modelo redacta la respuesta anclándose en los fragmentos proporcionados y devuelve también la cita a las fuentes usadas, de modo que el técnico pueda abrir el expediente original y verificar.
4. Por qué RAG es seguro para administraciones públicas
La preocupación más habitual del secretario o del técnico de contratación cuando se le plantea un sistema de IA es: "¿los datos de mis expedientes van a salir a entrenar un modelo que después use cualquiera?". En un RAG bien diseñado, la respuesta es no.
Los documentos del organismo permanecen en la base vectorial del propio tenant contratado. El modelo de lenguaje es un servicio al que se le envían fragmentos relevantes bajo acuerdo de procesamiento de datos, sin que esos fragmentos se incorporen al entrenamiento general. Los principales proveedores ofrecen esta garantía contractual de forma estándar desde 2024.
Mínimos exigibles: alojamiento en territorio UE, cumplimiento del Esquema Nacional de Seguridad (RD 311/2022) en la categoría que corresponda, contrato de encargado de tratamiento conforme al artículo 28 del RGPD, trazabilidad de accesos y cifrado en reposo y en tránsito. Sin estos cuatro elementos, el sistema no es desplegable en una AAPP española.
5. Cómo se prepara un RAG con el histórico del ayuntamiento
El valor real aparece cuando el sistema conoce los documentos del organismo. La fase inicial consiste en volcar a la base documental los expedientes relevantes: pliegos aprobados de los últimos años, memorias justificativas, informes jurídicos, resoluciones de adjudicación, observaciones del interventor y plantillas internas.
Cada documento se etiqueta con metadatos (tipo de contrato, CPV, órgano, fecha, estado) para que el sistema pueda filtrar recuperaciones. A partir de ese punto, cada nuevo pliego que el organismo apruebe se añade al índice de forma automática y pasa a estar disponible para futuras consultas.
Nada de esto es reentrenamiento del modelo. Es indexación documental. Por eso el coste y el tiempo son razonables, y por eso no hay riesgo de que información confidencial acabe en un modelo accesible a terceros.
6. Caso práctico: redactar un PPT con RAG vs ChatGPT puro
Imaginemos un ayuntamiento que necesita sacar a licitación el mantenimiento de su parque de vehículos municipales. El técnico pide a ambos sistemas un borrador de Pliego de Prescripciones Técnicas.
Con ChatGPT puro, la respuesta es un texto correcto en forma, con apartados esperables (objeto, alcance, obligaciones del contratista, penalidades, plazo). El técnico detecta en la lectura que las horas de servicio propuestas no coinciden con el uso real del parque, que los niveles de servicio citados son genéricos y que no se mencionan los requisitos ambientales que su organismo viene exigiendo desde 2023.
Con un RAG entrenado sobre el histórico del ayuntamiento, el borrador parte del PPT aprobado en el contrato anterior, incorpora las observaciones del interventor que motivaron cambios en la última adjudicación y reutiliza la cláusula ambiental estándar de la casa. Cada afirmación relevante está acompañada de una referencia al documento origen.
Dato clave: el tiempo de redacción del primer borrador se reduce, pero el ahorro mayor está en la revisión: el técnico ya no tiene que comprobar línea a línea que el texto es coherente con los criterios del organismo, porque el sistema se ha apoyado directamente en esos criterios.
7. Reducción de alucinaciones gracias a las fuentes citadas
Una alucinación, en contexto de IA, es una afirmación inventada con apariencia de verdad. En contratación pública el ejemplo clásico es una referencia a un artículo de la LCSP que no existe, o una cifra umbral desactualizada, o una cita jurisprudencial ficticia.
RAG reduce drásticamente la tasa de alucinaciones porque el modelo no está generando desde su memoria interna: está reformulando fragmentos reales que ha recibido. Y, sobre todo, cada afirmación lleva la cita de la fuente, lo que permite al técnico hacer la verificación en segundos en lugar de leer el texto línea a línea.
Sigue siendo imprescindible la revisión humana. Pero la naturaleza de esa revisión cambia: pasa de "¿es esto real?" a "¿es esto aplicable a este contrato?".
8. Cumplimiento normativo: ENS, RGPD y Ley 40/2015
Un sistema RAG desplegado en una AAPP española debe encajar con tres bloques normativos. El Esquema Nacional de Seguridad (RD 311/2022) exige que los sistemas que manejan información de la administración estén certificados en la categoría correspondiente a su criticidad. El RGPD y la LOPDGDD obligan a firmar contrato de encargado de tratamiento y a realizar un análisis de impacto cuando el tratamiento implique riesgo alto para los derechos de los afectados.
La Ley 40/2015, de Régimen Jurídico del Sector Público, añade en su artículo 41 la exigencia de que las actuaciones administrativas automatizadas estén definidas por resolución del órgano competente, identificando las responsabilidades. Un sistema RAG no toma decisiones automatizadas (el técnico firma), pero sí apoya al instructor, lo cual suele bastar para no activar este artículo.
El Reglamento Europeo de IA (Reglamento 2024/1689) clasifica los sistemas de apoyo a la decisión administrativa en un nivel que obliga, entre otras cosas, a informar al ciudadano cuando aplica, garantizar supervisión humana y documentar el funcionamiento. Un RAG bien integrado cumple todos estos requisitos de forma natural.
9. Limitaciones reales del RAG
RAG no convierte una contratación mal planificada en buena. Si el histórico documental del organismo contiene errores sistemáticos (pliegos con marcas comerciales sin justificación, criterios no objetivos, referencias derogadas), el RAG los reproducirá salvo que se combine con una capa explícita de validación normativa.
Tampoco sustituye la obligación jurídica del técnico que firma el documento. El artículo 116 LCSP y la normativa de procedimiento administrativo hacen recaer la responsabilidad sobre la persona física firmante. La IA es asistencia, no delegación.
Finalmente, la calidad de las respuestas depende de la calidad del corpus indexado. Un organismo que haya digitalizado deficientemente sus expedientes obtendrá resultados pobres al principio; merece la pena invertir en una buena extracción y estructuración antes de esperar milagros.
10. Cómo evaluar si tu organismo está listo
Antes de comprometer presupuesto, hay cuatro preguntas que conviene responder internamente.
Checklist de preparación
1. Corpus documental
¿Están los pliegos, memorias y resoluciones de los últimos tres a cinco años en formato digital y accesible (PDF nativo o Word)? Si solo hay escaneos, primero hay que pasar por una fase de OCR.
2. Volumen útil
Un RAG con 20-30 expedientes aporta poco; con varios centenares empieza a ser muy útil. Si tu organismo tramita pocas licitaciones al año, plantéate compartir corpus con otros ayuntamientos de la comarca o con la diputación.
3. Gobernanza clara
¿Hay un responsable de contratación definido que pueda liderar la implantación y validar el uso? Los proyectos sin un dueño funcional no terminan.
4. Infraestructura y soporte
¿Dispones de un responsable TIC (propio o mancomunado) que pueda seguir las integraciones con la plataforma de gestión y el acceso mediante certificado? En ayuntamientos pequeños suele ser el cuello de botella.
Si quieres ver exactamente cómo una arquitectura RAG conecta con tu histórico documental, puedes revisar la descripción técnica en las características de LicitadIA o la explicación paso a paso de cómo funciona el sistema dentro de una AAPP.
Para ver una demo sobre los tipos de contrato reales de tu organismo, lo más directo es solicitar una demo gratuita y aportar dos o tres ejemplos representativos de vuestro histórico.
Preguntas frecuentes
¿Cuál es la diferencia entre un sistema RAG y ChatGPT para contratación pública?
ChatGPT responde únicamente con el conocimiento general con el que fue entrenado, sin acceso a los documentos del organismo y sin trazabilidad de fuentes. Un sistema RAG primero recupera los pliegos, memorias y contratos históricos del propio ayuntamiento que sean relevantes y solo después genera la respuesta citando esas fuentes. Eso reduce drásticamente las alucinaciones y permite al técnico verificar cada afirmación abriendo el expediente original.
¿Es seguro subir los pliegos de mi organismo a un sistema RAG?
En un RAG bien diseñado para administraciones públicas los documentos del organismo se almacenan en una base vectorial dentro del entorno contratado y no se usan para entrenar modelos generales. El modelo de lenguaje solo recibe los fragmentos necesarios para responder a cada consulta. El servicio debe estar alojado en territorio UE, cumplir el Esquema Nacional de Seguridad (RD 311/2022), firmarse contrato de encargado de tratamiento conforme al artículo 28 del RGPD y ofrecer trazabilidad completa de accesos.
¿Cuánto tarda y cuesta implantar un RAG en un ayuntamiento?
La implantación típica para un ayuntamiento de 5.000 a 50.000 habitantes combina una fase de indexación inicial del histórico documental (2-4 semanas) y una fase de puesta en producción con formación a los técnicos (2-3 semanas adicionales). El coste depende del volumen documental y del número de usuarios, pero se aleja bastante del coste de una plataforma de contratación completa porque se implanta sobre la que ya se use. Puede financiarse parcialmente con fondos del MRR según la convocatoria vigente en el momento de la contratación.
¿Quieres ver un RAG trabajando sobre tu histórico real?
LicitadIA se implanta sobre los pliegos y memorias que ya tienes en el organismo. En la demo trabajamos con dos o tres ejemplos reales para que veas qué te devuelve, cómo cita las fuentes y cómo integra tus criterios internos.
Solicitar demo gratuita