Conocimiento congelado
Un modelo entrenado en 2024 no sabe nada de lo ocurrido tras su fecha de corte. Las leyes cambian, los precedentes evolucionan, los pliegos se actualizan — el LLM no se entera.
De la carga documental a la generación inteligente. Un flujo diseñado para técnicos de contratación que valoran su tiempo.
Conecta LicitadIA con tus repositorios existentes: SharePoint, Nextcloud, carpetas locales. La plataforma indexa automáticamente toda tu documentación histórica de licitaciones.
Completa un sencillo formulario con los datos básicos del expediente: tipo de documento, objeto, CPV, procedimiento e importe. LicitadIA entiende inmediatamente el contexto.
El sistema RAG recupera los documentos más relevantes de tu historial y, combinándolos con la información del formulario, genera un borrador completo y coherente en minutos.
El documento generado es un borrador inteligente, no un producto final. Edítalo libremente, pide modificaciones específicas al asistente conversacional y exporta cuando estés satisfecho.
La arquitectura que permite a un modelo de lenguaje consultar tu propia documentación en cada respuesta. Una guía paso a paso por las dos fases del proceso —indexación y consulta— y por la matemática que las sostiene.
La columna vertebral conceptual de LicitadIA, explicada sin atajos.
Un LLM por sí solo es un estudiante muy inteligente que examina de memoria. Sin acceso al material de referencia, falla en exactamente los casos que más nos importan.
Un modelo entrenado en 2024 no sabe nada de lo ocurrido tras su fecha de corte. Las leyes cambian, los precedentes evolucionan, los pliegos se actualizan — el LLM no se entera.
El LLM nunca ha leído los expedientes de tu organización, ni los pliegos históricos, ni las cláusulas que tu equipo ha redactado durante años. Carece, por completo, de memoria institucional.
Cuando el modelo no sabe algo, no calla: inventa respuestas que suenan plausibles pero son falsas. En un contexto administrativo —donde una cláusula errónea es un riesgo real— eso es inadmisible.
Un RAG resuelve los tres problemas de un golpe: proporciona al modelo, en cada consulta, el contexto exacto que necesita para responder con precisión, actualidad y trazabilidad.
Antes de bajar al detalle técnico, observa qué cambia cuando un LLM tiene —o no— acceso a la documentación real de tu organización.
Todo RAG se descompone en dos fases bien diferenciadas. Una se ejecuta una sola vez, de forma asíncrona, sobre los documentos. La otra se repite cada vez que un usuario formula una pregunta.
Sucede una vez por cada documento que añades. Es lento, ocurre en segundo plano y produce algo invisible pero esencial: una representación numérica de cada idea, lista para ser consultada en milisegundos.
Pliegos históricos, contratos marco, memorias justificativas, normativa autonómica. Todo lo que tu organización ha producido durante años entra en el sistema.
Cada documento se rompe en chunks de 200–1000 tokens, respetando fronteras naturales (párrafo, frase). Un solapamiento del 10–20 % evita perder información en los bordes.
Cada chunk pasa por un modelo de embeddings —típicamente un transformer especializado— que devuelve un vector de cientos de dimensiones que codifica su significado.
Vectores, texto y metadatos se almacenan e indexan con HNSW u otro algoritmo ANN. Listos para responder, en milisegundos, a cualquier consulta futura.
Cada fragmento se convierte en un vector de cientos de dimensiones. Aquí lo proyectamos en dos para visualizarlo: textos que tratan de lo mismo se sitúan cerca; los que no, lejos. Esa proximidad geométrica es la similitud semántica.
Cinco pasos, ejecutados en menos de un segundo. La pregunta atraviesa el mismo modelo de embeddings, recorre la base vectorial, recupera los fragmentos relevantes y termina en una respuesta trazable.
La pregunta del usuario se convierte en vector usando exactamente el mismo modelo de embeddings con el que se indexaron los documentos.
La base vectorial calcula el coseno del ángulo entre el vector de la pregunta y cada uno de los vectores indexados — millones, en milisegundos.
Se devuelven los k vectores más similares (típicamente 3, 5 ó 10) ordenados de mayor a menor proximidad semántica.
Se ensambla un prompt que incluye una instrucción de sistema, los fragmentos recuperados como contexto y la pregunta original del usuario.
El LLM genera la respuesta final basándose únicamente en ese contexto, con capacidad de citar la fuente exacta de cada afirmación.
Dos vectores forman un ángulo. El coseno de ese ángulo es la métrica que usa todo RAG para decidir qué es «parecido» y qué no. Ignora la magnitud, se fija sólo en la dirección — y por eso sirve igual de bien para textos cortos que para textos largos.
Producto escalar de los vectores, dividido por el producto de sus normas.
Lo descrito hasta aquí es un RAG básico, ya útil. En proyectos reales —y en LicitadIA— se aplican mejoras que multiplican la precisión y reducen las alucinaciones a casi cero.
Combina la búsqueda vectorial con BM25 clásico. La semántica capta el significado; el léxico encuentra códigos, nombres propios y tecnicismos exactos. Reciprocal Rank Fusion las une.
Recuperas 20 candidatos y los reordenas con un cross-encoder más caro pero más preciso. Te quedas con los 5 mejores. Mejora drástica de relevancia, latencia controlada.
Un LLM reformula la pregunta en variantes, o aplicas HyDE: generas una respuesta hipotética y vectorizas eso, no la pregunta. Funciona porque las respuestas se parecen más a los documentos.
Antes de buscar, restringes el espacio: sólo documentos del último año, sólo del expediente X, sólo en español. Reduce el ruido y multiplica la relevancia.
Indexas chunks pequeños (mejor precisión en la búsqueda) pero al recuperar uno le pasas al LLM el fragmento mayor que lo contiene. Lo mejor de los dos mundos.
Un agente realiza búsquedas iterativas, refinando la consulta según lo que va encontrando, hasta tener información suficiente. Más lento; imbatible en preguntas complejas.
LicitadIA aplica todo lo que has visto —fragmentación recursiva, embeddings especializados, búsqueda híbrida, re-ranking y filtrado por expediente— sobre los pliegos, memorias y PCAP de tu propia organización. La IA deja de inventar y empieza a citar.