Proceso

Cuatro pasos hacia la eficiencia

De la carga documental a la generación inteligente. Un flujo diseñado para técnicos de contratación que valoran su tiempo.

Carga tu historial documental

Conecta LicitadIA con tus repositorios existentes: SharePoint, Nextcloud, carpetas locales. La plataforma indexa automáticamente toda tu documentación histórica de licitaciones.

Define el expediente

Completa un sencillo formulario con los datos básicos del expediente: tipo de documento, objeto, CPV, procedimiento e importe. LicitadIA entiende inmediatamente el contexto.

Genera el borrador

El sistema RAG recupera los documentos más relevantes de tu historial y, combinándolos con la información del formulario, genera un borrador completo y coherente en minutos.

Revisa y ajusta

El documento generado es un borrador inteligente, no un producto final. Edítalo libremente, pide modificaciones específicas al asistente conversacional y exporta cuando estés satisfecho.

Anatomía técnica

Cómo funciona un sistema RAG

La arquitectura que permite a un modelo de lenguaje consultar tu propia documentación en cada respuesta. Una guía paso a paso por las dos fases del proceso —indexación y consulta— y por la matemática que las sostiene.

La columna vertebral conceptual de LicitadIA, explicada sin atajos.

Empezar por el problema Saltar a las animaciones

Desliza para empezar

· Indexación offline
· Consulta online
· Similitud del coseno
· Fragmentación recursiva

El punto de partida

Tres limitaciones de los modelos de lenguaje

Un LLM por sí solo es un estudiante muy inteligente que examina de memoria. Sin acceso al material de referencia, falla en exactamente los casos que más nos importan.

Limitación 01

Conocimiento congelado

Un modelo entrenado en 2024 no sabe nada de lo ocurrido tras su fecha de corte. Las leyes cambian, los precedentes evolucionan, los pliegos se actualizan — el LLM no se entera.

Limitación 02

No conoce tu información

El LLM nunca ha leído los expedientes de tu organización, ni los pliegos históricos, ni las cláusulas que tu equipo ha redactado durante años. Carece, por completo, de memoria institucional.

Limitación 03

Tendencia a alucinar

Cuando el modelo no sabe algo, no calla: inventa respuestas que suenan plausibles pero son falsas. En un contexto administrativo —donde una cláusula errónea es un riesgo real— eso es inadmisible.

La solución

Un RAG resuelve los tres problemas de un golpe: proporciona al modelo, en cada consulta, el contexto exacto que necesita para responder con precisión, actualidad y trazabilidad.

Veámoslo

El contraste

La misma pregunta, dos respuestas distintas

Antes de bajar al detalle técnico, observa qué cambia cuando un LLM tiene —o no— acceso a la documentación real de tu organización.

Pregunta «¿Cuál es el plazo de devolución según el contrato marco con ACME?»

LLM sin RAG

Plausible. Genérico. Inventado. El modelo no ha leído tu contrato — extrapola del promedio del sector.

LLM con RAG

«Cláusula 14.2: el cliente dispone de un plazo de 30 días naturales desde la recepción del producto para ejercer el derecho de devolución.»

«Cláusula 14.3: las devoluciones deberán incluir el embalaje original y todos los accesorios.»

Preciso. Específico. Trazable. El modelo cita las cláusulas exactas — la respuesta es auditable.

Dos fases, un mismo espacio

Visión general de la arquitectura

Todo RAG se descompone en dos fases bien diferenciadas. Una se ejecuta una sola vez, de forma asíncrona, sobre los documentos. La otra se repite cada vez que un usuario formula una pregunta.

1 Fase de indexación · offline

Se hace una vez

01 Reúnes los documentos fuente.
02 Los fragmentas en chunks coherentes.
03 Cada chunk pasa por un modelo de embeddings.
04 Vectores y texto se guardan en la base vectorial.

2 Fase de consulta · online

Se repite en cada pregunta

01 La pregunta del usuario se vectoriza.
02 Se buscan los vectores más similares.
03 Se recuperan los top-k fragmentos.
04 Se construye el prompt aumentado.
05 El LLM genera la respuesta final.

Fase 01 · offline

Cómo se indexa tu memoria institucional

Sucede una vez por cada documento que añades. Es lento, ocurre en segundo plano y produce algo invisible pero esencial: una representación numérica de cada idea, lista para ser consultada en milisegundos.

Paso 01

Documentos fuente

Pliegos históricos, contratos marco, memorias justificativas, normativa autonómica. Todo lo que tu organización ha producido durante años entra en el sistema.

Paso 02

Fragmentación recursiva

Cada documento se rompe en chunks de 200–1000 tokens, respetando fronteras naturales (párrafo, frase). Un solapamiento del 10–20 % evita perder información en los bordes.

Paso 03

Vectores de incrustación

Cada chunk pasa por un modelo de embeddings —típicamente un transformer especializado— que devuelve un vector de cientos de dimensiones que codifica su significado.

Paso 04

Base de datos vectorial

Vectores, texto y metadatos se almacenan e indexan con HNSW u otro algoritmo ANN. Listos para responder, en milisegundos, a cualquier consulta futura.

Desliza para avanzar — la indexación recorre las cuatro etapas en orden.

Pausa · espacio vectorial

Significados que se vuelven geometría

Cada fragmento se convierte en un vector de cientos de dimensiones. Aquí lo proyectamos en dos para visualizarlo: textos que tratan de lo mismo se sitúan cerca; los que no, lejos. Esa proximidad geométrica es la similitud semántica.

Cómo leerlo

Cada punto es un fragmento. Pasa el cursor sobre el título de un cluster para destacarlo. El espacio real tiene cientos de dimensiones — esto es una proyección 2D pensada para entender la idea.

"El gato come pescado"
→ [0.0234, -0.187, ..., 0.002]

"Un felino consume comida marina"
→ [0.0301, -0.165, ..., -0.011]

// Vectores próximos en el espacio

Fase 02 · online

Lo que sucede cuando alguien pregunta

Cinco pasos, ejecutados en menos de un segundo. La pregunta atraviesa el mismo modelo de embeddings, recorre la base vectorial, recupera los fragmentos relevantes y termina en una respuesta trazable.

Paso 01

Vectorización de la pregunta

La pregunta del usuario se convierte en vector usando exactamente el mismo modelo de embeddings con el que se indexaron los documentos.

Paso 02

Búsqueda por similitud

La base vectorial calcula el coseno del ángulo entre el vector de la pregunta y cada uno de los vectores indexados — millones, en milisegundos.

Paso 03

Top-k fragmentos

Se devuelven los k vectores más similares (típicamente 3, 5 ó 10) ordenados de mayor a menor proximidad semántica.

Paso 04

Prompt aumentado

Se ensambla un prompt que incluye una instrucción de sistema, los fragmentos recuperados como contexto y la pregunta original del usuario.

Paso 05

Generación de la respuesta

El LLM genera la respuesta final basándose únicamente en ese contexto, con capacidad de citar la fuente exacta de cada afirmación.

La matemática del parecido

Similitud del coseno, paso a paso

Dos vectores forman un ángulo. El coseno de ese ángulo es la métrica que usa todo RAG para decidir qué es «parecido» y qué no. Ignora la magnitud, se fija sólo en la dirección — y por eso sirve igual de bien para textos cortos que para textos largos.

La fórmula

sim(A, B) = cos θ = A · B ‖A‖ · ‖B‖

Producto escalar de los vectores, dividido por el producto de sus normas.

Pruébalo

Un ejemplo numérico

A = [1, 2, 3] · B = [2, 3, 4]
// producto escalar
A · B = 1·2 + 2·3 + 3·4 = 20
// normas
‖A‖ = √14 ≈ 3.742
‖B‖ = √29 ≈ 5.385
// similitud
sim = 20 / (3.742 · 5.385) ≈ 0.9926

1.0

Misma dirección

Perpendiculares

−1.0

Direcciones opuestas

Más allá del RAG vainilla

Seis técnicas que cambian el resultado

Lo descrito hasta aquí es un RAG básico, ya útil. En proyectos reales —y en LicitadIA— se aplican mejoras que multiplican la precisión y reducen las alucinaciones a casi cero.

Búsqueda híbrida

Combina la búsqueda vectorial con BM25 clásico. La semántica capta el significado; el léxico encuentra códigos, nombres propios y tecnicismos exactos. Reciprocal Rank Fusion las une.

Re-ranking

Recuperas 20 candidatos y los reordenas con un cross-encoder más caro pero más preciso. Te quedas con los 5 mejores. Mejora drástica de relevancia, latencia controlada.

Expansión de consultas

Un LLM reformula la pregunta en variantes, o aplicas HyDE: generas una respuesta hipotética y vectorizas eso, no la pregunta. Funciona porque las respuestas se parecen más a los documentos.

Filtrado por metadatos

Antes de buscar, restringes el espacio: sólo documentos del último año, sólo del expediente X, sólo en español. Reduce el ruido y multiplica la relevancia.

Contexto padre

Indexas chunks pequeños (mejor precisión en la búsqueda) pero al recuperar uno le pasas al LLM el fragmento mayor que lo contiene. Lo mejor de los dos mundos.

RAG agéntico

Un agente realiza búsquedas iterativas, refinando la consulta según lo que va encontrando, hasta tener información suficiente. Más lento; imbatible en preguntas complejas.

Desafíos comunes

Fragmentos mal calibrados

No hay receta universal; hay que experimentar con tamaños y solapes.

Preguntas multi-documento

El RAG clásico flojea cuando la respuesta cruza fuentes; soluciones: resumen jerárquico, agéntico.

Evaluación

Recall@k, fidelidad y relevancia. Frameworks como RAGAS automatizan la medición.

Costes y privacidad

Cachear consultas frecuentes; control de acceso por metadatos para datos sensibles.

POR ESO LICITADIA

Tu memoria institucional, consultable como una biblioteca.

LicitadIA aplica todo lo que has visto —fragmentación recursiva, embeddings especializados, búsqueda híbrida, re-ranking y filtrado por expediente— sobre los pliegos, memorias y PCAP de tu propia organización. La IA deja de inventar y empieza a citar.

Solicitar demo gratuita Ver características

menos tiempo en redacción de pliegos

trazabilidad de fuentes citadas

alucinaciones sobre datos privados