Saltar al contenido
iCrisol

Defensa en profundidad · v1.0

Anti-alucinación por estructura.

Seamos honestos: el NOE solo no elimina las alucinaciones. Es una de cinco capas. La fortaleza de Crisol no está en un filtro mágico al final, sino en una defensa en profundidad donde la afirmación falsa tiene que atravesar cinco barreras independientes — y la mayor de ellas actúa antes de que el modelo razone nada.

5
capas de defensa
40%
peso del corpus destilado
3
ventanas: antes · durante · después
2048
ejes axiomáticos NAR

La honestidad es el argumento.

Ningún sistema puede prometer cero alucinaciones con un único mecanismo, y quien lo promete miente. Crisol no vende un escudo perfecto: vende un diseño donde cada capa cubre lo que la anterior dejó pasar. La probabilidad de que una falsedad cruce las cinco no es la suma de los errores — es su producto.

Por eso la frase que gobierna toda esta página es la más simple y la más fuerte:

El experto nunca vio una falsedad → no la repite.

Cómo se reparte la defensa

Cinco capas, cinco pesos, un solo objetivo.

Los porcentajes no son retórica: son la contribución relativa de cada capa a la robustez total. El corpus pesa cuatro veces más que los invariantes, y eso tiene una consecuencia estratégica que verás al final.

Corpus destilado
Routing top-k QSE
NAR axiomático
VerificationSubagente
NOE invariantes

Explora cada capa: ratón, tabulador o toque.

Corpus destilado

40%del peso total

El experto nunca vio una falsedad.

Mecanismo

Cada experto se entrena sobre un corpus destilado, verificado y limpiado. Si el experto nunca encontró una afirmación falsa durante su formación, no tiene de dónde reproducirla. Es la mayor línea de defensa y no vive en el modelo: vive en lo que el modelo aprende.

Cuándo actúa
Antes del razonamiento

El NOE solo es el 10%. El corpus destilado (40%) es lo que más rinde. No es un filtro al final: es defensa en profundidad — y la mayor barrera actúa antes de que el modelo razone nada.

Antes, durante y después del razonamiento.

La defensa en profundidad no es apilar filtros: es repartirlos en el tiempo. Una falsedad que esquiva la prevención se topa con la restricción; la que esquiva la restricción se topa con la verificación. Tres ventanas, ninguna redundante.

01

Antes del forward

  • · Corpus destilado y verificado (40%)
  • · NAR pre-entrenado sobre ejes axiomáticos

Se previene en origen. La falsedad no se filtra: simplemente nunca entra al sistema.

02

Durante el forward

  • · Routing top-k con QSE (20%)
  • · NAR axiomático restringiendo inferencias (15%)
  • · NOE comprobando invariantes (10%)

Se restringe en tiempo de generación. El espacio de salidas posibles ya viene acotado por la estructura.

03

Después del forward

  • · VerificationSubagente sobre la salida (15%)

Se ataja al final. La aduana última revisa lo que sobrevivió a las capas anteriores.

Implicación estratégica

Seis meses puliendo el corpus rinden más que mil invariantes nuevos.

Si el corpus aporta el 40% de la robustez y los invariantes el 10%, la palanca de mayor retorno es obvia: invertir en datos limpios, no en parches al final. La calidad del conocimiento que el experto absorbe pesa cuatro veces más que la capa que comprueba la salida.

Es la diferencia entre construir un edificio sobre cimientos sólidos y añadirle apuntalamientos cuando ya se agrieta. Crisol elige los cimientos.

40%
corpus destilado
10%
NOE invariantes
más peso del corpus
1
objetivo: cero falsedades aprendidas

El siguiente nivel

Una respuesta que no alucina es solo el principio. La que razona causalmente es el objetivo.

La estructura que evita falsedades es la misma que permite simular contrafactuales, comprobar causas y razonar sobre el mundo. Ahí empieza el verdadero motor de Crisol.

Ver el razonamiento causal →