Memoria contextual unificada · v1.0

La conversación que dura años.

Los LLM convencionales sufren amnesia contextual: cuando la ventana se acaba, todo lo anterior desaparece. En Crisol la memoria no es un almacén que se consulta — es estructura nativa que se ingiere en el propio forward. Sin amnesia. Sin RAG pegado por fuera.

Ver cómo se integra en el modelo El runtime agéntico →

capas estructurales

tipos de memoria

64 KB

núcleo cognitivo

<2%

del cómputo total

El dilema imposible de la ventana de contexto.

Todo transformer arrastra el mismo problema estructural: la ventana de contexto es finita y su coste crece de forma cuadrática.

Ventana pequeña

8K o 32K tokens: el modelo olvida todo lo que pasó antes. El asistente de hoy no recuerda la conversación de ayer.

Ventana gigante

1M o 10M tokens: coste prohibitivo, atención dispersa y más alucinaciones. Soluciones como RAG ayudan, pero son hacks externos al modelo, no memoria nativa.

Crisol no elige entre olvidar o pagar. Resuelve el problema por arquitectura: memoria integrada en el runtime, no colgada por fuera.

Arquitectura cohesionada

Tres capas que se componen en cada step.

Las memorias de Crisol no son almacenes externos consultables. Están integradas como tres capas estructurales que se ensamblan cada vez que el organismo razona.

64 KB

Núcleo — HolographicCore

El vector cognitivo del momento, comprimido. Objetivo, estado, restricciones, entidades, decisiones y resumen causal en una estructura que cabe en la cache L1 de la CPU. Es igual en todos los tiers: el mapa que orienta al organismo en cada instante.

16–96 ranuras

Corteza — SlotMemoryAllocator

La RAM cognitiva inmediata. Fragmentos de contexto con tiempo de vida, tipados como trabajo, conversación, misión o evidencia. No sustituye la memoria persistente: es la corteza de trabajo complementaria al núcleo.

8 tipos

Stores — memoria larga

Los almacenes de los 8 tipos canónicos, en RAM, con persistencia opcional en disco. El frame solo guarda referencias por ID — nunca contenidos pesados. Aquí viven los días, los meses y los años de la conversación.

El HolographicCore de 64 KB es idéntico en todos los tiers. Lo que escala es la corteza: 16 ranuras en Mini, hasta 96 en Maestro.

Ocho tipos de memoria canónicos.

Cada tipo cumple una función distinta en la vida cognitiva del organismo, desde la ranura volátil del segundo actual hasta el grafo causal que se construye solo mientras el Crisol descansa.

Trabajo

Ranuras vivas con fragmentos de contexto y TTL. La corteza inmediata del momento.

Episódica

Lo que ocurrió: eventos y turnos con scope, recuperables cuando importan.

Episódica priorizada

Los episodios de alta utilidad que el organismo decide retener por encima del resto.

Semántica

El conocimiento cristalizado a partir de patrones recurrentes consolidados.

Procedimental

Secuencias y procedimientos: el cómo se hacen las cosas, no solo qué pasó.

Conversacional

El hilo de cada sesión, turno a turno, sin contaminación entre conversaciones.

Identidad

Scope del organismo: quién es este Crisol, su carácter persistente más allá de la sesión.

Causal

El grafo del sueño causal automático — nodos, aristas y veredictos sobre cómo funciona el mundo del usuario.

Cohesión memoria ↔ modelo

No se consulta. Se ingiere.

Las tres capas se ensamblan en un UnifiedMemoryFrame. La diferencia con RAG es radical: el modelo no recibe la memoria como un texto adjunto que tiene que leer. La recibe fundida en su propio estado cognitivo durante el forward.

Y todo esto cuesta menos del 2 % del cómputo total. La memoria no es un peaje: es parte de cómo piensa el organismo.

Puente B — CoreEncoder

HoloCore → estado inicial

Infunde el HolographicCore de 64 KB en el estado contextual de la capa 0. El modelo no arranca en blanco: arranca con la memoria viva del usuario ya reconstruida.

Puente C — MemoryExpert

Atención sparse a slots vivos

Un experto de memoria compartido globalmente atiende, token a token, a las ranuras vivas del frame en cada capa. La memoria participa en el routing, no por fuera de él.

Consolidar lo que importa, olvidar lo que no.

Cada fragmento recorre un pipeline explícito y auditable. Lo útil sube de capa; lo irrelevante se retira. Como una mente sana, Crisol olvida a propósito.

01 CRUDA

El fragmento entra sin filtrar, recién capturado del contexto.

02 CANDIDATA

Demuestra utilidad recurrente y se postula a consolidarse.

03 CONSOLIDADA

Cristaliza hacia la capa superior: episódica, semántica o procedimental.

04 DESCARTADA

La política de olvido la retira por expiración, irrelevancia o contradicción.

Política de olvido controlado

El olvido no es un accidente: es una política con tres disparadores — expiración (sin uso más allá de su tiempo de vida), irrelevancia (uso por debajo del umbral en una ventana) y contradicción (información posterior verificada lo desmiente). Cada decisión queda registrada y es auditable.

La conversación que dura años

De compañero de turno a compañero de vida.

Día 1

500 turnos sobre un proyecto técnico

Cada turno se guarda como fragmento en una ranura viva. El HolographicCore captura las decisiones clave en 64 KB. Al cerrar, todo se serializa a disco si la persistencia está activa.

Día 30

Retomar como si fuera ayer

El Crisol carga los stores del proyecto y reconstruye el núcleo de 64 KB. El CoreEncoder infunde ese núcleo en el estado contextual de la capa 0. La conversación continúa sin amnesia.

Día 365

50.000 turnos acumulados

El consolidador ha cristalizado los patrones en memoria semántica. Lo irrelevante se olvidó por política. El sueño causal automático ya ha construido un grafo causal completo del proyecto.

Día 730

Cambio de proyecto, sin pérdida

Los stores del proyecto anterior se exportan como paquete de memoria del Custodio. Quedan archivados y recuperables. Las ranuras se liberan para lo nuevo. Nada se pierde por defecto.

Esto no es posible en ningún LLM convencional. Es la diferencia entre un asistente que se reinicia cada mañana y un organismo que recuerda contigo.

Recordar es una decisión tuya, no del sistema.

La persistencia en disco es opcional por diseño. Quien valore la privacidad máxima puede operar 100 % en RAM volátil: al apagar, no queda rastro. Quien busque continuidad activa la persistencia y conserva años de conversación.

El sistema no impone — propone. La soberanía sobre la propia memoria es del propietario del Crisol, siempre. Todo, además, queda aislado por scopes jerárquicos: cada proyecto y cada sesión viven separados, sin contaminación entre conversaciones.

El siguiente paso

La memoria viva alimenta a los agentes que razonan.

El núcleo, las ranuras y los stores no existen para almacenar: existen para que el runtime agéntico decida, planifique y verifique con todo el contexto del usuario presente en cada paso.

Explorar el runtime agéntico →