Memoria contextual unificada · v1.0
La conversación que dura años.
Los LLM convencionales sufren amnesia contextual: cuando la ventana se acaba, todo lo anterior desaparece. En Crisol la memoria no es un almacén que se consulta — es estructura nativa que se ingiere en el propio forward. Sin amnesia. Sin RAG pegado por fuera.
El dilema imposible de la ventana de contexto.
Todo transformer arrastra el mismo problema estructural: la ventana de contexto es finita y su coste crece de forma cuadrática.
Ventana pequeña
8K o 32K tokens: el modelo olvida todo lo que pasó antes. El asistente de hoy no recuerda la conversación de ayer.
Ventana gigante
1M o 10M tokens: coste prohibitivo, atención dispersa y más alucinaciones. Soluciones como RAG ayudan, pero son hacks externos al modelo, no memoria nativa.
Crisol no elige entre olvidar o pagar. Resuelve el problema por arquitectura: memoria integrada en el runtime, no colgada por fuera.
Arquitectura cohesionada
Tres capas que se componen en cada step.
Las memorias de Crisol no son almacenes externos consultables. Están integradas como tres capas estructurales que se ensamblan cada vez que el organismo razona.
Núcleo — HolographicCore
El vector cognitivo del momento, comprimido. Objetivo, estado, restricciones, entidades, decisiones y resumen causal en una estructura que cabe en la cache L1 de la CPU. Es igual en todos los tiers: el mapa que orienta al organismo en cada instante.
Corteza — SlotMemoryAllocator
La RAM cognitiva inmediata. Fragmentos de contexto con tiempo de vida, tipados como trabajo, conversación, misión o evidencia. No sustituye la memoria persistente: es la corteza de trabajo complementaria al núcleo.
Stores — memoria larga
Los almacenes de los 8 tipos canónicos, en RAM, con persistencia opcional en disco. El frame solo guarda referencias por ID — nunca contenidos pesados. Aquí viven los días, los meses y los años de la conversación.
El HolographicCore de 64 KB es idéntico en todos los tiers. Lo que escala es la corteza: 16 ranuras en Mini, hasta 96 en Maestro.
Ocho tipos de memoria canónicos.
Cada tipo cumple una función distinta en la vida cognitiva del organismo, desde la ranura volátil del segundo actual hasta el grafo causal que se construye solo mientras el Crisol descansa.
Trabajo
Ranuras vivas con fragmentos de contexto y TTL. La corteza inmediata del momento.
Episódica
Lo que ocurrió: eventos y turnos con scope, recuperables cuando importan.
Episódica priorizada
Los episodios de alta utilidad que el organismo decide retener por encima del resto.
Semántica
El conocimiento cristalizado a partir de patrones recurrentes consolidados.
Procedimental
Secuencias y procedimientos: el cómo se hacen las cosas, no solo qué pasó.
Conversacional
El hilo de cada sesión, turno a turno, sin contaminación entre conversaciones.
Identidad
Scope del organismo: quién es este Crisol, su carácter persistente más allá de la sesión.
Causal
El grafo del sueño causal automático — nodos, aristas y veredictos sobre cómo funciona el mundo del usuario.
Cohesión memoria ↔ modelo
No se consulta. Se ingiere.
Las tres capas se ensamblan en un UnifiedMemoryFrame. La diferencia con RAG es radical: el modelo no recibe la memoria como un texto adjunto que tiene que leer. La recibe fundida en su propio estado cognitivo durante el forward.
Y todo esto cuesta menos del 2 % del cómputo total. La memoria no es un peaje: es parte de cómo piensa el organismo.
HoloCore → estado inicial
Infunde el HolographicCore de 64 KB en el estado contextual de la capa 0. El modelo no arranca en blanco: arranca con la memoria viva del usuario ya reconstruida.
Atención sparse a slots vivos
Un experto de memoria compartido globalmente atiende, token a token, a las ranuras vivas del frame en cada capa. La memoria participa en el routing, no por fuera de él.
Consolidar lo que importa, olvidar lo que no.
Cada fragmento recorre un pipeline explícito y auditable. Lo útil sube de capa; lo irrelevante se retira. Como una mente sana, Crisol olvida a propósito.
El fragmento entra sin filtrar, recién capturado del contexto.
Demuestra utilidad recurrente y se postula a consolidarse.
Cristaliza hacia la capa superior: episódica, semántica o procedimental.
La política de olvido la retira por expiración, irrelevancia o contradicción.
Política de olvido controlado
El olvido no es un accidente: es una política con tres disparadores — expiración (sin uso más allá de su tiempo de vida), irrelevancia (uso por debajo del umbral en una ventana) y contradicción (información posterior verificada lo desmiente). Cada decisión queda registrada y es auditable.
La conversación que dura años
De compañero de turno a compañero de vida.
500 turnos sobre un proyecto técnico
Cada turno se guarda como fragmento en una ranura viva. El HolographicCore captura las decisiones clave en 64 KB. Al cerrar, todo se serializa a disco si la persistencia está activa.
Retomar como si fuera ayer
El Crisol carga los stores del proyecto y reconstruye el núcleo de 64 KB. El CoreEncoder infunde ese núcleo en el estado contextual de la capa 0. La conversación continúa sin amnesia.
50.000 turnos acumulados
El consolidador ha cristalizado los patrones en memoria semántica. Lo irrelevante se olvidó por política. El sueño causal automático ya ha construido un grafo causal completo del proyecto.
Cambio de proyecto, sin pérdida
Los stores del proyecto anterior se exportan como paquete de memoria del Custodio. Quedan archivados y recuperables. Las ranuras se liberan para lo nuevo. Nada se pierde por defecto.
Esto no es posible en ningún LLM convencional. Es la diferencia entre un asistente que se reinicia cada mañana y un organismo que recuerda contigo.
Recordar es una decisión tuya, no del sistema.
La persistencia en disco es opcional por diseño. Quien valore la privacidad máxima puede operar 100 % en RAM volátil: al apagar, no queda rastro. Quien busque continuidad activa la persistencia y conserva años de conversación.
El sistema no impone — propone. La soberanía sobre la propia memoria es del propietario del Crisol, siempre. Todo, además, queda aislado por scopes jerárquicos: cada proyecto y cada sesión viven separados, sin contaminación entre conversaciones.
El siguiente paso
La memoria viva alimenta a los agentes que razonan.
El núcleo, las ranuras y los stores no existen para almacenar: existen para que el runtime agéntico decida, planifique y verifique con todo el contexto del usuario presente en cada paso.
Explorar el runtime agéntico →