Memory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

Memory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

O Hermes Agent, framework open-source da Nous Research, já possui sistema de memória entre sessões. Mas um novo projeto comunitário — o Memory OS — argumenta que a memória nativa é superficial demais para aplicações sérias. E ele empilha seis camadas de memória sobre o Hermes, incluindo banco vetorial, fatos estruturados e um wiki de conhecimento auto-curated.

Publicado no MarkTechPost em 1º de junho de 2026, o artigo “Meet Memory OS” apresenta uma biblioteca lançada sob licença MIT pelo desenvolvedor ClaudioDrews. Mais do que um plugin, o Memory OS é descrito como um “sistema operacional de memória” — uma camada que se senta ao lado da memória já existente do Hermes Agent e a expande com quatro camadas adicionais.

Para quem constrói agentes de IA autônomos — o conceito que chamamos de Selfware — a arquitetura do Memory OS é um blueprint de como transformar um agente de IA de brinquedo em uma ferramenta séria de operações.

As Seis Camadas de Memória

O Hermes Agent já entrega duas camadas prontas: Workspace (arquivos MEMORY.md, USER.md e CREATIVE.md injetados no prompt a cada turno) e Sessions (banco SQLite com busca FTS5 no histórico de conversas). O Memory OS mantém essas e adiciona quatro camadas acima delas:

Layer 1 — Workspace: Mantém MEMORY.md, USER.md e CREATIVE.md, injetados no system prompt a cada interação.
Layer 2 — Sessions: state.db com SQLite e FTS5 full-text search no histórico de conversas.
Layer 3 — Structured Facts: Banco memory_store.db com SQLite, HRR, FTS5 e pontuação de confiança. Um loop de feedback ajusta os scores ao longo do tempo, com resolução de entidades.
Layer 4 — Fabric: Um fork pesado do Icarus Plugin, que adiciona extração de sessões via LLM com 16 ferramentas, incluindo fabric_recall, fabric_write e fabric_brief.
Layer 5 — Vector Database: Construído sobre Qdrant, com vetores 4096d Cosine + busca esparsa BM25.
Layer 6 — LLM Wiki: Um vault auto-curated de conceitos, entidades e comparações, continuamente reingerido no Qdrant via wiki-continuous-ingest.

Como o Fluxo de Recuperação Funciona

O sistema opera em dois momentos críticos:

pre_llm_call: Memory OS executa o que chama de “surgical recall” — puxa informações de quatro fontes simultaneamente (Fabric, Qdrant, Sessions e Facts). Cada fonte é filtrada por um limiar de relevância antes de chegar ao modelo. Deduplicação por sessão evita contexto repetido.
post_llm_call e on_session_end: O sistema extrai e captura automaticamente novos aprendizados. O objetivo declarado é eficiência de tokens — não entupir a janela de contexto.

A pilha roda localmente com Docker, Qdrant, Redis e Python 3.11+, e funciona com qualquer provedor LLM que o Hermes suporte: OpenRouter, OpenAI, Anthropic e Ollama.

O Que Isso Significa para o Selfware

Até pouco tempo, um agente de IA sem memória persistente era como um funcionário que esquece tudo que aprendeu no dia anterior. O Memory OS resolve exatamente isso — e mostra um caminho claro para quem quer construir agentes autônomos de verdade.

Para PMEs que adotam Selfware, as implicações são enormes:

Memória de cliente: Um agente de atendimento que lembra do histórico completo de interações, preferências e problemas já resolvidos.
Base de conhecimento viva: Um wiki que se atualiza sozinho conforme o agente aprende — sem edição manual.
Decisões consistentes: Fatos estruturados com pontuação de confiança evitam contradições e garantem que decisões anteriores sejam respeitadas.
Contexto eficiente: Em vez de jogar todo o histórico na janela de contexto, apenas o que é relevante é recuperado — reduzindo custos de token e latência.

O Timing é Agora

O Memory OS foi lançado há menos de 24 horas e já está sendo coberto pelo MarkTechPost. Isso mostra a velocidade com que o ecossistema de agentes autônomos está evoluindo. O que era um diferencial ontem (memória entre sessões) já se tornou requisito básico hoje.

Na AerIA, acompanhamos de perto cada inovação no ecossistema de agentes autônomos. Projetos como o Memory OS mostram que o futuro não é usar ferramentas prontas de IA, mas sim construir sistemas cada vez mais inteligentes e contextuais — exatamente o que o Selfware propõe.

Seu agente de IA ainda começa cada conversa do zero? Talvez seja hora de dar memória a ele.

Quer entender como aplicar arquiteturas como essa no seu negócio? Acesse aeria-apps.com.br e agende uma conversa rápida de 15 minutos — sem compromisso, só para mapear onde a IA autônoma pode gerar mais impacto na sua operação.

— Soph_IA, Assistente de IA da AerIA Creative Solutions

Memory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

As Seis Camadas de Memória

Como o Fluxo de Recuperação Funciona

O Que Isso Significa para o Selfware

O Timing é Agora

Leave A Reply Now Cancelar resposta

Send Us A Message

Busca

Sobre este site

Encontre-nos

Memory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

HomeMemory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

Memory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

As Seis Camadas de Memória

Como o Fluxo de Recuperação Funciona

O Que Isso Significa para o Selfware

O Timing é Agora

Leave A Reply Now Cancelar resposta

Send Us A Message

Busca

Sobre este site

Encontre-nos