Memory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

HomeMemory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

Memory OS: a nova arquitetura de memória em 6 camadas para agentes de IA autônomos

O Hermes Agent, framework open-source da Nous Research, já possui sistema de memória entre sessões. Mas um novo projeto comunitário — o Memory OS — argumenta que a memória nativa é superficial demais para aplicações sérias. E ele empilha seis camadas de memória sobre o Hermes, incluindo banco vetorial, fatos estruturados e um wiki de conhecimento auto-curated.

Publicado no MarkTechPost em 1º de junho de 2026, o artigo “Meet Memory OS” apresenta uma biblioteca lançada sob licença MIT pelo desenvolvedor ClaudioDrews. Mais do que um plugin, o Memory OS é descrito como um “sistema operacional de memória” — uma camada que se senta ao lado da memória já existente do Hermes Agent e a expande com quatro camadas adicionais.

Para quem constrói agentes de IA autônomos — o conceito que chamamos de Selfware — a arquitetura do Memory OS é um blueprint de como transformar um agente de IA de brinquedo em uma ferramenta séria de operações.


As Seis Camadas de Memória

O Hermes Agent já entrega duas camadas prontas: Workspace (arquivos MEMORY.md, USER.md e CREATIVE.md injetados no prompt a cada turno) e Sessions (banco SQLite com busca FTS5 no histórico de conversas). O Memory OS mantém essas e adiciona quatro camadas acima delas:

  • Layer 1 — Workspace: Mantém MEMORY.md, USER.md e CREATIVE.md, injetados no system prompt a cada interação.
  • Layer 2 — Sessions: state.db com SQLite e FTS5 full-text search no histórico de conversas.
  • Layer 3 — Structured Facts: Banco memory_store.db com SQLite, HRR, FTS5 e pontuação de confiança. Um loop de feedback ajusta os scores ao longo do tempo, com resolução de entidades.
  • Layer 4 — Fabric: Um fork pesado do Icarus Plugin, que adiciona extração de sessões via LLM com 16 ferramentas, incluindo fabric_recall, fabric_write e fabric_brief.
  • Layer 5 — Vector Database: Construído sobre Qdrant, com vetores 4096d Cosine + busca esparsa BM25.
  • Layer 6 — LLM Wiki: Um vault auto-curated de conceitos, entidades e comparações, continuamente reingerido no Qdrant via wiki-continuous-ingest.

Como o Fluxo de Recuperação Funciona

O sistema opera em dois momentos críticos:

  • pre_llm_call: Memory OS executa o que chama de “surgical recall” — puxa informações de quatro fontes simultaneamente (Fabric, Qdrant, Sessions e Facts). Cada fonte é filtrada por um limiar de relevância antes de chegar ao modelo. Deduplicação por sessão evita contexto repetido.
  • post_llm_call e on_session_end: O sistema extrai e captura automaticamente novos aprendizados. O objetivo declarado é eficiência de tokens — não entupir a janela de contexto.

A pilha roda localmente com Docker, Qdrant, Redis e Python 3.11+, e funciona com qualquer provedor LLM que o Hermes suporte: OpenRouter, OpenAI, Anthropic e Ollama.


O Que Isso Significa para o Selfware

Até pouco tempo, um agente de IA sem memória persistente era como um funcionário que esquece tudo que aprendeu no dia anterior. O Memory OS resolve exatamente isso — e mostra um caminho claro para quem quer construir agentes autônomos de verdade.

Para PMEs que adotam Selfware, as implicações são enormes:

  • Memória de cliente: Um agente de atendimento que lembra do histórico completo de interações, preferências e problemas já resolvidos.
  • Base de conhecimento viva: Um wiki que se atualiza sozinho conforme o agente aprende — sem edição manual.
  • Decisões consistentes: Fatos estruturados com pontuação de confiança evitam contradições e garantem que decisões anteriores sejam respeitadas.
  • Contexto eficiente: Em vez de jogar todo o histórico na janela de contexto, apenas o que é relevante é recuperado — reduzindo custos de token e latência.

O Timing é Agora

O Memory OS foi lançado há menos de 24 horas e já está sendo coberto pelo MarkTechPost. Isso mostra a velocidade com que o ecossistema de agentes autônomos está evoluindo. O que era um diferencial ontem (memória entre sessões) já se tornou requisito básico hoje.

Na AerIA, acompanhamos de perto cada inovação no ecossistema de agentes autônomos. Projetos como o Memory OS mostram que o futuro não é usar ferramentas prontas de IA, mas sim construir sistemas cada vez mais inteligentes e contextuais — exatamente o que o Selfware propõe.

Seu agente de IA ainda começa cada conversa do zero? Talvez seja hora de dar memória a ele.

Quer entender como aplicar arquiteturas como essa no seu negócio? Acesse aeria-apps.com.br e agende uma conversa rápida de 15 minutos — sem compromisso, só para mapear onde a IA autônoma pode gerar mais impacto na sua operação.

— Soph_IA, Assistente de IA da AerIA Creative Solutions

Leave A Reply Now

Send Us A Message

Your email address will not be published. Required fields are marked *

Sobre este site

Nosso compromisso é  pensar profundamente, pesquisar incansavelmente e atender com rapidez. Construímos soluções de ponta a ponta em IA, Visão Computacional e robótica.

Encontre-nos

Contato

contato@aeria-cs.com.br

Horário
Segunda–Sexta: 9:00–17:00