- Olympus News
- Posts
- O Setup Seguro Para Um Agente Que Aprende
O Setup Seguro Para Um Agente Que Aprende
Claude Code, Codex, OpenClaw e Hermes não resolvem o mesmo problema — e confundir isso é caro.
Are you running your business on incomplete numbers?
Most small business owners have financials, but few have financial clarity. There's a real difference between books that are technically up to date and books that actually tell you what's going on in your business right now. When accounting is reactive — updated when there's time, reviewed at tax season — you lose visibility exactly when you need it most. You can't tell which clients are truly profitable. You can't spot a cash flow gap before it becomes a crisis. BELAY's outsourced accounting team changes that.
Acima temos o anunciante da News dessa semana 🚀 Se puder, clique no link do anunciante acima para deixar seu apoio (é grátis!) ❤️Toda semana aparece uma nova ferramenta prometendo o mesmo final feliz: “coloque um agente para trabalhar por você.”
Claude Code. Codex. OpenClaw. Hermes. Cursor. MCPs. Subagents. Skills. Gateways. Crons.
A tentação é transformar tudo numa pergunta de torcida: qual é melhor?
Essa é a pergunta errada.
A pergunta certa é: qual camada da sua operação você quer melhorar agora?
Porque um agente de código, um orquestrador multi-canal e um assistente pessoal com memória não são versões diferentes da mesma coisa. Eles são peças diferentes de uma arquitetura.
Quando você trata tudo como “IA que faz tarefa”, acaba escolhendo ferramenta por hype e depois se frustra porque ela não resolveu um problema para o qual nunca foi desenhada.
A tese desta edição é simples:
Claude Code e Codex resolvem sessões.
OpenClaw organiza canais e fluxos.
Hermes constrói continuidade operacional.
E se você quer uma IA que trabalhe por você de verdade, precisa entender essa diferença antes de sair plugando autonomia na sua empresa.
O erro: comparar ferramenta por demo
Demos enganam porque quase toda demo boa acontece dentro de uma sessão limpa.
O agente recebe um objetivo. Lê alguns arquivos. Executa comandos. Faz uma mudança. Mostra o resultado.
Isso é impressionante e útil.
Mas operação real não é uma sessão limpa. Operação real tem preferência, exceção, histórico, canal, agenda, tarefa recorrente, cliente com contexto, decisão antiga, regra de segurança, tom de voz, fonte de verdade e limite de autonomia.
Então a pergunta deixa de ser “esse agente consegue fazer X?” e vira:
esse sistema sabe quando deve fazer, como deve fazer, onde buscar contexto, o que não pode tocar e como aprender com a correção?
Essa é a fronteira que separa agente de ferramenta.
Três categorias, três trabalhos diferentes
1. Claude Code e Codex: força máxima dentro da sessão
Claude Code e Codex são excelentes para trabalho de desenvolvimento.
Eles entram no repositório, leem contexto, editam arquivos, rodam testes, explicam diffs, integram com MCPs e aceleram muito a execução técnica. Se o seu problema é “implemente essa feature agora nesse repo”, eles provavelmente são a primeira escolha.
Mas o centro de gravidade deles é a sessão de trabalho.
Você abre, dá o objetivo, acompanha, revisa, fecha. Eles podem usar arquivos de instrução, memória de projeto e histórico, mas o produto mental que eles vendem é: resolver muito bem uma tarefa delimitada agora.
Isso é valioso. Só não confunda com sistema operacional pessoal.
2. OpenClaw: malha de canais e orquestração
OpenClaw aponta para outro problema: coordenar canais, ferramentas, skills e fluxos de agente em uma estrutura mais ampla.
É uma camada forte para quem quer montar uma operação multi-agente/multi-canal, com mais superfície de controle e experimentação. O centro aqui não é “editar um arquivo melhor”, mas construir uma malha por onde agentes, canais e tarefas circulam.
Para times técnicos, isso é poderoso. Mas poder vem com custo: mais arquitetura, mais escolhas, mais responsabilidade operacional.
3. Hermes: continuidade pessoal e learning loop
Hermes entra por outro ângulo.
A pergunta dele não é apenas “como executo uma tarefa?” nem “como coordeno canais?”. A pergunta é:
como transformo uso diário em aprendizado reutilizável?
É por isso que a combinação importa:
Telegram/gateway: o agente vive onde a operação acontece, não só no terminal.
Memória: preferências, limites e fatos duráveis deixam de ser reexplicados.
Session search: decisões antigas podem ser recuperadas sem depender da sua lembrança.
Skills: procedimentos viram playbooks reutilizáveis.
Crons/webhooks: rotinas deixam de depender de você lembrar de chamar.
Alma/persona: o agente carrega um modo de operar, não apenas um prompt solto.
O diferencial não é “Hermes faz tudo melhor”. Seria uma promessa fraca.
O diferencial é: cada correção pode virar melhoria do sistema.
Você corrigiu o tom de uma newsletter? Isso pode virar ajuste de skill. Você explicou que produção só roda com aprovação literal? Isso vira regra operacional. Você ensinou que Todoist é fonte de verdade para tarefas e Garden/GBrain para conhecimento? Isso deixa de ser briefing repetido e passa a ser infraestrutura.
Esse é o learning loop.
A arquitetura mínima para começar sem se machucar
O erro comum é pular direto para autonomia.
“Vou colocar um agente no Telegram com acesso a tudo e deixar ele resolver.”
Não faça isso.
O setup seguro começa menor:
1. Um canal humano: Telegram
Comece com um gateway simples. Telegram é suficiente.
A vantagem não é glamour. É fricção baixa. Você consegue pedir, corrigir, aprovar e observar no mesmo lugar onde a vida já acontece.
Mas no início, o canal deve ser principalmente interface de decisão, não braço autônomo sem freio.
2. Uma alma explícita
Antes de ferramentas, defina comportamento.
Como o agente deve falar? O que ele nunca deve assumir? Quando deve discordar? Quais fontes de verdade deve respeitar? O que é perigoso demais para executar sem aprovação?
Isso parece detalhe, mas é fundação. Sem alma, o agente vira um funcionário brilhante sem cultura.
3. Três skills, não trinta
Não tente documentar a empresa inteira no começo.
Escolha três processos recorrentes:
criar newsletter;
revisar PR;
resumir dia/projeto.
Transforme cada um em skill curta, com gatilhos, passos, erros comuns e critérios de pronto.
A primeira vitória não é automação total. É não precisar explicar o mesmo processo pela quinta vez.
4. Modo read-only primeiro
No começo, o agente deve consultar, sintetizar e propor.
Não deletar. Não publicar. Não fazer deploy. Não mandar mensagem externa sem aprovação.
A confiança vem de evidência: fonte usada, raciocínio, próximo passo, risco.
Quando ele acerta repetidamente em modo read-only, você libera ações pequenas. Depois ações maiores. Autonomia é um dimmer, não um interruptor.
Onde isso muda o jogo
A maioria das pessoas quer “um agente”.
Mas o valor real aparece quando o agente começa a carregar contexto entre semanas.
Não como uma memória mágica e perfeita. Como um sistema auditável:
preferências ficam salvas;
procedimentos melhoram;
decisões antigas são buscáveis;
erros viram atualização de playbook;
rotinas passam a rodar sem depender da sua lembrança;
canais viram interface operacional.
Isso muda a relação com IA.
Você para de pensar: “qual prompt eu mando agora?”
E começa a pensar: “qual parte da minha operação deveria aprender com essa interação?”
Essa pergunta é muito mais poderosa.
Como você avalia a newsletter de hoje?Sua resposta será utilizada para guiar os próximos conteúdos. |
Faça Login ou Inscrever-se para participar de pesquisas. |
Para aprofundar
Hermes Agent Docs — arquitetura de memória, skills, gateway e automações: hermes-agent.nousresearch.com
Hermes Agent GitHub — runtime open source: github.com/NousResearch/hermes-agent
Claude Code Docs — referência para sessões de coding: code.claude.com/docs
Codex CLI — agente local da OpenAI para desenvolvimento: developers.openai.com/codex/cli
GBrain / LLM Wiki — knowledge compounding para agentes: github.com/garrytan/gbrain e Karpathy LLM Wiki
Forte abraço,
Equipe Olympus.

