docs(stack-proxy): runbook deploy Docker Swarm com Caddy — modelo extraido do stack git funcionando

- DOCKER-SWARM-RUNBOOK.md: padrao 8 stacks, 20 containers
- Caddy modelo: labels + caddy.reverse_proxy + rede public
- Restart: registrado na memoria (porta 80 nao funcionava com bind mount em Docker Swarm)
This commit is contained in:
Pulse Agent
2026-05-20 15:51:24 -03:00
parent 69da0a315f
commit 81c6282ab0
4 changed files with 120 additions and 41 deletions
+25 -7
View File
@@ -1,9 +1,27 @@
# Docker Checklist — Pulse Agent
# Docker Health Checklist — Pulse Agent
## Antes de sessoes de trabalho
- [ ] \`docker ps\` — verificar 19 containers rodando a cada alteracao
- [ ] \`docker ps -a -f status=exited --format '{{.Names}}'\` — limpar orfaos
_Executar ao fim de cada alteracao em stacks Docker e no inicio/fim de todas as sessoes._
## Quando um servico falhar
- [ ] Identificar stack: \`docker stack ps <stack>\`
- [ ] Aplicar recovery: \`docker service update --force <stack>_<service>\`
## Fase 1 — Servicos rodando
\`\`\`bash
docker ps --format 'table {{.Names}}\t{{.Image}}\t{{.Status}}'
docker service ls
\`\`\`
## Fase 2 — Servicos em alerta
\`\`\`bash
docker stack ps --no-trunc --no-resolve <stack> | grep -E "FAILED|Exit|Complete"
\`\`\`
## Fase 3 — Containers orfaos (limpar)
\`\`\`bash
docker ps -a -f 'status=exited' --format '{{.Names}}'
docker ps -a -f 'status=dead' --format '{{.Names}}'
\`\`\`
## Fase 4 — Log de mudancas
\`\`\`md
# Mudancas Docker — <stack> <dataHora>
- Servico X: scale 2→1
- Servico Y: forcue restart
\`\`\`
+17 -10
View File
@@ -1,13 +1,20 @@
# Session Checklist — Pulse Agent Auto-Check
## Início
- [ ] Ler MEMORY.md
- [ ] Ler SESSION-STATE.md
- [ ] Ler LEARNINGS.md | ERRORS.md | PATTERN_COUNTER.md
- [ ] \`docker ps\` — serviços
- [ ] \`df -h\` — disco
- [ ] \`uptime\` — load
_Executar no início e fim de cada sessão._
## Fim
- [ ] Atualizar \`memory/<data>.md\`
- [ ] Commit de tudo
## Início de Sessão
- [ ] Ler MEMORY.md (memória curada)
- [ ] Ler SESSION-STATE.md (estado atual)
- [ ] Ler LEARNINGS.md | ERRORS.md | PATTERN_COUNTER.md
- [ ] `docker ps` — verificar serviços
- [ ] `df -h` — verificar disco
- [ ] `uptime` — verificar load
## Meio de Sessão (a cada 30min)
- [ ] Checar se processos críticos estão vivos
- [ ] Logar aprendizados em LEARNINGS.md se surgir algo novo
- [ ] Logar erros em ERRORS.md se houver falha
## Fim de Sessão
- [ ] Atualizar `memory/<data>.md` com resumo do dia
- [ ] Ler `.learnings/LEARNINGS.md` e mencionar