Files
pulse-docs/runbook/RECOVERY-COMMANDS.md
T

1.2 KiB

Comandos de Recuperação — Docker Swarm

Alfabeto de comandos para o Pulse usar quando algo quebrar.

Emergency — todos os serviços down

docker node ls                              # verificar saúde do nó
docker stack rm <stack> && sleep 3           # remover stack problemática
docker swarm init                           # só se necessário
docker stack deploy -c <stack>.yml <stack>  # re-deploy

Serviço específico — forçar restart

docker service ps <stack>_<service>                # ver tasks atuais
docker service update --force <stack>_<service>    # forçar nova task

Limpar containers órfãos

docker ps -a -f "status=exited" --format '{{.Names}}' | xargs -r docker rm -f
docker ps -a -f "status=dead"   --format '{{.Names}}' | xargs -r docker rm -f

Swarm reset (extreme)

docker swarm leave --force && docker swarm init --advertise-addr <ip>

Health check manual de um container

# Status geral
docker inspect --format '{{json .State.Health}}' <container_id> | python3 -m json.tool

# Com health check definido
docker inspect --format '{{.State.Health.Status}}' <container_id>
# → "healthy" | "unhealthy" | "starting"