Escalabilidade¶
Réplicas Horizontais¶
A aplicação é stateless (sessões no Redis, media em volume compartilhado):
O Nginx distribui carga via DNS round-robin entre todas as réplicas do serviço app.
Docker Swarm¶
O docker-compose.swarm.yml configura: - 3 réplicas padrão - Rolling update (1 réplica por vez) - Rollback automático em falha - endpoint_mode: dnsrr para balanceamento
Gargalos Conhecidos¶
| Componente | Limitação | Solução |
|---|---|---|
| FAISS | Índice em disco local | Volume compartilhado entre réplicas |
| SQLite | Locks em escrita | Usar PostgreSQL em produção |
| LLM calls | Latência OpenAI | Cache de respostas (futuro) |