Agendar Consultoria

Consultoria em Cloud, DevOps e Infraestrutura AWS

Conta AWS sob controle, Kubernetes estável e arquitetura serverless que escala

Conta AWS virou caixa preta de gasto. Cluster EKS funciona porque ninguém mexe. Pipeline de deploy aguarda alguém ter coragem. Tem caminho melhor, e geralmente começa por medir antes de cortar.

Leonardo Rifeli - Consultor em Cloud & DevOps

Quando contratar consultoria em cloud e DevOps

A conta AWS estourou orçamento e ninguém explica onde tá indo o gasto. O time financeiro pediu relatório de TCO e o time técnico mandou print de Cost Explorer. A pergunta certa ainda não foi feita.

EKS subiu funcionando, mas tá sem network policies, sem observabilidade decente, sem cost allocation por namespace. Qualquer atualização de versão gera ansiedade no time, e o cluster virou intocável.

A stack serverless cresceu organicamente. Lambdas viraram spaghetti com IAM frouxo, Step Functions monstruosas que ninguém quer abrir, EventBridge sem schema registry. O custo subiu, a confiança caiu.

Compliance (LGPD, ISO 27001, SOC 2) cobrou governança de infra. O time não sabe por onde começar, e o auditor já marcou data. Você precisa de alguém que conheça AWS Config, GuardDuty, Security Hub e que tenha visto isso na prática.

O que entrego

Infra previsível, observada e com custo defensável

Diagnóstico de conta AWS

Auditoria cobrindo custo, segurança e resiliência. Identifica gasto desnecessário, gaps de IAM, single points of failure e dívida operacional. Saio com plano priorizado por impacto.

Estabilização de EKS

Network policies, IRSA, autoscaling honesto, cost allocation por namespace, observabilidade com Prometheus ou CloudWatch e plano de atualização sem surpresa.

Arquitetura serverless

Lambda, Step Functions, EventBridge, SQS e API Gateway com padrões idiomáticos. Refactor de Lambda spaghetti em workflows orquestrados, com retry e observabilidade.

Terraform e CDK modulares

Estrutura multi-account com módulos reutilizáveis, padrões de tag, environment promotion. Pipeline de IaC com plan visível em PR e drift detection em produção.

Observabilidade e SLOs

Métricas, logs e traces correlacionados via OpenTelemetry, Datadog ou stack CloudWatch. SLOs definidos com error budget, alerta baseado em sintoma, não em causa.

FinOps e otimização

Alocação de custo por unidade de negócio, alertas inteligentes (não só por valor absoluto), Savings Plans, otimização de Spot, sizing baseado em uso real.

Casos típicos

Padrões que aparecem com mais frequência na fila

Migração e modernização

On-prem → AWS EC2 → EKS Monolito → serverless Refactor incremental

Segurança e compliance

IAM least privilege AWS Config GuardDuty + Security Hub Auditoria pra LGPD

Plataforma interna

Golden path pra serviços Backstage e catálogo GitOps com ArgoCD Self-service controlado

FinOps na prática

Cost allocation por tag Anomaly detection Rightsizing Spot em batch

Como funciona

O primeiro passo é uma conversa de 30 minutos sem custo. Entendo a stack atual, a conta AWS, o time de operação e a urgência. No fim digo se faz sentido seguir ou se você precisa de outro perfil.

Se faz sentido, mando proposta com escopo, prazo e valor em até 48 horas. Engajamento por projeto fechado entre duas e doze semanas, ou pacote mensal pra acompanhamento contínuo do ambiente.

Trabalho remoto, com acesso somente-leitura na conta do cliente pra diagnóstico, e acesso de execução escopado quando há entrega de código IaC. Tudo via Terraform Cloud, GitHub Actions ou pipeline do cliente.

Perguntas frequentes

As que mais aparecem no primeiro contato

Kubernetes ou serverless?

Depende do perfil de carga, do time e do roadmap. Serverless brilha em workload spiky com baixa duração e times pequenos sem operação de cluster. Kubernetes faz sentido pra workload contínua, controle fino de runtime, multi-tenant complexo ou quando o time já opera EKS. A escolha errada custa caro: serverless mal usado vira fatura imprevisível, Kubernetes mal operado vira incident permanente.

Aurora vale a pena versus RDS PostgreSQL?

Aurora paga em throughput, resiliência, leitura horizontal e tempo de failover. Em workload pequeno, RDS PostgreSQL é mais barato e suficiente. A transição faz sentido quando volume de escrita supera o que uma instância RDS bem provisionada aguenta, ou quando o SLA exige failover sub-minuto. Migrar antes de precisar gera custo sem retorno.

Multi-account ou single account na AWS?

Multi-account com AWS Organizations é o padrão pra qualquer empresa séria. Isolamento de blast radius, separação prod/staging/dev/security, billing por unidade de negócio e compliance ficam tratáveis. Single account funciona pra POC ou empresa muito pequena, mas migrar depois é doloroso. Organização bem feita desde cedo economiza meses no futuro.

Como reduz custo de AWS sem quebrar nada?

Em camadas. Primeiro elimina o óbvio: instâncias zumbi, EBS órfão, snapshot antigo, NAT Gateway desnecessário. Depois ajusta sizing com base em métricas reais, não no padrão. Em seguida revê arquitetura: workload batch em Spot, leitura em read replica, cache estratégico. Por último negocia Savings Plans ou Reserved Instances. Cortar 20% a 40% no primeiro mês é comum, sem regressão.

Trabalha com GCP ou Azure também?

Profundidade maior em AWS, onde rodo workload em produção há mais de uma década. Atendo projetos em GCP (GKE, Cloud Run, BigQuery) e Azure (AKS, Functions, Cosmos DB) quando o cliente já tem investimento, mas com curva de adaptação inicial. Pra projetos multicloud, deixo isso explícito na proposta e ajusto a equação.

Quer um diagnóstico da sua conta AWS?

30 minutos sem custo. Saio com leitura honesta do que tá gastando demais, do que tá frágil e do que vale priorizar.

Agendar Diagnóstico