Você é um apaixonado por negócios e Tecnologia e está em busca de novos desafios? Então, a BMP é o seu lugar! Estamos crescendo cada dia mais e buscando pessoas com espírito de liderança, criativas e atentas à inovação para fazer parte do nosso time. Se você está pronto para fazer parte de um ambiente dinâmico e colaborativo e quer transformar o mercado financeiro, confira os requisitos para a vaga de Site Reliability Engineer - SRE Sr
Sobre a BMP
Somos um Hub de novos modelos de negócios que constrói produtos financeiros e bancários aliados à inovação. Nossas soluções proprietárias e de alta infraestrutura tecnológica atendem a necessidade de cada parceiro de maneira simples, eficiente e segura.
Nossa marca está no centro da revolução financeira, afinal, somos referência em Credit as a Service e o BAAS (Banking As a Service) número 1 do Brasil, com o propósito de transformar o mercado financeiro e construir, junto com os nossos parceiros, o Banco do Futuro.
Principais atividades (Tarefas e Atribuições):
- Definir, implementar e monitorar SLIs, SLOs e error budgets para os sistemas críticos da BMP: PIX, STR, APIs BaaS e integrações regulatórias;
- Construir e evoluir a plataforma de observabilidade da BMP: métricas, logs estruturados, traces distribuídos e dashboards operacionais (OpenTelemetry, Datadog, Grafana ou equivalentes);
- Liderar a resposta a incidentes críticos: diagnóstico, contenção, comunicação de status e condução de post-mortem com blameless culture;
- Construir e manter o programa de on-call: runbooks, escalation policy, alertas calibrados e redução de toil com automação;
- Trabalhar com os times de engenharia para elevar a confiabilidade desde o desenvolvimento: capacity planning, chaos engineering, testes de resiliência e revisão de arquitetura com foco em falha;
- Automatizar tarefas operacionais repetitivas (toil): você não opera manualmente o que pode ser código;
- Garantir que a infraestrutura de produção da BMP atende aos requisitos de disponibilidade do BCB e dos SLAs contratuais com parceiros BaaS;
- Contribuir com a cultura de confiabilidade do time: você não é o único responsável pela disponibilidade — você é quem garante que todo engenheiro também se sente responsável.
Do que você precisa (Requisitos e Qualificações):
- 5+ anos em SRE, DevOps ou engenharia de plataforma com foco em sistemas de alta disponibilidade em produção;
- Domínio de observabilidade distribuída: OpenTelemetry, Datadog, New Relic, Prometheus/Grafana ou equivalentes — você não aceita sistema sem trace;
- Experiência sólida com AWS em nível de operação e confiabilidade: ECS/EKS, RDS, ElastiCache, CloudWatch, Auto Scaling e arquiteturas multi-AZ;
- Domínio de IaC: Terraform, CDK ou equivalente — você não cria recurso de produção no console;
- Experiência com incidentes críticos reais: você já foi o engenheiro de plantão às 2h da manhã e tem post-mortem para mostrar;
- Mentalidade de engenheiro, não de operador: você resolve problema sistêmico com código, não com processo manual.
Informações adicionais:
- Modelo 100% presencial, na Av Paulista;
- Jornada de 2ª a 6ª - das 9h às 18h.
O que oferecemos:
- Salário compatível com o mercado;
- Assistência Médica e Odontológica Notredame;
- Propay - Programa de bem-estar e saúde;
- Ajuda de Custo.
Vem construir o futuro do Mercado Financeiro com a gente. Vem pra BMP!