Buscamos um(a) SRE Sênior com expertise em Dynatrace para atuar na sustentação e evolução de ambientes críticos, garantindo alta disponibilidade, observabilidade e performance das aplicações. Este profissional terá papel estratégico na prevenção de incidentes, análise de desempenho e implementação de práticas de confiabilidade, contribuindo diretamente para a excelência operacional e a experiência dos usuários.
Modelo de trabalho: híbrido (2x por semana presencial) em São Paulo/SP.
Responsabilidades e Atribuições
- Observabilidade e Monitoramento: Administrar e evoluir a plataforma Dynatrace, configurando monitoramentos, dashboards, alertas e integrações para garantir visibilidade completa dos ambientes.
- Gestão de Performance: Monitorar continuamente aplicações, serviços e infraestrutura, identificando oportunidades de melhoria e propondo ações preventivas e corretivas.
- Análise de Incidentes: Atuar na investigação de causas raiz (RCA), mitigação de incidentes críticos e redução de impactos operacionais.
- Confiabilidade de Serviços: Trabalhar em parceria com times de desenvolvimento, operações e infraestrutura para garantir observabilidade e confiabilidade ponta a ponta.
- Automação Operacional: Desenvolver e aprimorar automações por meio de scripts e ferramentas DevOps, aumentando a eficiência dos processos de monitoramento e sustentação.
- Gestão de Indicadores: Apoiar a definição e acompanhamento de SLAs, SLOs e SLIs, promovendo uma cultura orientada a métricas e melhoria contínua.
- Evolução da Prática SRE: Contribuir para a maturidade dos processos de Site Reliability Engineering e para a implementação de boas práticas de confiabilidade.
Requisitos e Qualificações
- Experiência sólida com Dynatrace, incluindo implementação, customização, dashboards, alertas e análise de performance.
- Vivência em ambientes de core bancário e/ou plataforma Matera.
- Experiência em Operações de TI, suporte a aplicações ou infraestrutura.
- Conhecimento em monitoramento de aplicações, logs, métricas e tracing distribuído.
- Familiaridade com sistemas operacionais Linux e/ou Windows, além de conceitos de redes.
- Experiência com automação utilizando PowerShell, Python, Bash ou linguagens similares.
- Atuação em análise e resolução de incidentes, identificação de gargalos de performance e otimização de serviços.
Requisitos Desejáveis:
- Experiência com outras ferramentas de observabilidade, como Prometheus, Grafana, AppDynamics, Elastic Stack ou New Relic.
- Conhecimento em pipelines de CI/CD e ferramentas como Jenkins, GitLab ou Azure DevOps.
- Vivência com containers (Docker, Kubernetes) e ambientes em nuvem (AWS, Azure ou GCP).
- Certificações relacionadas a Dynatrace, SRE ou DevOps.
- Experiência em ambientes ágeis e colaborativos.
O Que Oferecemos
- Ambiente profissional inclusivo, humanizado e focado em bem-estar.
- Squads Motivadas: Atuação com equipes dedicadas a alcançarem metas desafiadoras.
- Programas de acompanhamento técnico e suporte contínuo para o seu desenvolvimento.
- Assistência Médica e Odontológica com cobertura nacional.
- Vale Refeição / Vale Alimentação.
- Ajuda de custo mensal para atuação em Home Office ou modelo híbrido.
- Acesso a plataformas de saúde (Wellhub) e parcerias com descontos exclusivos.
- Seguro de Vida.
Pagamento: R$17.000,00 por mês
Benefícios:
- Assistência médica
- Assistência odontológica
- Auxílio-combustível
- Convênios e descontos comerciais
- Seguro de vida
- Vale-alimentação
- Vale-refeição
- Vale-transporte
Local do trabalho: Remoto híbrido para São Paulo, SP