A Magalu Cloud é a plataforma de serviços de computação em nuvem criada pela maior e mais inovadora empresa de varejo do país, a Magazine Luiza. Nascemos em 2020, com o propósito claro: Impulsionar a competitividade do Brasil através da tecnologia. Oferecemos serviços de nuvem hyperscale com engenharia local, interface descomplicada, preços em reais abaixo do mercado, suporte em português tornando a nuvem mais acessível a todos.
Como SRE de Produtos de Infraestrutura, você será o guardião da fundação da nossa Cloud. Seu foco será garantir que os serviços de Compute (Virtual Machines, Block Storage, Imagens) e Network (Load Balancing, DNS, VPC) operem com alta disponibilidade. Você usará engenharia para automatizar processos e garantir que a escala não gere sobrecarga manual (toil).
Gestão e Resposta a Incidentes: Atuar ativamente na mitigação e resolução de incidentes críticos dos produtos de Compute e Networking, servindo como ponto focal técnico para o time de RCC.
Construção de Post-mortems: Liderar a análise técnica após incidentes críticos, redigindo documentos de Post-mortem com foco em causa raiz e planos de ação preventivos, promovendo uma cultura blameless.
Engenharia de Software para Infraestrutura: Desenvolver ferramentas, APIs internas e automações para otimizar a operação dos produtos de Cloud.
Infraestrutura como Código (IaC): Desenvolver e manter módulos de infraestrutura utilizando Terraform e pacotes Helm.
Observabilidade: Configurar monitoramento focado nos Golden Four Signals (Latência, Tráfego, Erros e Saturação).
Gestão de SLOs: Definir e monitorar SLIs e SLOs claros para os serviços de Compute e VPC.
PRR (Production Readiness Review): Realizar revisões críticas antes de novos serviços entrarem em produção.
Redução de Toil: Identificar tarefas manuais recorrentes e eliminá-las através de engenharia.
Experiência prévia em Desenvolvimento de Software: É mandatório ter atuado no ciclo de desenvolvimento, com domínio de algoritmos, estruturas de dados e boas práticas de código (DD, Clean Code, Code Review).
Domínio de Linguagens: Fluência em Python ou Go para criação de automações e ferramentas.
Linux & Redes: Experiência sólida com administração Linux e protocolos de rede (TCP/IP, DNS, Routing).
Cloud Native: Domínio em Kubernetes e ferramentas de IaC (Terraform).
Virtualização: Conhecimento em tecnologias como Incus, LXD ou KVM.
Esta posição exige disponibilidade para atuação 24x7 em modelo de rodízio:
Resposta a Incidentes: Atuação direta no fluxo de "bombeiro" para sustentação dos produtos da Squad.
Regime de Sobreaviso (Plantão): Participação em escala semanal para incidentes críticos fora do horário comercial.
Aqui na Magalu Cloud, acreditamos em pessoas que constroem junto e promovem um ambiente de aprendizado e inovação constante. Se você se identifica com esse perfil, queremos te conhecer! Valorizamos autonomia, responsabilidade e entregas ágeis, com um ambiente colaborativo e sem burocracia. Nosso ritmo é acelerado, mas equilibramos qualidade e planejamento.
Valorizamos também a diversidade e a inclusão em todas as nossas vagas. Aqui na Magalu Cloud, todas as pessoas são bem-vindas – independentemente de gênero, raça, orientação sexual, deficiência ou qualquer outra característica.
Se encaixa no perfil? Venha fazer parte do nosso time!