Estamos procurando um profissional para atuar na sustentação e evolução de sistemas em produção, sendo responsável por garantir a estabilidade, disponibilidade e rápida recuperação das aplicações, apoiando o time na resolução de incidentes complexos e na melhoria contínua do ambiente.
RESPONSABILIDADES E ATRIBUIÇÕES
- Atuar no atendimento e gestão de fila de incidentes e requisições (modeloKanban / ITSM)Investigar, analisar e solucionar incidentes em ambientes produtivos
- Realizar troubleshooting de integrações entre sistemas (APIs, filas, serviços distribuídos), identificando falhas, inconsistências e interrupções de processo
- Analisar logs, métricas e traces para diagnóstico de problemas e identificação de causa raiz
- Apoiar decisões técnicas relacionadas à estabilidade e performance das aplicações
- Garantir a disponibilidade e confiabilidade dos sistemas, atuando com foco em SLA/SLO
- Participar de situações críticas (war room), apoiando na comunicação técnica e resolução rápida de incidentes
- Elaborar e manter runbooks, playbooks e documentação técnica operacional
- Realizar análise de causa raiz (RCA) e propor melhorias estruturais para evitar recorrência de incidentes
- Automatizar tarefas operacionais e respostas a incidentes (scripts, workflows, bots)
- Colaborar com times de desenvolvimento, infraestrutura e produto para evolução contínua dos sistemas
- Revisar códigos e propor melhorias visando estabilidade, performance e manutenibilidade
COMPETÊNCIAS TÉCNICAS
- Experiência sólida (4+ anos) com sustentação ou manutenção de sistemas em produção
- Vivência com atendimento de fila (Kanban) e processos ITSM / ITIL
- Experiência com troubleshooting de aplicações e integrações
- Domínio em análise de logs e investigação de incidentes
- Experiência com monitoramento e observabilidade (logs, métricas e tracing)
- Vivência com ferramentas como Datadog, Grafana, Zabbix ou similares
- Capacidade de definir e ajustar alertas acionáveis
DIFERENCIAIS
- Conhecimento em: linguagens como Node.js, JavaScript, TypeScript, PHP ou Java, frameworks front-end (ex: React.js)
- Manutenção de sistemas corporativos
- Banco de dados - Domínio de bancos relacionais e não relacionais (PostgreSQL, SQL Server, NoSQL)
- Capacidade de análise e troubleshooting em queries
- Infraestrutura
- Conhecimento em arquitetura de sistemas distribuídos
- Experiência com Docker - Vivência com AWS (ou cloud equivalente)
- Experiência com automação de processos operacionais (scripts, workflows, etc.)
BENEFÍCIOS
- Vale Refeição: R$ 840,00 por mês (fixo);
- Vale Transporte;
- Wellhub (Gympass);
- Seguro de vida – Icatu;
- Cartão Desconto (rede de saúde com custo reduzido e descontos em farmácias);
- 30 dias (Licença Remunerada)
- Sul América Saúde - Custeado 100% pela empresa.
❖ Caso queira fazer a inclusão de dependente (cônjuge e/ou filhos) o custo será de 50% do plano (a verificar).
❖ É cobrado 30% de coo-participação sobre consultas e exames;
- Metlife Odontológico - GOLD EPL1 - opcional:
❖ Custeado 50% pela empresa
❖ Caso queira fazer a inclusão de dependente (cônjuge e/ou filhos) o custo será de 75% do plano
❖ Sem desconto de coo-participação