- Realizar o monitoramento proativo e reativo de sistemas, redes, servidores e aplicações, identificando anomalias e incidentes.
- Atuar diretamente na resolução de incidentes de alta complexidade (N3), investigando a causa raiz e implementando soluções.
- Desenvolver e otimizar scripts e ferramentas para automação de tarefas de monitoramento e resposta a incidentes.
- Configurar e gerenciar sistemas de monitoramento (e.g., Zabbix, Nagios, Prometheus, Grafana), criando dashboards e alertas.
- Elaborar e manter documentação técnica detalhada sobre procedimentos operacionais, runbooks e topologias de rede.
- Colaborar com equipes de infraestrutura, desenvolvimento e segurança para garantir a estabilidade e performance dos serviços.
- Participar da análise de desempenho e capacidade, propondo melhorias e otimizações para a infraestrutura.
- Experiência comprovada (mínimo de 3 anos) em operações de NOC/SOC e monitoramento de infraestrutura de TI.
- Proficiência avançada em sistemas de monitoramento (Zabbix, Nagios, Prometheus, Grafana, ELK Stack).
- Conhecimento sólido em sistemas operacionais Linux (Red Hat, CentOS, Ubuntu) e Windows Server.
- Habilidade em scripting com Shell Script, Python ou PowerShell para automação de tarefas.
- Familiaridade com conceitos de rede (TCP/IP, Roteamento, Firewall, VPN) e ferramentas de diagnóstico de rede.
- Experiência em análise de logs e métricas de sistemas e aplicações para identificação de problemas.
- Certificações em Linux (LPIC, RHCSA), ITIL ou outras relevantes para infraestrutura e monitoramento são um diferencial.
- Zabbix
- Prometheus/Grafana
- Linux (Shell Script)
- Python
- Rede TCP/IP
- Análise de Logs
- Troubleshooting
- Cloud Computing (AWS/Azure)
- ITIL
CLT
Vale Alimentação, Vale Transporte, Plano de Saúde, Plano Odontológico, Seguro de Vida, TotalPass
Corporativo