Estamos em busca de um(a) profissional para atuar com Ciência de Dados e Engenharia de Machine Learning, sendo responsável por projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud, garantindo escalabilidade, automação e confiabilidade dos processos analíticos.
Essa pessoa atuará em conjunto com times de Data Science, Engenharia de Dados e Produto, contribuindo para evolução da arquitetura de dados, monitoramento de modelos e melhoria contínua dos processos de validação e deploy.
Responsabilidades:
– Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS).
– Integrar dados e métricas de avaliação em fluxos automatizados e auditáveis.
– Modularizar pipelines para facilitar reuso, testes e manutenção.
– Trabalhar em conjunto com times de Data Science, Engenharia de Dados e Produto.
– Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
– Propor melhorias contínuas na arquitetura de dados e nos processos de validação.
– Atuar no monitoramento de modelos, acompanhando performance, drift e custos operacionais.
– Apoiar processos de deploy e sustentação de modelos em produção.
Requisitos:
– Graduação completa em Engenharia, Estatística, Matemática, Análise de Sistemas ou áreas correlatas.
– Experiência com AWS (Glue, S3, SageMaker, Lambda e serviços relacionados).
– Experiência em manipulação de dados e modelagem estatística utilizando Python, SQL e PySpark.
– Experiência sólida em Ciência de Dados.
– Experiência prática com LLMs.
– Vivência com metodologias ágeis.
– Perfil analítico e capacidade de resolução de problemas complexos relacionados a dados.
– Boa comunicação e trabalho em equipe.
Diferenciais:
– Experiência com agentes autônomos.
– Experiência com deploy de modelos em produção.
– Conhecimento em monitoramento de modelos (drift, custo e performance).
– Experiência com Docker, CI/CD e cloud (AWS, GCP ou Azure).
– Conhecimento em versionamento de modelos e experimentos.
Perfil desejado:
– Perfil analítico e orientado a dados.
– Capacidade de atuar em ambientes colaborativos e multidisciplinares.
– Proatividade e foco em melhoria contínua.
– Organização e atenção à qualidade dos processos.
– Facilidade de adaptação a novas tecnologias e desafios.
Informações Adicionais:
– Modelo: Remoto.
– Horário: 09h as 18h.
– Contratação: CLT.