Estamos em busca de um Cientista de Dados Sênior para fortalecer a agenda de inteligência e analytics avançado na Vertem.
Essa posição terá papel estratégico na construção e operacionalização de modelos de Machine Learning aplicados a problemas reais de negócio, utilizando uma arquitetura moderna de dados baseada em Databricks em ambiente AWS.
O profissional atuará diretamente no desenvolvimento, treinamento, implantação e monitoramento de modelos preditivos, contribuindo para transformar dados em soluções inteligentes que apoiem decisões estratégicas, produtos analíticos e geração de valor para clientes e parceiros.
Buscamos alguém com forte capacidade analítica, domínio técnico em ciência de dados e experiência prática em ambientes modernos de dados e inteligência artificial.
Responsabilidades e atribuições
O Cientista de Dados Sênior será responsável por desenvolver soluções analíticas avançadas e modelos de machine learning que contribuam diretamente para a geração de valor para o negócio.
Entre as principais responsabilidades estão:
Desenvolver, treinar e validar modelos de Machine Learning aplicados a problemas reais de negócio.
Trabalhar com grandes volumes de dados armazenados no Data Lake corporativo em AWS.
Utilizar o ecossistema da plataforma Databricks para experimentação, treinamento e operacionalização de modelos.
Construir pipelines de dados e pipelines de treinamento de modelos.
Utilizar recursos de AutoML do Databricks para acelerar experimentação e geração de modelos.
Realizar feature engineering e preparação de dados para modelos analíticos.
Implementar e manter rotinas de deploy e scoring de modelos de machine learning em produção.
Monitorar performance de modelos, avaliando possíveis degradações e necessidade de re-treinamento.
Trabalhar em conjunto com times de engenharia de dados, BI e produtos de dados para transformar dados em soluções analíticas escaláveis.
Apoiar a evolução da plataforma de inteligência da empresa, contribuindo com boas práticas de ciência de dados e machine learning.
Requisitos:
Experiência técnica
Vivência com Databricks.
Vivência em desenvolvimento de modelos de machine learning supervisionados e não supervisionados.
Conhecimento em AutoML no Databricks.
Vivência em deploy de modelos de machine learning em produção.
Conhecimento em scoring de modelos e pipelines de inferência.
Vivência com feature engineering e preparação de dados para modelos analíticos.
Domínio de Python aplicado à ciência de dados.
Vivência com bibliotecas como:
scikit-learn
XGBoost
LightGBM
Ter atuado com dados em ambientes de Data Lake e Big Data.
Diferenciais:
Vivência com MLflow.
Vivência com monitoramento e governança de modelos de machine learning.
Atuação em projetos de recomendação, segmentação ou modelos de propensão.
Vivência em ambientes de dados em AWS.
Vivência em projetos de analytics avançado e produtos de dados