Que tal trazer seu talento para a Spesia?
A Spesia é a healthtech do Grupo Med4U dedicada ao desenvolvimento de soluções de Inteligência Artificial aplicadas à saúde. Trabalhamos na transformação de dados clínicos em ferramentas reais de apoio à decisão médica, desenvolvendo aplicações inovadoras capazes de impactar diretamente a jornada de cuidado dos pacientes.
Estamos em busca de um(a) Data Engineer (GCP + Databricks) para atuar na evolução da nossa plataforma de dados em saúde. Se você é apaixonado por dados, arquitetura, engenharia de dados em larga escala e quer participar da construção de soluções inovadoras em IA para a saúde, essa oportunidade é para você!
Vaga: Data Engineer (GCP + Databricks)
Modelo de trabalho: Híbrido (3 dias presenciais e 2 remotos)
Local: Unidade Corporativa - Alameda Dom Pedro II, 574 - Batel
Missão do Cargo
Atuar na estruturação, evolução e sustentação da plataforma de dados da Spesia, garantindo a disponibilidade, qualidade, segurança e governança das informações utilizadas em produtos de dados e soluções de Inteligência Artificial aplicadas à saúde.
Principais Responsabilidades
- Projetar, implementar e evoluir arquiteturas de dados utilizando Google Cloud Platform (GCP) e Databricks;
- Estruturar e manter pipelines de ingestão, transformação e disponibilização de dados com foco em escalabilidade, rastreabilidade e qualidade;
- Integrar dados provenientes de prontuários eletrônicos, sistemas hospitalares, bancos de dados relacionais e demais fontes clínicas e administrativas;
- Organizar dados estruturados, semiestruturados e não estruturados para utilização em análises avançadas e aplicações de IA;
- Definir padrões de modelagem, documentação, governança, qualidade e linhagem dos dados;
- Construir datasets, tabelas analíticas e produtos de dados que apoiem modelos preditivos, soluções de IA, dashboards e estudos clínicos;
- Administrar e evoluir o ambiente Databricks, incluindo gestão de permissões, catálogos, monitoramento e otimização de performance;
- Implementar controles de segurança, privacidade e governança de dados em conformidade com a LGPD;
- Trabalhar em parceria com equipes de Ciência de Dados, AI Engineering, Produto, TI e especialistas clínicos;
- Monitorar pipelines e infraestrutura de dados, identificando oportunidades de melhoria contínua;
- Manter documentação técnica atualizada e contribuir para iniciativas de inovação, pesquisa e desenvolvimento.
Requisitos
Formação em Ciência da Computação, Engenharia da Computação, Sistemas de Informação, Engenharia de Software, Engenharia de Dados ou áreas correlatas;
Experiência na construção e sustentação de pipelines de dados em produção;
Domínio de SQL e experiência com Python para engenharia de dados;
Experiência com Apache Spark e processamento distribuído;
Vivência prática com Databricks, incluindo Delta Lake, notebooks e workflows;
Experiência com Google Cloud Platform (GCP), especialmente BigQuery, Cloud Storage e IAM;
Conhecimento de modelagem de dados, Data Lake, Data Warehouse e/ou Lakehouse;
Experiência com bancos de dados relacionais, preferencialmente Oracle ou PostgreSQL;
Conhecimento em governança, qualidade, segurança e observabilidade de dados;
Experiência com ferramentas de orquestração de pipelines.
Diferenciais
Experiência com dados de saúde, prontuários eletrônicos ou sistemas hospitalares, especialmente Tasy;
Conhecimento em padrões de interoperabilidade em saúde, como HL7 FHIR;
Familiaridade com terminologias clínicas como CID-10, SNOMED CT, LOINC e mCODE;
Experiência com Unity Catalog, Delta Live Tables, dbt, Terraform e infraestrutura como código;
Vivência com NLP, dados clínicos não estruturados e preparação de dados para aplicações de IA e LLMs;
Conhecimento em anonimização, pseudonimização e proteção de dados sensíveis;
Experiência com ferramentas de observabilidade como Datadog, Prometheus, Grafana ou ELK;
Certificações em GCP ou Databricks;
Participação em projetos de saúde digital, pesquisa clínica ou Inteligência Artificial aplicada à saúde.
Na Spesia, você terá a oportunidade de atuar diretamente na construção da base de dados que impulsiona soluções inovadoras de Inteligência Artificial para a saúde, contribuindo para produtos que geram impacto real para médicos, equipes clínicas e pacientes.
Quer fazer parte?
Venha construir o futuro da saúde com a gente! ?