Responsabilidades
Projetar e implementar a arquitetura de Data Lake corporativo utilizando Microsoft Fabric (OneLake, Lakehouse, Warehouse, Data Factory, Notebooks e Real-Time Analytics).
Definir e aplicar o modelo de zonas do Data Lake (Bronze, Silver, Gold / Medallion Architecture), padrões de ingestão, particionamento, catalogação e ciclo de vida dos dados.
Desenhar e manter pipelines de ingestão e transformação a partir de múltiplas fontes: SQL Server (on-premises e Azure SQL), APIs REST e SOAP, arquivos planos (CSV, Parquet, JSON, XML) e sistemas legados.
Modelar dados para consumo analítico (modelagem dimensional, star schema) e habilitar dashboards em Power BI, incluindo semantic models, DAX, RLS e governança de workspaces.
Implementar e evoluir pipelines de CI/CD para todos os artefatos de dados (notebooks, pipelines Fabric, datasets Power BI, scripts SQL) usando Azure DevOps ou GitHub Actions.
Garantir que todo código e configuração esteja versionado em Git, com branching strategy clara (GitFlow, trunk-based ou similar), pull requests, code review obrigatório e testes automatizados.
Aplicar Infraestrutura como Código (IaC) com Terraform ou Bicep para provisionar recursos de dados no Azure.
Estabelecer práticas de DataOps: testes de qualidade de dados automatizados, monitoramento, alerting, observabilidade de pipelines e SLAs.
Definir e implementar governança de dados, qualidade, linhagem e segurança (incluindo Microsoft Purview quando aplicável).
Atuar como referência técnica, conduzindo code reviews, mentorias e definições arquiteturais junto ao time de Engenharia de Dados e BI.
Avaliar custos, performance e capacidade do Fabric (F SKUs), otimizando consumo de forma contínua.
Requisitos Técnicos Obrigatórios
Experiência prática com Microsoft Fabric: OneLake, Lakehouse, Data Factory (pipelines e dataflows Gen2), Notebooks (PySpark/Spark SQL), Warehouse e Direct Lake.
Domínio de Power BI: modelagem semântica, DAX, Power Query (M), workspaces, deployment pipelines, RLS e modos de conectividade (Import, DirectQuery, Direct Lake).
Experiência sólida com SQL Server (T-SQL avançado, stored procedures, tuning, integração com ADF/SSIS).
Integração com APIs REST e serviços SOAP/WSDL, incluindo autenticação (OAuth 2.0, API Key, Basic Auth, certificados) e tratamento de payloads JSON/XML.
Sólido conhecimento em formatos analíticos: Delta Lake / Parquet.
Linguagens SQL e Python (PySpark) para processamento de dados.
Cultura e prática DevOps consolidadas:
Versionamento com Git (branching, merge, rebase, pull requests).
CI/CD com Azure DevOps Pipelines ou GitHub Actions aplicado a projetos de dados.
Automação de deploys de artefatos Fabric e Power BI (via APIs REST do Fabric, fabric-cli ou similares).
Testes automatizados para pipelines e qualidade de dados.
Conhecimento em governança, LGPD e segurança (criptografia, mascaramento, controle de acesso).
Requisitos Desejáveis
Infraestrutura como Código com Terraform ou Bicep para recursos Azure.
Experiência com Azure Data Factory, Azure Synapse ou Databricks.
Vivência com Microsoft Purview para catalogação e linhagem.
Conhecimento em mensageria (Event Hubs, Service Bus, Kafka) e orquestração (Airflow).
Familiaridade com modelagem Data Vault 2.0 ou Kimball.
Observabilidade de dados (Monte Carlo, Great Expectations, dbt tests ou similares).
Certificações Microsoft: DP-600, DP-203 ou PL-300.
Soft Skills
Comunicação clara com times técnicos e áreas de negócio.
Mentalidade de automação: se foi feito duas vezes, deve ser automatizado.
Visão arquitetural e pensamento de longo prazo.
Autonomia, proatividade e foco em entrega contínua de valor.
Capacidade de mentoria e liderança técnica.
Formação
Requisitos:
Graduação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.
Inglês técnico para leitura de documentação.