Atuar no desenvolvimento e evolução do motor de parsing e extração de dados de PDFs de faturas de energia elétrica em um ambiente que envolve o processamento de documentos PDF em larga escala, OCR, parsing estruturado, validação de dados, monitoramento de qualidade e melhoria contínua de performance e estabilidade.
- Desenvolver e manter parsers de documentos PDF
- Criar novos modelos de extração de dados
- Evoluir estratégias de OCR e parsing
- Corrigir falhas e inconsistências de extração
- Melhorar performance e estabilidade do processamento
- Trabalhar com documentos de layouts variados e não padronizados
- Monitorar qualidade dos modelos e taxa de erro
- Desenvolver ferramentas internas para apoio operacional e técnico
- Participar da definição de estratégias técnicas de extração
- Investigar casos complexos de parsing e OCR
- Trabalhar com alto volume de processamento de documentos
- Melhorar pipelines existentes e propor novas abordagens técnicas
- Atuar diretamente na evolução da arquitetura de processamento