Arvo
InícioSobre a Arvo
Sobre nós
Sobre a ArvoCarreiras
Conteúdos
ArtigosWebinars e WorkshopsEbooks e Cases
Entrar em contato

Cientista de dados Sênior

Sobre a Arvo

Temos o propósito de tornar a saúde no Brasil mais acessível para todos. Nossa jornada começa com o uso de dados e inteligência artificial para reduzir fraudes, abusos e desperdícios em pagamentos de saúde. Acreditamos que a única maneira de alcançar isso é através de um time incrível, com pessoas apaixonadas por saúde e compradas na nossa missão de transformar o setor.

Perfil desejado

Estamos em busca de um Cientista de Dados Sênior para liderar iniciativas de extração e estruturação de informações a partir de documentos estruturados e não estruturados. O profissional será responsável por desenvolver e aprimorar soluções baseadas em Processamento de Linguagem Natural (NLP), Inteligência Artificial Generativa e modelagem de regras como grafos para identificação de entidades e extração automatizada de informações.

Responsabilidades

  • Desenvolver pipelines de NLP/GenAI para extração de informações de documentos de diferentes formatos (PDFs, imagens digitalizadas, documentos estruturados e não estruturados) utilizando extração e reconhecimento de entidades e relacionamentos.
  • Implementar técnicas de IA Generativa para aprimorar a extração de dados.
  • Criar pipelines eficientes para extração, limpeza e estruturação de dados textuais.
  • Desenvolver modelos baseados em grafos para representação e inferência de regras a partir de textos e entidades extraídas.
  • Colaborar com equipes de engenharia de dados e software para integração de modelos em sistemas de produção.
  • Monitorar e avaliar a performance dos modelos, propondo melhorias contínuas.
  • Explorar e implementar técnicas de aprendizado de máquina supervisionado, não supervisionado e auto-supervisionado para extração, enriquecimento e processamento das informações extraídas.

Qualificações Mínimas

  • Formação superior em Ciência da Computação, Engenharia, Matemática, Estatística ou área relacionada.
  • Experiência comprovada em NLP, incluindo técnicas clássicas (regex, TF-IDF, word embeddings) e avançadas (transformers, BERT, GPT, LLMs).
  • Experiência com extração de entidades e modelagem de regras em documentos complexos.
  • Conhecimento em representação de conhecimento usando grafos, como ontologias e frameworks baseados em Graph Neural Networks (GNNs).
  • Experiência com bibliotecas e frameworks como spaCy, NLTK, Stanford NLP, Hugging Face Transformers, OpenAI API, Neo4j, NetworkX.
  • Forte conhecimento em Python e bibliotecas de machine learning (TensorFlow, PyTorch, Scikit-learn).
  • Experiência com bancos de dados relacionais e NoSQL.
  • Familiaridade com técnicas de OCR para extração de texto de imagens e documentos escaneados.

Diferenciais

  • Conhecimento de serviços cloud aplicados ao problema descrito, plus em GCP.
  • Experiência em ferramentas de IA Generativa para NLP, como OpenAI, Hugging Face, ou modelos open-source similares, com utilização de fine tuning e RAG.
  • Experiência com processamento de documentos jurídicos, médicos ou financeiros.
  • Experiência no deploy de modelos de IA escaláveis em ambientes cloud (AWS, GCP, Azure).
  • Experiência com arquiteturas de deep learning aplicadas à NLP.

Descrição da vaga

  • Vaga home office. Mas nos encontramos no início de cada trimestre, para comemorar os avanços alcançados e planejar o próximo trimestre
  • Remuneração competitiva e oportunidade de ganhar stock options
  • Trabalhar com um time estelar, com pessoas ex-Loft, Wildlife Studios, Alice, Bain, Dasa
  • Oportunidade de participar da criação de uma solução que irá revolucionar a forma com que as operadoras brasileiras operam
Candidate-se à vaga

Preencha o formulário abaixo e envie sua candidatura para participar do nosso processo seletivo.

Anexe o seu currículo
Max file size 10MB.
Uploading...
fileuploaded.jpg
Upload failed. Max size for files is 10 MB.
Ao se candidatar, você concorda com a nossa Política de privacidade.
Sua inscrição foi recebida com sucesso!
Ocorreu um problema ao processar sua inscrição.Tente novamente em alguns instantes.
Início
Sobre a Arvo
Política de Privacidade
Assine nossa Newsletter
Arvo Saúde LTDA
CNPJ 45.992.106/0001-57

O nosso site armazena cookies capazes de ler, armazenar, e escrever informações no seu navegador e no seu dispositivo. Utilizamos estas informações para várias finalidades - por exemplo, para fornecer conteúdo, manter a segurança, melhorar os nossos sites e para fins de marketing. Você pode rejeitar todo o processamento não essencial, optando por aceitar apenas os cookies necessários.
Para personalizar a sua escolha e saber mais, clique aqui para ajustar as suas preferências.