Logo

Sr Data Science - IA

Anonymous

Mon, Sep 01, 2025, 11:29 AM

R$20K - R$34K

remotepj5y seniority

Technology

3 years | GenAi

4 years | Python

3 years | TensorFlow

3 years | Pytorch

4 years | Google Cloud Platform (GCP)

4 years | SQL

2 years | OpenAI

4 years | MongoDB

required

Job Description

Estamos em busca de um Cientista de Dados Sênior para liderar iniciativas de extração e 

estruturação de informações a partir de documentos estruturados e não estruturados. O 

profissional será responsável por desenvolver e aprimorar soluções baseadas em 

Processamento de Linguagem Natural (NLP), Inteligência Artificial Generativa e 

modelagem de regras como grafos para identificação de entidades e extração 

automatizada de informações.

Responsibility and Attributions

● Desenvolver pipelines de NLP/GenAI para extração de informações de documentos 

de diferentes formatos (PDFs, imagens digitalizadas, documentos estruturados e 

não estruturados) utilizando extração e reconhecimento de entidades e 

relacionamentos. 

● Implementar técnicas de IA Generativa para aprimorar a extração de dados. 

● Criar pipelines eficientes para extração, limpeza e estruturação de dados textuais. 

● Desenvolver modelos baseados em grafos para representação e inferência de 

regras a partir de textos e entidades extraídas. 

● Colaborar com equipes de engenharia de dados e software para integração de 

modelos em sistemas de produção. 

● Monitorar e avaliar a performance dos modelos, propondo melhorias contínuas. 

● Explorar e implementar técnicas de aprendizado de máquina supervisionado, não 

supervisionado e auto-supervisionado para extração, enriquecimento e 

processamento das informações extraídas. 

Requirements and Qualifications

Formação superior em Ciência da Computação, Engenharia, Matemática, 

Estatística ou área relacionada. 

● Experiência comprovada em NLP, incluindo técnicas clássicas (regex, TF-IDF, word 

embeddings) e avançadas (transformers, BERT, GPT, LLMs). 

● Experiência com extração de entidades e modelagem de regras em documentos 

complexos. 

● Conhecimento em representação de conhecimento usando grafos, como 

ontologias e frameworks baseados em Graph Neural Networks (GNNs). 

● Experiência com bibliotecas e frameworks como spaCy, NLTK, Stanford NLP, 

Hugging Face Transformers, OpenAI API, Neo4j, NetworkX. 

● Forte conhecimento em Python e bibliotecas de machine learning (TensorFlow, 

PyTorch, Scikit-learn). 

● Experiência com bancos de dados relacionais e NoSQL. 

● Familiaridade com técnicas de OCR para extração de texto de imagens e 

documentos escaneados. 

Benefits

Pagamos 22 dias úteis de férias + 1/3

Plano de saúde pago 100% para o colaborador e 70% dependentes

Flash de 1080,00

Additional Information

 Conhecimento de serviços cloud aplicados ao problema descrito, plus em GCP. 

● Experiência em ferramentas de IA Generativa para NLP, como OpenAI, Hugging 

Face, ou modelos open-source similares, com utilização de fine tuning e RAG. 

● Experiência com processamento de documentos jurídicos, médicos ou financeiros. 

● Experiência no deploy de modelos de IA escaláveis em ambientes cloud (AWS, 

GCP, Azure). 

● Experiência com arquiteturas de deep learning aplicadas à NLP. 

Anonymous

Do not waste time and apply for this vacancy! Easy and simple!

Loading...

You are being indicated by

© 2022 - Made with love by Lovel Team. All rights reserved.
LinkedinYouTubeInstagram