Engenheiro de dados

Stefanini Brasil • Brasília, Federal District, Brazil • 47 candidaturas 3 dias atrás

Salário estimado

R$ 12k - 17k/mês

Sênior CLT

33%

Score de curadoria

Indicador interno 0 a 100: transparência salarial, stack, descrição útil e sinais de qualidade do anúncio. Não é match com o seu CV.

Stack

Python Azure HTML IA

Descrição da vaga

Texto agregado para leitura rápida. Confira sempre a fonte original ao enviar a candidatura.

Descrição da vaga

Na Stefanini, acreditamos no poder da colaboração. Co-criamos soluções inovadoras em parceria com nossos clientes, combinando tecnologia de ponta, inteligência artificial e a criatividade humana. Estamos na vanguarda da resolução de problemas de negócios, proporcionando impacto real em escala global.

Ao se juntar à Stefanini, você se torna parte de uma jornada global de transformação. Estamos empenhados em criar impacto positivo não apenas nos negócios, mas também na vida de nossos colaboradores. Se você procura uma oportunidade de crescimento profissional em uma empresa que valoriza inovação, respeito, autonomia e parceria, você encontra aqui!

Junte-se a nós e seja parte da mudança!

Modelo de trabalho- Híbrido - DF

#LI-AA2

Responsabilidades e atribuições

Buscamos um(a) Engenheiro(a) de Dados Pleno para atuar na construção e evolução de pipelines de dados voltados à alimentação de soluções de Inteligência Artificial, com foco em RAG (Retrieval-Augmented Generation) e construção de matriz de conhecimento corporativa.

O(a) profissional será responsável por transformar dados estruturados e não estruturados em ativos prontos para consumo por modelos de IA, garantindo qualidade, governança e performance dos dados.

Responsabilidades:

Atuar no desenvolvimento de pipelines de ingestão, transformação e enriquecimento de dados para uso em IA
Trabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros)
Implementar processos de chunking, embeddings e indexação vetorial
Construir e manter datasets voltados à matriz de conhecimento corporativa
Desenvolver pipelines utilizando Databricks (Spark / PySpark)
Atuar com arquitetura medalhão (bronze, prata e ouro)
Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros)
Garantir performance, escalabilidade e confiabilidade dos pipelines
Aplicar boas práticas de qualidade de dados (completude, consistência e versionamento)
Implementar políticas de atualização, retenção e expurgo de dados
Garantir rastreabilidade e auditabilidade dos dados utilizados pelos modelos
Atuar em conjunto com times de AI/ML na preparação e otimização de dados
Apoiar estratégias de recuperação de informação (RAG)
Otimizar dados para melhorar a relevância e precisão das respostas dos modelos

Requisitos e qualificações

Formação

Ensino superior completo em Tecnologia da Informação, Engenharia, Sistemas de Informação ou áreas correlatas

Conhecimentos necessários

Experiência sólida em engenharia de dados
Conhecimento em Python e/ou PySpark
Experiência com Databricks e Spark (batch e/ou streaming)
Experiência com pipelines de dados (ETL/ELT)
Modelagem de dados (Data Lake / Lakehouse)
Experiência com dados não estruturados (documentos, textos, etc.)
Integração e consumo de APIs

Habilidades técnicas

Capacidade de atuar com autonomia na construção de pipelines
Conhecimento em arquitetura moderna de dados
Experiência com processamento e preparação de dados para IA
Atuação em ambientes complexos com múltiplas integrações

Competências comportamentais

Capacidade analítica e pensamento estruturado
Autonomia e postura investigativa
Facilidade para lidar com dados não estruturados
Boa comunicação e colaboração com times multidisciplinares

Requisitos desejáveis

Experiência com RAG (Retrieval-Augmented Generation)
Conhecimento em embeddings e bancos vetoriais
Experiência com chunking de documentos
Vivência com LangChain ou frameworks similares
Conhecimento em OpenAI, Azure OpenAI ou outros LLMs
Conhecimento em indexação semântica e busca vetorial
Experiência com ingestão de documentos corporativos (PDF, Word, HTML)
Vivência com pipelines de dados voltados para IA
Experiência em ambientes corporativos complexos ou projetos de grande porte

Vagas relacionadas

Seleção por stack em comum com esta oportunidade

Match59%

Desenvolvedor Fullstack

TWE • Rio de Janeiro • 25 candidaturas Hoje

Salário estimado

R$ 8k - 12k/mês

Pleno CLT

Estamos em busca de um(a) Desenvolvedor(a) Full Stack Pleno/Senior com experiência em React e Node.js para atuar no desenvolvimento e evolução de aplicações web, participando desde a construção de novas funcionalidades até melhorias de performance, arquitetura e integração entre sistemas. Requisitos...

JavaScript TypeScript Docker React Azure +5

Ver Detalhes →

Match50%

Desenvolvedor(a) Back End

Avanade • São Paulo • 25 candidaturas Hoje

Salário estimado

R$ 8k - 12k/mês

Pleno CLT

Junte-se a nós na engenharia de software, automatizando sistemas empresariais com tecnologia de ponta e uma forte visão de negócios, moldando o futuro juntos!Bem-vindo ao universo do desenvolvimento Back-End! Aqui você construirá e automatizará funcionalidades empresariais, modelando soluções comple...

GitHub Redis Azure Java

Ver Detalhes →

Match50%

DESENVOLVEDOR DE SOFTWARE

Grupo Rota Oeste • Cuiabá, Mato Grosso, Brazil • 25 candidaturas Hoje

Salário estimado

R$ 6k - 9k/mês

Pleno CLT

O Grupo Rota Oeste, com matriz em Cuiabá e filiais em polos estratégicos, construiu solidez e confiança ao longo dos anos através do compromisso com resultados. Pelo On Innovation Hub, nosso ecossistema de inovação nacional, transformamos desafios em soluções concretas, combinando tecnologia de pont...

Flutter Mobile Azure REST Git

Ver Detalhes →