S
LinkedIn

Engenheiro de dados

Stefanini Brasil Brasília, Federal District, Brazil 47 candidaturas 3 dias atrás

Salário estimado

R$ 12k - 17k/mês

Sênior CLT
33%

Score de curadoria

Indicador interno 0 a 100: transparência salarial, stack, descrição útil e sinais de qualidade do anúncio. Não é match com o seu CV.

Descrição da vaga

Texto agregado para leitura rápida. Confira sempre a fonte original ao enviar a candidatura.

Descrição da vaga

Na Stefanini, acreditamos no poder da colaboração. Co-criamos soluções inovadoras em parceria com nossos clientes, combinando tecnologia de ponta, inteligência artificial e a criatividade humana. Estamos na vanguarda da resolução de problemas de negócios, proporcionando impacto real em escala global.


Ao se juntar à Stefanini, você se torna parte de uma jornada global de transformação. Estamos empenhados em criar impacto positivo não apenas nos negócios, mas também na vida de nossos colaboradores. Se você procura uma oportunidade de crescimento profissional em uma empresa que valoriza inovação, respeito, autonomia e parceria, você encontra aqui!

Junte-se a nós e seja parte da mudança!


Modelo de trabalho- Híbrido - DF

#LI-AA2

Responsabilidades e atribuições

Buscamos um(a) Engenheiro(a) de Dados Pleno para atuar na construção e evolução de pipelines de dados voltados à alimentação de soluções de Inteligência Artificial, com foco em RAG (Retrieval-Augmented Generation) e construção de matriz de conhecimento corporativa.

O(a) profissional será responsável por transformar dados estruturados e não estruturados em ativos prontos para consumo por modelos de IA, garantindo qualidade, governança e performance dos dados.


Responsabilidades:

  • Atuar no desenvolvimento de pipelines de ingestão, transformação e enriquecimento de dados para uso em IA
  • Trabalhar com dados estruturados e não estruturados (textos, PDFs, HTML, áudios, entre outros)
  • Implementar processos de chunking, embeddings e indexação vetorial
  • Construir e manter datasets voltados à matriz de conhecimento corporativa
  • Desenvolver pipelines utilizando Databricks (Spark / PySpark)
  • Atuar com arquitetura medalhão (bronze, prata e ouro)
  • Integrar dados com bancos vetoriais (Azure AI Search, pgvector, entre outros)
  • Garantir performance, escalabilidade e confiabilidade dos pipelines
  • Aplicar boas práticas de qualidade de dados (completude, consistência e versionamento)
  • Implementar políticas de atualização, retenção e expurgo de dados
  • Garantir rastreabilidade e auditabilidade dos dados utilizados pelos modelos
  • Atuar em conjunto com times de AI/ML na preparação e otimização de dados
  • Apoiar estratégias de recuperação de informação (RAG)
  • Otimizar dados para melhorar a relevância e precisão das respostas dos modelos

Requisitos e qualificações


Formação

  • Ensino superior completo em Tecnologia da Informação, Engenharia, Sistemas de Informação ou áreas correlatas


Conhecimentos necessários

  • Experiência sólida em engenharia de dados
  • Conhecimento em Python e/ou PySpark
  • Experiência com Databricks e Spark (batch e/ou streaming)
  • Experiência com pipelines de dados (ETL/ELT)
  • Modelagem de dados (Data Lake / Lakehouse)
  • Experiência com dados não estruturados (documentos, textos, etc.)
  • Integração e consumo de APIs


Habilidades técnicas

  • Capacidade de atuar com autonomia na construção de pipelines
  • Conhecimento em arquitetura moderna de dados
  • Experiência com processamento e preparação de dados para IA
  • Atuação em ambientes complexos com múltiplas integrações


Competências comportamentais

  • Capacidade analítica e pensamento estruturado
  • Autonomia e postura investigativa
  • Facilidade para lidar com dados não estruturados
  • Boa comunicação e colaboração com times multidisciplinares


Requisitos desejáveis

  • Experiência com RAG (Retrieval-Augmented Generation)
  • Conhecimento em embeddings e bancos vetoriais
  • Experiência com chunking de documentos
  • Vivência com LangChain ou frameworks similares
  • Conhecimento em OpenAI, Azure OpenAI ou outros LLMs
  • Conhecimento em indexação semântica e busca vetorial
  • Experiência com ingestão de documentos corporativos (PDF, Word, HTML)
  • Vivência com pipelines de dados voltados para IA
  • Experiência em ambientes corporativos complexos ou projetos de grande porte

Vagas relacionadas

Seleção por stack em comum com esta oportunidade

T
LinkedIn
Match59%

Desenvolvedor Fullstack

TWE Rio de Janeiro 25 candidaturas Hoje

Salário estimado

R$ 8k - 12k/mês

Pleno CLT

Estamos em busca de um(a) Desenvolvedor(a) Full Stack Pleno/Senior com experiência em React e Node.js para atuar no desenvolvimento e evolução de aplicações web, participando desde a construção de novas funcionalidades até melhorias de performance, arquitetura e integração entre sistemas. Requisitos...

Ver Detalhes
A
LinkedIn
Match50%

Desenvolvedor(a) Back End

Avanade São Paulo 25 candidaturas Hoje

Salário estimado

R$ 8k - 12k/mês

Pleno CLT

Junte-se a nós na engenharia de software, automatizando sistemas empresariais com tecnologia de ponta e uma forte visão de negócios, moldando o futuro juntos!Bem-vindo ao universo do desenvolvimento Back-End! Aqui você construirá e automatizará funcionalidades empresariais, modelando soluções comple...

Ver Detalhes
G
LinkedIn
Match50%

DESENVOLVEDOR DE SOFTWARE

Grupo Rota Oeste Cuiabá, Mato Grosso, Brazil 25 candidaturas Hoje

Salário estimado

R$ 6k - 9k/mês

Pleno CLT

O Grupo Rota Oeste, com matriz em Cuiabá e filiais em polos estratégicos, construiu solidez e confiança ao longo dos anos através do compromisso com resultados. Pelo On Innovation Hub, nosso ecossistema de inovação nacional, transformamos desafios em soluções concretas, combinando tecnologia de pont...

Ver Detalhes