Descrição da vaga

Texto agregado para leitura rápida. Confira sempre a fonte original ao enviar a candidatura.

Descrição da empresa

A JUIT é uma legaltech (startup do ramo jurídico). Nosso objetivo é otimizar a pesquisa jurídica para operadores do direito, estruturando dados do Judiciário brasileiro em uma plataforma de busca e jurimetria.

Iniciamos nossas atividades em 2018 e desde então já tivemos diversos reconhecimentos, seja em inovação ou na área de tecnologia.


Descrição da vaga

A equipe de Engenharia de Dados da JUIT concentra-se em estruturar e potencializar grandes volumes de dados jurídicos provenientes de múltiplas fontes públicas e privadas. Por meio de arquiteturas robustas, pipelines escaláveis e técnicas avançadas de processamento de dados, o time transforma informações brutas e heterogêneas em ativos confiáveis, estruturados e prontos para geração de valor.

Nossa engenharia atua em todo o ciclo de vida do dado: da coleta e ingestão, passando por tratamento, normalização e enriquecimento, até a disponibilização para produtos, APIs e modelos inteligentes. Trabalhamos continuamente para elevar a qualidade, a consistência e a rastreabilidade das informações, garantindo que cada dado entregue pela JUIT contribua diretamente para decisões mais seguras, eficientes e estratégicas no contexto jurídico.

Estamos em busca de um(a) Engenheiro(a) de Dados para fazer parte do nosso time plataforma de dados.

ATENÇÃO: Candidatos fora do perfil serão ignorados.


O que você fará:

  • Desenvolver e manter pipelines de integração de dados em tempo real e APIs de dados que compõem nossas estruturas de processamento;
  • Garantir a estabilidade e a saúde das pipelines em produção, monitorando filas, investigando e corrigindo falhas nos fluxos de dados, e participando da elaboração de post-mortems com análise de causa raiz e ações preventivas;
  • Implementar esquemas de dados robustos e estratégias de versionamento utilizando Avro e Schema Registry;
  • Colaborar com equipes de engenharia para definir padrões de arquiteturas orientadas a eventos e boas práticas de streaming;
  • Publicar serviços de dados para uso interno e externo de forma escalável e observável;
  • Realizar consultas e análises nos bancos de dados para investigar inconsistências, validar transformações e apoiar o diagnóstico de problemas;
  • Contribuir para a evolução de frameworks de testes e validação, ajudando a garantir a qualidade dos dados processados pelas pipelines;
  • Apoiar a definição e o acompanhamento de métricas de observabilidade (SLA, SLO, SLI), instrumentando o código com telemetria e atuando no monitoramento proativo e no planejamento de recuperação de desastres para garantir a disponibilidade do sistema e a integridade dos dados;
  • Colaborar com o time de segurança para garantir conformidade com políticas de segurança de dados e compliance;
  • Documentar processos, decisões técnicas e o status dos serviços mantidos pelo time.


Requisitos:

  • Formação superior em exatas (Ciência da Computação, Engenharia ou áreas relacionadas);
  • Experiência com desenvolvimento com Apache Kafka (1+ anos);
  • Entendimento sobre otimização de latência, throughput e semântica “exactly-once”;
  • Proficiência no design e implementação de arquiteturas orientadas a eventos;
  • Experiência com Python (2+ anos);
  • Experiência com linguagem SQL (1+ ano);
  • Experiência com MongoDB (ou banco NoSQL orientado a documentos equivalente) com foco em manipulação de documentos (CRUD) e noções de indexação. Não exigimos profundidade de especialista no produto;
  • Experiência com Elasticsearch (ou motor de busca textual equivalente) com foco em ingestão de documentos e cuidado com a governança dos modelos de dados. Não exigimos profundidade de especialista no produto;
  • Sólidos conhecimentos em algoritmos e estruturas de dados;
  • Experiência com Linux em ambiente de trabalho (2+ anos);
  • Conhecimentos em Docker e Kubernetes na perspectiva de quem desenvolve e faz deploy de aplicações (containerização, manifests, troubleshooting de pods). Não é necessária experiência em administração de cluster;
  • Conhecimentos em desenvolvimento orientado a testes (TDD);
  • Conhecimentos em observabilidade e telemetria (métricas, logs e traces);
  • Conhecimentos em Git e versionamento de código;
  • Inglês intermediário (leitura de documentação e comunicação básica).


Diferenciais:

  • Experiência com bancos de dados relacionais (MySQL, PostgreSQL, SQL Server, Oracle, etc);
  • Experiência com OpenTelemetry (instrumentação de código, exporters e collectors);
  • Experiência com bancos de dados vetoriais (Milvus, Weaviate, Qdrant e afins);
  • Experiência com desenvolvimento nas linguagens Golang e/ou Rust;
  • Experiência com pelo menos uma linguagem de programação baseada na JVM (Java, Scala, Clojure, etc.);
  • Experiência com Infraestrutura como Código (Terraform, Pulumi, Chef, Ansible, etc.).


Processo seletivo:

  1. Triagem curricular
  2. Conversa inicial para alinhamento de expectativas (~30 min)
  3. Desafio técnico (take-home)
  4. Entrevista técnica com o time de Engenharia de Dados (~1h)
  5. Retorno do processo seletivo após avaliação interna


Período: Integral

Modelo de trabalho: Remoto


Contato: [email protected]

Vagas relacionadas

Seleção por stack em comum com esta oportunidade

P
LinkedIn
Match35%

Cientista de dados

Projeta Pesquisas de Mercado e Opinião Pública Manaus, Amazonas, Brazil 25 candidaturas Hoje

Salário estimado

R$ 4k - 6k/mês

Júnior CLT

🚀 VAGA – CIENTISTA DE DADOS | MANAUS/AMEstamos buscando um(a) Cientista de Dados com forte capacidade analítica, domínio técnico e experiência no tratamento e interpretação de grandes volumes de dados para apoiar processos estratégicos e tomada de decisão.📍 Local: Manaus – AM (presencial)💰 Remune...

Ver Detalhes
T
Remoto LinkedIn
Match65%

Senior Data Scientist

Trustly São Paulo 83 candidaturas Hoje

Salário estimado

R$ 16k - 23k/mês

Sênior CLT

WHO WE AREAt Trustly, we're building a smarter, faster, and more secure financial future by revolutionizing the world of payments. As a global leader in Open Banking Payments, we are establishing Pay by Bank as the new standard at checkout, providing unparalleled freedom, speed, and ease to millions...

Ver Detalhes
S
LinkedIn
Match35%

Engenheiro de Software Pleno

Serasa Experian São Paulo 200 candidaturas Hoje

Salário estimado

R$ 9k - 13k/mês

Pleno CLT

Company DescriptionA Serasa Experian é a primeira e a maior Datatech do Brasil. Líder em soluções de inteligência para análise de riscos e oportunidades, com foco nas jornadas de crédito, autenticação e prevenção à fraude. Com tecnologia de ponta, inovação e os melhores talentos, transforma a incert...

Ver Detalhes