Site Reliability Engineer (SRE) Sênior - Observabilidade
Salário Estimado
R$ 11.700,00 - R$ 17.550,00
Ótimo
Score da Vaga
Descrição da Vaga
Se você tem paixão por inovação e busca trabalhar em um ambiente ágil, colaborativo e desafiador, esta pode ser a sua oportunidade!O time de Cloud do Asaas está buscando uma pessoa especializada em Observabilidade para garantir visibilidade completa e proativa da nossa plataforma.
Você será fundamental na construção e evolução da nossa estratégia de observabilidade, trabalhando com os três pilares: métricas, logs e traces.
Como SRE Sênior com foco em Observabilidade, você será responsável por implementar e evoluir nossas soluções de monitoramento, garantindo que nossos times tenham as informações necessárias para tomar decisões rápidas e assertivas.
Sua expertise em ferramentas como Prometheus, Grafana, OpenTelemetry e práticas de SRE será essencial para garantir a confiabilidade e performance da nossa plataforma.
Qualidade e observabilidade são fundamentais para atender mais de 230 mil clientes! Se você compartilha dessa visão, junte-se ao nosso time!Se interessou pela oportunidade mas não reside em Joinville? Não tem problema, possibilitamos o trabalho remoto/home office.
Responsabilidades e atribuiçõesProjetar, implementar e evoluir a plataforma de observabilidade da empresa, cobrindo os três pilares: métricas, logs e traces;Implementar e manter stacks de observabilidade;Definir e implementar padrões de instrumentação para aplicações e infraestrutura;Criar dashboards estratégicos e operacionais que forneçam insights acionáveis para os times;Definir, monitorar e gerenciar Indicadores de Nível de Serviço (SLIs) e Objetivos de Nível de Serviço (SLOs), gerenciando os orçamentos de erros (Error Budgets);Implementar sistemas de alertas inteligentes, reduzindo ruído e focando em alertas acionáveis;Colaborar com times de desenvolvimento para melhorar a observabilidade das aplicações, promovendo práticas de instrumentação;Liderar a resposta a incidentes do ponto de vista de observabilidade, garantindo rápida identificação de root cause;Realizar análises post-mortem detalhadas e propor melhorias baseadas em dados de observabilidade;Promover e disseminar a cultura de observabilidade e melhores práticas de SRE na organização;Planejar e executar estratégias de gerenciamento de capacidade baseadas em métricas;Otimizar custos e performance das soluções de observabilidade em escala;Automatizar processos de coleta, processamento e visualização de dados de observabilidade;Documentar arquiteturas, runbooks e procedimentos relacionados a observabilidade.
Requisitos e qualificaçõesExperiência sólida em implementação e gestão de plataformas de observabilidade em escala;Conhecimento profundo em Prometheus (ou Datadog), incluindo PromQL, service discovery, federation e remote write;Experiência avançada com Grafana para criação de dashboards, métricas e alertas, além de vivência com ferramentas de gestão de incidentes (PagerDuty, Incident.io e JSM);Experiência com OpenTelemetry para instrumentação de aplicações;Conhecimento em soluções de logging em escala (Loki, ELK Stack, CloudWatch Logs);Conhecimento em distributed tracing (Jaeger, Tempo, X-Ray) e correlação entre métricas, logs e traces;Experiência com Cloud Computing, especialmente AWS;Experiência com containers (Docker) e orquestração (Kubernetes, ECS);Experiência prática com Infraestrutura como Código (IaC), especialmente AWS CDK ou Terraform;Conhecimento em práticas de SRE, incluindo SLIs, SLOs, Error Budgets e Toil Reduction;Proficiência em linguagens de scripting (Python, Bash) e pelo menos uma linguagem de programação (Go, Java);Capacidade de construção de ferramentas internas e CLIs para automação;Entendimento de sistemas Linux e suas ferramentas de diagnóstico;Experiência em gerenciamento de incidentes e processos de post-mortem.
Informações adicionaisDiferenciaisExperiência em fintechs ou ambientes regulados;Certificações AWS (DevOps Engineer, Solutions Architect);Experiência com Grafana Mimir para métricas em escala;Conhecimento em Thanos para alta disponibilidade de Prometheus;Experiência com APM tools (Datadog, New Relic, Dynatrace);Conhecimento em eBPF para observabilidade de baixo nível;Conhecimento em Machine Learning aplicado a AIOps e detecção de anomalias;Experiência com Chaos Engineering e testes de resiliência;Conhecimento aprofundado em redes e protocolos (TCP/IP, DNS, HTTP/S);Proficiência com Git, GitHub e GitFlow;Vivência prática com metodologias ágeis (Scrum, Kanban);Experiência com bancos de dados relacionais (PostgreSQL, MySQL) e NoSQL (MongoDB, DynamoDB, Redis).
Modelo de trabalho:Carga horária flexível de 8h por dia (segunda a sexta);Contratação CLT.
Vagas Semelhantes
SRE / DevOps Sênior
R$ 11k - 17k/mês
Na Segware, lideramos o mercado de soluções em software para centrais de monitoramento. Nossa missão é clara: impulsionar o crescimento dos nossos clientes enquanto construímos um mundo mais seguro.Somos apaixonados por inovação. Com tecnologia de ponta, oferecemos soluções que abrangem desde monito...
Senior SRE (Site Reliability Engineer) Analyst
R$ 14k - 21k/mês
Intelie is an operational-AI software company best known for its flagship platform, Intelie LIVE®, which combines real-time analytics, predictive modeling, automation, and visual dashboards to help industrial operations transform system and sensor data into actionable insights. Used globally across ...
DevOps Engineer (São Paulo, Brazil)
R$ 15k - 23k/mês
📢 Join Novibet as a DevOps Engineer at our Brazilian HQ in São Paulo!Are you ready to take on a key role in a dynamic, fast-growing company? If you have a passion for DevOps Engineering and thrive in a fast-paced environment, this could be the right opportunity for you.Who We AreFounded in 2010, No...
Sr. AI/Machine Learning Engineer
R$ 10k - 15k/mês
Job Title: AI/ML Software Engineer Overview / Summary The AI/ML Software Engineer will design and build software tools that incorporate AI/ML techniques to automate narrowly defined tasks, assist internal users, and improve external user interactions. This role involves developing solutions such as ...
Informações
Análise de Vaga com IA
Estimativa salarial, match de tecnologias e análise de requisitos feitos com Inteligência Artificial
Quer se preparar melhor? Pratique entrevistas com IA no Recrutadoria ou melhore suas habilidades no BitMentor