A

Site Reliability Engineer (SRE) Sênior - Observabilidade

ASAASvia LinkedIn
RemotoBrazilSêniorCLT20 dias atrás

Salário Estimado

R$ 11.700,00 - R$ 17.550,00

Descrição da Vaga

Se você tem paixão por inovação e busca trabalhar em um ambiente ágil, colaborativo e desafiador, esta pode ser a sua oportunidade!O time de Cloud do Asaas está buscando uma pessoa especializada em Observabilidade para garantir visibilidade completa e proativa da nossa plataforma.


Você será fundamental na construção e evolução da nossa estratégia de observabilidade, trabalhando com os três pilares: métricas, logs e traces.


Como SRE Sênior com foco em Observabilidade, você será responsável por implementar e evoluir nossas soluções de monitoramento, garantindo que nossos times tenham as informações necessárias para tomar decisões rápidas e assertivas.


Sua expertise em ferramentas como Prometheus, Grafana, OpenTelemetry e práticas de SRE será essencial para garantir a confiabilidade e performance da nossa plataforma.


Qualidade e observabilidade são fundamentais para atender mais de 230 mil clientes! Se você compartilha dessa visão, junte-se ao nosso time!Se interessou pela oportunidade mas não reside em Joinville? Não tem problema, possibilitamos o trabalho remoto/home office.


Responsabilidades e atribuiçõesProjetar, implementar e evoluir a plataforma de observabilidade da empresa, cobrindo os três pilares: métricas, logs e traces;Implementar e manter stacks de observabilidade;Definir e implementar padrões de instrumentação para aplicações e infraestrutura;Criar dashboards estratégicos e operacionais que forneçam insights acionáveis para os times;Definir, monitorar e gerenciar Indicadores de Nível de Serviço (SLIs) e Objetivos de Nível de Serviço (SLOs), gerenciando os orçamentos de erros (Error Budgets);Implementar sistemas de alertas inteligentes, reduzindo ruído e focando em alertas acionáveis;Colaborar com times de desenvolvimento para melhorar a observabilidade das aplicações, promovendo práticas de instrumentação;Liderar a resposta a incidentes do ponto de vista de observabilidade, garantindo rápida identificação de root cause;Realizar análises post-mortem detalhadas e propor melhorias baseadas em dados de observabilidade;Promover e disseminar a cultura de observabilidade e melhores práticas de SRE na organização;Planejar e executar estratégias de gerenciamento de capacidade baseadas em métricas;Otimizar custos e performance das soluções de observabilidade em escala;Automatizar processos de coleta, processamento e visualização de dados de observabilidade;Documentar arquiteturas, runbooks e procedimentos relacionados a observabilidade.


Requisitos e qualificaçõesExperiência sólida em implementação e gestão de plataformas de observabilidade em escala;Conhecimento profundo em Prometheus (ou Datadog), incluindo PromQL, service discovery, federation e remote write;Experiência avançada com Grafana para criação de dashboards, métricas e alertas, além de vivência com ferramentas de gestão de incidentes (PagerDuty, Incident.io e JSM);Experiência com OpenTelemetry para instrumentação de aplicações;Conhecimento em soluções de logging em escala (Loki, ELK Stack, CloudWatch Logs);Conhecimento em distributed tracing (Jaeger, Tempo, X-Ray) e correlação entre métricas, logs e traces;Experiência com Cloud Computing, especialmente AWS;Experiência com containers (Docker) e orquestração (Kubernetes, ECS);Experiência prática com Infraestrutura como Código (IaC), especialmente AWS CDK ou Terraform;Conhecimento em práticas de SRE, incluindo SLIs, SLOs, Error Budgets e Toil Reduction;Proficiência em linguagens de scripting (Python, Bash) e pelo menos uma linguagem de programação (Go, Java);Capacidade de construção de ferramentas internas e CLIs para automação;Entendimento de sistemas Linux e suas ferramentas de diagnóstico;Experiência em gerenciamento de incidentes e processos de post-mortem.


Informações adicionaisDiferenciaisExperiência em fintechs ou ambientes regulados;Certificações AWS (DevOps Engineer, Solutions Architect);Experiência com Grafana Mimir para métricas em escala;Conhecimento em Thanos para alta disponibilidade de Prometheus;Experiência com APM tools (Datadog, New Relic, Dynatrace);Conhecimento em eBPF para observabilidade de baixo nível;Conhecimento em Machine Learning aplicado a AIOps e detecção de anomalias;Experiência com Chaos Engineering e testes de resiliência;Conhecimento aprofundado em redes e protocolos (TCP/IP, DNS, HTTP/S);Proficiência com Git, GitHub e GitFlow;Vivência prática com metodologias ágeis (Scrum, Kanban);Experiência com bancos de dados relacionais (PostgreSQL, MySQL) e NoSQL (MongoDB, DynamoDB, Redis).


Modelo de trabalho:Carga horária flexível de 8h por dia (segunda a sexta);Contratação CLT.

Vagas Semelhantes

S

SRE / DevOps Sênior

SegwareLinkedIn
RemotoBrazil9 dias atrás

R$ 11k - 17k/mês

SêniorCLT

Na Segware, lideramos o mercado de soluções em software para centrais de monitoramento. Nossa missão é clara: impulsionar o crescimento dos nossos clientes enquanto construímos um mundo mais seguro.Somos apaixonados por inovação. Com tecnologia de ponta, oferecemos soluções que abrangem desde monito...

Rio de Janeiro2 dias atrás

R$ 14k - 21k/mês

SêniorCLT

Intelie is an operational-AI software company best known for its flagship platform, Intelie LIVE®, which combines real-time analytics, predictive modeling, automation, and visual dashboards to help industrial operations transform system and sensor data into actionable insights. Used globally across ...

São Paulo3 dias atrás

R$ 15k - 23k/mês

SêniorCLT

📢 Join Novibet as a DevOps Engineer at our Brazilian HQ in São Paulo!Are you ready to take on a key role in a dynamic, fast-growing company? If you have a passion for DevOps Engineering and thrive in a fast-paced environment, this could be the right opportunity for you.Who We AreFounded in 2010, No...

HTC Global Services - Vaga Sr. AI/Machine Learning Engineer

Sr. AI/Machine Learning Engineer

HTC Global ServicesLinkedIn
RemotoRemoto8 dias atrás

R$ 10k - 15k/mês

PlenoCLT

Job Title: AI/ML Software Engineer Overview / Summary The AI/ML Software Engineer will design and build software tools that incorporate AI/ML techniques to automate narrowly defined tasks, assist internal users, and improve external user interactions. This role involves developing solutions such as ...

Interessado nesta vaga?

Candidatar-se

Você será redirecionado para o site original

Informações

NívelSênior
ContratoCLT
LocalBrazil
RemotoSim
MoedaBRL
Publicada20 dias atrás
FonteLinkedIn

Análise de Vaga com IA

Estimativa salarial, match de tecnologias e análise de requisitos feitos com Inteligência Artificial

Quer se preparar melhor? Pratique entrevistas com IA no Recrutadoria ou melhore suas habilidades no BitMentor

← Voltar às Vagas