Texto agregado para leitura rápida. Confira sempre a fonte original ao enviar a candidatura.
Sua missão
Como Analista de Infraestrutura CloudOps Júnior, você será responsável por apoiar a sustentação e evolução de ambientes em nuvem de alta disponibilidade. Sua missão envolve auxiliar na redução do esforço operacional através de automações básicas, monitorar a resiliência do ambiente e aprender a aplicar conceitos de Inteligência Artificial no dia a dia da operação, sempre com o suporte do time técnico.
Quais serão suas responsabilidades:
- Operação e Suporte à Implementação:
- Auxiliar na operação e deploy de ambientes em nuvem Multicloud (foco inicial em GCP ou AWS).
- Apoiar a administração e monitoramento de clusters Kubernetes (principalmente GKE), acompanhando a escalabilidade e consumo de recursos.
- Executar e validar rotinas de backups regulares e garantir a integridade dos dados para recuperação.
- Executar tarefas de manutenção preventiva sob orientação.
- Coletar dados de capacidade para apoiar o planejamento de recursos do time.
- Observabilidade e Fundamentos de SRE:
- Apoiar o time na aplicação de práticas de Site Reliability Engineering (SRE), acompanhando métricas de SLO, SLA e SLIs.
- Monitorar a observabilidade do ambiente através de logs, métricas e tracing, reportando anomalias.
- Triar problemas de desempenho iniciais e escalar para os níveis superiores quando necessário.
- Seguir runbooks para aplicar soluções conhecidas e evitar interrupções de serviço.
- Automação e Introdução a AIOps:
- Executar, manter e sugerir melhorias em automações operacionais existentes (runbooks e scripts).
- Aprender e interagir com ferramentas de IA/ML utilizadas para detecção de anomalias e redução de ruído de alertas (AIOps).
- Operações de Incidentes e Segurança:
- Atuar em regime de sobreaviso/escala para resposta a incidentes, com o apoio de analistas mais experientes.
- Participar da análise de causa raiz (Post-mortem) para entender falhas e aprender medidas preventivas.
- Aplicar patches e medidas de segurança básicas sob supervisão.
- Apoiar na resposta a incidentes de segurança seguindo os protocolos estabelecidos.
- Colaboração e Aprendizado:
- Colaborar no dia a dia com times de DevOps, Segurança e Banco de Dados.
- Desenvolver visão técnica fundamentada em custo, risco e performance.
- Apoiar em deploys de aplicações e atualizações de infraestrutura.
- Garantir uma comunicação clara e transparente com o time sobre o status das atividades.
O que você precisa ter:
- Experiência em Cloud: Conhecimentos teóricos ou práticos iniciais em GCP ou AWS.
- Orquestração: Entendimento conceitual de Kubernetes/Containers (diferencial se já tiver interagido com GKE).
- Automação: Noções de lógica de programação e conhecimento básico em scripting (Bash, Python ou PowerShell).
- Infraestrutura como Código: Conhecimento teórico ou pequenas práticas com Terraform, Ansible ou esteiras de CI/CD.
- Monitoramento: Noções de ferramentas de observabilidade (ex: Prometheus, Grafana, ELK ou Zabbix).
- Gestão de Incidentes: Capacidade analítica para troubleshooting básico, boa comunicação para reportar problemas e resiliência para atuar em momentos de crise com apoio do time.
O que seria muito legal que você soubesse:
- Ter operado de forma básica ambientes GCP ou AWS.
- Conhecimento em Cloud adicionais (Huawei Cloud ou Azure).
- Noções de FinOps (conceito de custos em nuvem).
- Projetos pessoais, acadêmicos ou laboratoriais (homelab) utilizando as tecnologias da vaga.
- Certificações de nível Foundational/Associate (ex: AWS Cloud Practitioner, Google Digital Leader ou Associate Cloud Engineer).
O que te tornaria um especialista para essa vaga:
Capacidade para projetar e implementar arquiteturas de sistemas complexas.
Experiência em tomar decisões de design para otimizar desempenho e escalabilidade.
Experiência em estabelecer e manter práticas de governança em ambientes de nuvem.
Conhecimento profundo das políticas de conformidade e regulamentações relevantes.
Especialização em práticas avançadas de segurança, incluindo detecção e resposta a incidentes.
Implementação de soluções de segurança em vários níveis.
- Automação e Orquestração Avançada:
Desenvolvimento de frameworks de automação personalizados.
Orquestração eficiente de sistemas distribuídos e complexos.
- Gerenciamento de Performance:
Otimização avançada de desempenho em todos os níveis da infraestrutura.
Análise preditiva para identificar e resolver problemas antes que ocorram.
Avaliação constante de novas tecnologias e sua aplicabilidade.
Contribuições para a inovação e melhoria contínua dos processos.
- Gestão de Mudanças Estratégicas:
Liderança em iniciativas de transformação digital.
Definição e implementação de estratégias de mudança eficazes.
- Pesquisa e Desenvolvimento:
Participação ativa em projetos de pesquisa e desenvolvimento.
Colaboração com equipes de P&D para impulsionar a inovação.
- Resolução de Problemas Excepcionais:
Solução eficaz de problemas altamente complexos.
Tomada de decisões rápidas em situações críticas.
Perfil comportamental esperado:
- Mentalidade de dono: Assumir a responsabilidade pelos problemas até sua resolução final.
- Visão de Causa Raiz: Foco em solucionar a origem dos problemas, evitando soluções paliativas.
- Inconformismo: Busca constante pela automação de processos manuais e repetitivos.
- Comunicação: Capacidade de transmitir informações de forma clara e organizada, especialmente em cenários complexos.
O que oferecemos:
️ VR e VA
Assistência médica
Assistência odontológica
Bônus variável anual
Auxílio creche
Auxílio home office
️ Wellhub + App Ginastica Laboral
✨ Seguro de vida
Day Off no mês de Aniversário
Vale Transporte ou Estacionamento
Campanha de Vacinação
TelePsicologia e Nutrição Online
Massagem no escritório para modelo híbrido
Emendas de Feriado
Acesso aos nosso produtos
Bateu aquela fome? Temos snacks no escritório