Texto agregado para leitura rápida. Confira sempre a fonte original ao enviar a candidatura.
Descrição
Descrição do Cargo
Responsável por prestar suporte na sustentação de sistemas, monitoramento contínuo de ambientes
e execução de rotinas operacionais de infraestrutura (on-premises e multi-cloud). Atua de forma
colaborativa, garantindo a disponibilidade dos serviços por meio da triagem de alertas, segurança
dos acessos, versionamento de ativos e formalização do conhecimento através de documentação
técnica clara.
Responsabilidades e atribuições
Escopo de Atividades
- Monitoramento, Alertas e Operação do Dia a Dia
- Acompanhar e triar alertas dos sistemas de monitoramento, identificando e tratar
anomalias, picos de consumo ou indisponibilidades nos ambientes de homologação e
produção de forma proativa.
- Monitorar e atualizar o fluxo de chamados e solicitações, garantindo o cumprimento de
prazos (SLAs) e o alinhamento com as equipes solicitantes.
- Acompanhar e reportar os custos de infraestrutura em nuvem, identificando desvios
orçamentários, recursos ociosos ou oportunidades de otimização de gastos (FinOps).
- Gestão de Acessos e Segurança
- Provisionar e revogar permissões de acesso nos sistemas de controle de infraestrutura,
seguindo políticas corporativas de segurança e o princípio do menor privilégio.
- Auditar credenciais e chaves de acesso periodicamente para garantir a conformidade dos
ambientes.
- Sustentação de Sistemas e Infraestrutura
- Executar a manutenção rotineira de servidores GNU/Linux, incluindo aplicação de
patches de segurança, atualização de pacotes, análise de logs de sistema e monitoramento de
performance (CPU, memória, disco).
- Prestar suporte na sustentação de ambientes conteinerizados, auxiliando no deploy,
reinicialização e extração de logs de aplicações rodando em Docker, Kubernetes ou
Nomad.
- Operação em Nuvem (Multi-Cloud)
- Apoiar a administração de serviços em nuvem (Google Cloud e Azure), lidando com a
criação e ajuste de máquinas virtuais, armazenamento de objetos (Buckets/Blob Storage) e
recursos de rede.
- Gestão de Dados e Continuidade de Negócios
- Garantir a execução e a integridade das rotinas de backup de sistemas, arquivos e
bancos de dados, realizando testes periódicos de restauração (restore) em ambientes de
homologação.
- Operar e dar suporte a bancos de dados, realizando consultas básicas (SQL/NoSQL) para
validação de dados, além de gerenciar usuários e permissões de acesso às tabelas e
instâncias.
- Versionamento de Código e Cultura DevOps
- Utilizar Git para controle de versão de scripts de automação, playbooks e arquivos de
configuração, garantindo o histórico e a rastreabilidade das alterações.
- Interagir com repositórios remotos (GitLab) para realizar operações como clonar
projetos, criar branches locais, commitar melhorias e abrir Pull Requests / Merge Requests
para revisão da equipe sênior.
- Geração e Manutenção de Documentação Técnica
- Registrar e atualizar playbooks, manuais e procedimentos operacionais de infraestrutura
(Runbooks) em bases de conhecimento internas (como Wiki, Confluence ou repositórios
Git), assegurando que os processos executados estejam documentados de forma clara e
replicável.
- Documentar incidentes recorrentes e as suas respectivas soluções de contorno,
auxiliando na construção de um histórico técnico para acelerar futuras resoluções da equipe.
- Automação, CI/CD e Cultura DevOps
- Infraestrutura como Código (IaC): Desenvolver e manter códigos de infraestrutura em
ferramentas como Terraform ou Ansible para garantir a imutabilidade e reprodutibilidade
dos ambientes.
- Engenharia de Release (CI/CD): Construir, otimizar e manter pipelines de integração e
entrega contínua (Gitlab), integrando testes automatizados e esteiras de deploy.
- Quebra de Silos Operacionais: Atuar como ponte técnica e cultural entre as equipes de
Desenvolvimento e Operações, promovendo a responsabilidade compartilhada pela
estabilidade e entrega do produto em produção.
- Práticas de Post-Mortem Não Punitivas (Blameless Post-Mortems): Liderar e incentivar
reuniões de análise de falhas focadas no processo e nos sistemas, nunca em apontar
culpados, transformando incidentes críticos em oportunidades de aprendizado coletivo.
- Fomento à Automação Geral: Disseminar a mentalidade de "se você precisa fazer algo
mais de duas vezes, automatize", auxiliando os times de desenvolvimento a adotar práticas
de self-service para infraestrutura.
Requisitos e qualificações
Hard Skills (Habilidades Técnicas)
Monitoramento e Observabilidade
- Ferramentas de Monitoramento: Noções básicas de navegação em painéis e dashboards
(ex: Grafana, Prometheus, Zabbix, Datadog ou ferramentas nativas da Nuvem).
- Análise e Resposta a Alertas: Capacidade de interpretar a severidade de um alerta (Info,
Warning, Critical), identificar a causa raiz básica em logs e seguir ou criar playbooks de
mitigação.
Sistemas Operacionais e Redes
- GNU/Linux (Intermediário): Manipulação de arquivos, permissões (chmod, chown),
análise de logs (journalctl, tail) e gerenciamento de serviços (systemctl).
- Redes de Computadores: Entendimento avançado de protocolo TCP/IP, DNS, portas de
comunicação, tabelas de roteamento e sub-redes.
Containers e Orquestração
- Docker: Criação de Dockerfiles, gerenciamento de volumes, redes e comandos essenciais de
diagnóstico (docker ps, docker logs, docker exec).
- Kubernetes / Nomad: Navegação básica via CLI (ex: kubectl get pods, kubectl
logs) para extração de logs e aplicação de manifestos declarativos simples (Deployments,
Services) já estruturados.
Computação em Nuvem
- Fundamentos de GCP / Azure: Provisionamento de instâncias (VMs), storage e regras
básicas de firewall.
- FinOps Básico: Leitura de dashboards de faturamento (Billing) e exportação de relatórios
de consumo.
Banco de Dados
- Sintaxe SQL Essencial (DML): Execução de consultas seguras (SELECT com filtros,
JOINs simples e agregações) sem impactar a performance de produção.
- Administração de Dados (DCL/Utilitários): Execução de dumps e restores (ex:
mysqldump, pg_dump), além de comandos de controle de acesso (GRANT e REVOKE).
Versionamento e Escrita Técnica
- Git / GitFlow: Domínio do fluxo essencial de trabalho (clone, branch, commit, push,
pull) e resolução de conflitos simples em arquivos de configuração textuais.
- Escrita Técnica (Markdown / Wikis): Capacidade de estruturar documentos lógicos, fáceis
de ler, utilizando formatação adequada (listas, blocos de código, tabelas) para descrever
fluxos de infraestrutura