Ir para o conteúdo
Logotipo da Catho
Seu novo emprego está na palma das suas mãos! Baixe nosso app e obtenha vantagens :)
Botão App StoreBotão Play Store

Vaga de Consultor Engenheiro de Dados - Suzano

1 vaga: | CLT (Efetivo) | Publicada em 08/11

Sobre a vaga

Atividades: Responsabilidades gerais Gerenciar e otimizar soluções para o armazenamento e a distribuição de dados; Ter preocupação com a ética no tratamento de dados, seguindo as orientações da LGPD (Lei Geral de Proteção de Dados) e direcionamentos da áreas de segurança e governança; Construir forte relacionamento com diversas áreas internas da empresa de modo a garantir entendimento compreensivo dos requisitos do negócio; Trabalhar em modelo ágil e de forma colaborativa dentro de squads; Seguir melhores práticas de Gestão de Dados para garantindo pontualidade e rigor nas soluções desenvolvidas; Seguir padrões internos, já definidos, para implantação (deploy) de modelos, inclusive, conectando-os a pipeline de dados; Utilizar de documentação sobre o ciclo de vida de modelos de ML para monitoramento contínuo e acompanhamento de suas métricas; Uso de ambientes de integração e entrega contínuas (CI/CD) automatizadas para implantação de modelos; Aplicação de técnicas de segurança, de forma contínua, no processo de desenvolvimento de sistemas; Observância em padrões de segurança e conformidade com regulamentações para entrega de soluções seguras. Propor e desenvolver padrões de serviços para implantação de modelos e definição de pipelines de dados; Propor e desenvolver ferramentas de monitoramento contínuo para acompanhamento e análise das métricas geradas pelos modelos; Implementar técnicas de gerenciamento de pipelines de treinamento de modelos com versionamento e rastreamento de experimento; Propor e desenvolver técnicas de segurança a serem incorporadas, de forma contínua, no processo de desenvolvimento; Ter conhecimento sobre novas regulamentações que tratam sobre o tema de segurança no desenvolvimento de ferramentas; Propor e desenvolver soluções para gerenciamento de incidentes, análises de ameaças e atualizações regulares para lidar com vulnerabilides emergentes. Projetar, desenvolver, gerenciar e otimizar soluções para o armazenamento e a distribuição de dados; Definir metodologias para governança de modelos e documentação sobre o ciclo de vida de um modelo de ML; Ter entendimento de melhores práticas e novas metodologias para implantação (deploy) de modelos, inclusive com mecanismos igualmente modernos para definição de pipeline de dados; Propor atualizações nos ambientes de integração e entregas contínuas (CI/CD) para automatização de tarefas; Definição de técnicas de segurança, de forma contínua, a serem adotadas no processo de desenvolvimento de sistemas; Ter conhecimento sobre regulamentações e técnicas atualmente adotadas e novas, ainda a serem debatidas e aceitas como parte do processo. Liderar tecnicamente SQUADs na dimensão de engenharia de dados; Liderar tecnicamente melhorias nos Stacks de dados da Suzano envolvendo outros times. Responsabilidades especificas Manter e evoluir arquiteturas de trabalho, tais como bases de dados e sistemas de processamento em larga escala; Otimizar ingestão e saída de dados dos modelos analíticos em desenvolvimento pelos Cientistas de Dados; Garantir segurança e qualidade dos dados e códigos desenvolvidos visando proteger a qualidade do trabalho apresentado internamente na organização; Recomendar e implementar formas de aumentar confiabilidade, eficiência e qualidade dos dados; Garantir que arquitetura comporte necessidades e requisitos técnicos do time de execução; Trabalhar em conjunto com times de TI (Arquitetura, Segurança, Infraestrutura) para garantir robustez e automação nas soluções desenvolvidas. Seguir e propor melhorias às estratégias para controle de qualidade e governança de códigos; Seguir e propor melhorias ao pipeline DevOps considerando estrutura multi-nuvem. Desenvolver, construir, testar e manter arquiteturas de trabalho, tais como bases de dados e sistemas de processamento em larga escala; Desenhar, aplicar e aprimorar estratégias para controle de qualidade e governança de códigos; Estruturar e aprimorar pipeline DevOps considerando estrutura multi-nuvem; Otimizar ingestão e saída de dados dos modelos analíticos em desenvolvimento pelos Cientistas de Dados; Garantir segurança e qualidade dos dados e códigos desenvolvidos visando proteger a qualidade do trabalho apresentado internamente na organização; Recomendar e implementar formas de aumentar confiabilidade, eficiência e qualidade dos dados; Descobrir oportunidades para aumentar a aquisição, ingestão e armazenamento de dados; Garantir que arquitetura comporte necessidades e requisitos técnicos do time de execução; Trabalhar em conjunto com times de TI (Arquitetura, Segurança, Infraestrutura) para garantir robustez e automação nas soluções desenvolvidas. Conceber e garantir que arquitetura comporte necessidades e requisitos técnicos do time de execução; Fazer mentoria do time técnico de engenheiro de dados com foco no desenvolvimento profissional. Superior completo Formação em STEM (Science, Tecnologia, Engineering and Math) Conhecimento de sistemas computacionais; Conhecimento de redes de computadores: Firewall; Experiência com modelagem de dados; Experiencia com banco de dados relacionais; Conhecimento de ferramentas de controle de versão (Ex. Git); Experiência com a plataforma Docker; Experiência em soluções para lidar com grande volume de dados para otimizar os modelos: Spark/Pyspark; Experiência em ferramenta de visualização de dados (Ex. PowerBI); Entendimento de requisitos para segurança da informação LGPD. Familiaridade com metodologias ágeis; Experiência em Linux nível sysadmin; Experiência GCP (Bigquery, Cloud Storage, Cloud Function, Cloud Run, Cloud Dataproc, PubSub, Dataflow, Kubernets); Experiência em DevOps e ferramentas de CI/CD; Conhecimento em Terraform; Entendimento de requisitos para segurança da informação: SSL, JWT, LGPD; Experiência com desenvolvimento de APIs REST; Experiência e manutenção de ETLs aplicado a Big Data; Conhecimento básico em Machine Learning e Deep Learning. Inglês fluente; Perfil de senioridade com capacidade de liderar pequenas iniciativas; Domínio em GCP/Azure; Python orientado a objeto; Experiência comprovada em Design Patterns; Domínio em infraestrutura cloud; Capacidade de atuar em várias frentes ao mesmo tempo; Capacidade de se atualizar com rapidez. Capacidade de liderar vários projetos simultâneos; Capacidade de ser referência técnica da equipe. Será feito um teste na forma de case ou prova para que o candidato demonstre habilidades na área.
Idioma: Inglês - Intermediário