Treinamento Apache Ranger
Sobre o Treinamento
Neste treinamento vamos explorar o Apache Ranger como uma solução central para controle de acesso e auditoria em ambientes Hadoop e outras ferramentas do ecossistema de Big Data. O foco será prático, com instalação e configuração do Apache Ranger, e integração com ferramentas como Apache Atlas, Elasticsearch e Kibana já pré-configuradas em uma máquina virtual fornecida pela Ambiente Livre.
O que vou aprender?
Ao final deste treinamento você será capaz de:
- Instalar e configurar o Apache Ranger em ambientes Big Data.
- Compreender a arquitetura do Ranger e o papel de cada componente.
- Criar políticas de segurança para Hive, HDFS, Kafka, entre outros serviços.
- Controlar acessos por usuários, grupos, IPs e condições avançadas.
- Criar e aplicar políticas dinâmicas baseadas em tags com Apache Atlas.
- Navegar e configurar o Ranger Admin UI.
- Integrar o Ranger com sistemas de autenticação como LDAP ou AD.
- Visualizar e auditar logs de acesso no Kibana com dados do Elasticsearch.
- Utilizar o Ranger com integração com o Apache Atlas.
- Aplicar boas práticas e segurança em ambientes distribuídos.
Calendário de turmas.
Somente no modelo corporativo no momento.
Dificuldade:Avançado
Aplicabilidade.
Este treinamento foi desenvolvido usando o Apache Ranger 2.6.0 e foi modificado pela última vez em 31 de maio de 2025.
Conteúdo Programático.
Conceitual Apache Ranger.
- Introdução à Segurança em Ambientes Big Data.
- Apache Ranger no Ecossistema Hadoop.
- Apache Ranger X Apache Sentry.
- Componentes e Arquitetura do Apache Ranger.
- Casos de uso do Ranger em ambientes corporativos.
- Empresas utilizando Apache Ranger no Mundo.
Empresas utilizando Apache Ranger no Brasil. - Apache Ranger em ambientes on-premise e na nuvem.
Instalação e Configuração.
- Requisitos de instalação.
- Instalando o Apache Ranger Server.
- Configuração inicial do Ranger Admin.
- Integração com Banco de Dados externo (MySQL/PostgreSQL).
- Inicializando o serviço do Ranger.
- Configuração via arquivos .xml e install.properties
Fundamentos do Apache Ranger
- Introdução ao Console Admin Web.
- Perfis, políticas e permissões.
- Criação de usuários, grupos e roles.
- Integração com LDAP/Active Directory.
- Políticas baseadas em recursos (Resource-Based Policies).
- Políticas baseadas em tags (Tag-Based Policies).
- Auditoria e logs de acesso.
- Workflows de aprovação (com Ranger KMS).
Integração com Sistemas de Big Data.
- HDFS Plugin: políticas e permissões de arquivos.
- Hive Plugin: controle de acesso a databases, tabelas e colunas.
- Kafka Plugin: controle de acesso por tópicos e consumidores.
- YARN, Knox, HBase, Solr: conceitos e exemplos de políticas.
- Integração com Apache NiFi.
- Integração com Trino e Presto.
- Plugins vs. Agentes Externos: modos de operação.
Gerenciamento de Políticas.
- Criação e gerenciamento de políticas no console.
- Clonagem e herança de políticas.
- Wildcards e expressões regulares em políticas.
- Auditoria e trilha de acesso: revisão e análise.
- Exportação e importação de políticas.
- Gerenciamento de múltiplos repositórios.
- Controle por tempo e condições (políticas dinâmicas).
Ranger KMS (Key Management Service)
- Introdução à Criptografia de Dados em Descanso (Encryption at Rest).
- Arquitetura do Apache Ranger KMS.
- Criação e gerenciamento de chaves.
- Integração com HDFS, Hive e HBase.
- Auditoria de uso de chaves.
- Políticas de acesso a chaves e rotação automática.
Auditoria e Monitoramento
- Configuração do Ranger Audit.
- Armazenamento de logs em Apache Solr, HDFS ou Elasticsearch.
- Integração com Kibana para visualização de eventos
- Alertas e notificações baseados em logs de auditoria.
- Boas práticas de retenção e análise de logs.
- Integração com sistemas SIEM.
Melhores Práticas e Manutenção
- Backup e restauração do Ranger Admin.
- Atualizações e upgrades de versão.
- Segurança do próprio Ranger Admin (HTTPS, firewalls).
- Hardening do Ranger Server.
- Performance tuning.
- Troubleshooting de plugins.
- Ranger em ambientes de alta disponibilidade (HA).
Tópicos Gerais.
- Aplicando políticas no Apache Ranger com base em tags do Apache Atlas.
- Apache Atlas no Cloudera Data Platform (CDP).
Carga Horária:
- 16 Horas de duração.
Modalidades do Treinamento:
- Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
- On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Pré-Requisitos:
- Conhecimento de comandos e servidores Linux.
- Conhecimento básico em governança de dados
- Conhecimento básico no ecossistema de Big Data e Apache Atlas.
Requisitos:
- Todos os participantes devem trazer um notebook para realizar as atividades práticas.
- O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
- Para Online ter uma boa conectividade com a Internet.
- Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.
Requisitos mínimos de hardware
- Memória RAM : 8GB
- Espaço em Disco: 20GB
- Processador: Dual-core AMD 64, EM64T
- Sistemas Operacionais: GNU/Linux, Windows.
- VirtualBox.
Material
Serão disponibilizados os seguintes materiais aos alunos do treinamento:
- Todos os softwares Apache Ranger e acessórios na sua última versão estável.
- Material próprio em Português do Brasil.
- Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
- Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
- Apostilas com exercícios práticos desenvolvidos no treinamento.
- Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Metodologia
- Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.
Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Apache Ranger e cursos Apache Ranger. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.
Diferenciais da Ambiente Livre.
A Ambiente Livre tem 22 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.
5.007 profissionais capacitados em 399 turmas ministradas.
Atuação global, 845 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.
Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.
Treinamentos baseados em experiência de projetos e consultorias, 2.980 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.
Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.
Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.
Inscrições, Informações e Valores
Instrutor
Marcio Junior Vieira
- 27 anos de experiência em TI, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
- CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
- Atuou como Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo e do MBA Artificial Intelligence e Machine Learning da FIAP.
- Atuou como Pesquisador pelo UFG/CIAP (Centro de Colaboração Interinstitucional de Inteligência Artificial Aplicada às Políticas Públicas) e no grupo Latitude (Laboratório de Tecnologias da Tomada de Decisão) da UNB.
- Trabalhando com Free Software e Open Source desde 2000 com serviços de consultoria e treinamento.
- Graduado em Tecnologia em Informática (2004) e pós-graduado em Software Livre (2005) ambos pela UFPR.
- Palestrante FLOSS em: The Developers Conference (TDC), FISL, Latinoware, Campus Party, Pentaho Day, Ticnova, PGConf Brasil e FTSL.
- Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas edições de 2013 e 2014.
- Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
- Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Serpro, Natura, MP, Netshoes, Embraer entre outras.
- Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e Kafka.
- Contribuidor de projetos Open Source ou Free Software internacionais, tais como Pentaho, LimeSurvey, SuiteCRM, Camunda, Operaton e Apache Hop.
- Especialista em implantação e customização de ECM com Alfresco e BPM com Activiti, Flowable, Camunda e Operaton.
- Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).