Treinamento OpenMetadata
Sobre o Treinamento
O OpenMetadata é uma plataforma open source de governança de dados moderna, voltada para integrar e centralizar metadados técnicos, operacionais, de qualidade e de negócios em ambientes analíticos e distribuídos. Este treinamento fundamental prepara profissionais para utilizar o OpenMetadata de forma prática e estratégica, apoiando iniciativas de catalogação de dados, rastreabilidade, controle de acesso, glossários e automação de pipelines de metadados.
O conteúdo programático foi desenvolvido para capacitar os participantes a implantar, configurar e operar o OpenMetadata em ecossistemas de dados reais, promovendo governança ativa, descoberta de dados, e colaboração entre engenheiros, analistas e áreas de negócio.
O que vou aprender?
Ao final deste treinamento você será capaz de:
- Como implantar e configurar o OpenMetadata.
- Como estruturar um catálogo de dados funcional e colaborativo.
- Como monitorar e rastrear a qualidade e a linhagem dos dados.
- Como integrar com ferramentas modernas do stack de dados open source.
- Boas práticas para governança de dados.
Calendário de turmas.
Somente no modelo corporativo no momento.
Dificuldade: Alta.
Aplicabilidade.
Este treinamento foi desenvolvido usando o Apache Atlas 2.4.0. e foi modificado pela última vez em 2 de Março de 2025.
Conteúdo Programático.
Conceitual Apache Atlas.
- Introdução à Governança de Dados.
- O que é o OpenMetadata?
- OpenMetadata no ecossistema DataLake,Lakewouse e Big Data.
- A importância do OpenMetadata no ecossistema de dados moderno.
- Comparativo: OpenMetadata X Apache Atlas X Collibra X Amundsen.
Instalação OpenMetadata.
- Requisitos de Sistema.
- Instalando o OpenMetadata com Docker.
- Kubernetes com Kind.
- Instalando o OpenMetadata em Kubernetes.
Arquitetura do OpenMetadata.
- Principais componentes.
- Ingestion Framework.
- Metadata Store.
- UI do OpenMetadata.
- Integrações Nativas com Trino, Airflow, Kafka, dbt, Great Expectations etc.
Conectores.
- PostgreSQL e MySQL.
- Data Lakes e Data Warehouse (S3, BigQuery, Snowflake, etc.).
- Ferramentas de ETL (Airflow, dbt, Spark, etc.).
- Dashboards (Superset, Metabase).
- Pipelines de Ingestão.
- Agendamento das Ingestões.
Catálogo de Dados e Metadados Técnicos.
- Cadastro e rastreabilidade de ativos de dados.
- Descoberta de dados (Data Discovery).
- Glossário de Negócios (Business Glossary)
Qualidade de Dados Integrada.
- Regras de qualidade com Great Expectations.
- Monitoramento de falhas e alertas.
- Relatórios e dashboards de qualidade.
Linhagem de Dados (Data Lineage).
- Geração automática de linhagem com Airflow, dbt e Spark.
- Visualização gráfica do fluxo de dados.
- Relações entre datasets, pipelines e dashboard
Segurança e Governança
- Controle de acesso baseado em funções (RBAC),
- Perfis de usuário e permissões por domínio.
- Auditoria de ações e logs.
Integrações.
- PostgreSQL e Redshift.
- dbt.
- Trino e Presto.
- Apache Kafka.
- Apache Cassandra.
- Superset.
- Apache Doris.
- Apache Iceberg.
- Apache Hive e Apache Impala.
API do OpenMetadata
- Estrutura da API REST.
- Navegação pela Swagger UI.
- Autenticação via token / JWT / API key.
- Consultas e Leitura de Metadados.
- Automatização de Cadastro e Atualização.
- SDK Python.
Carga Horária:
- 24 Horas de duração.
MODALIDADES DE TREINAMENTO
- Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
- On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Pré-Requisitos:
- Conhecimento de comandos e servidores Linux.
- Conhecimento básico no ecossistema de Big Data.
Requisitos:
- Todos os participantes devem trazer um notebook para realizar as atividades práticas.
- O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
- Para Online ter uma boa conectividade com a Internet.
- Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.
Requisitos mínimos de hardware
- Memória RAM : 8GB
- Espaço em Disco: 20GB
- Processador: Dual-core AMD 64, EM64T
- Sistemas Operacionais: GNU/Linux, Windows, MacOS.
- VirtualBox.
Material
Serão disponibilizados os seguintes materiais aos alunos do treinamento:
- Todos os softwares OpenMetadata e acessórios na sua última versão estável.
- Material próprio em Português do Brasil.
- Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
- Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
- Apostilas com exercícios práticos desenvolvidos no treinamento.
- Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Metodologia
- Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.
Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos OpenMetadata e Cursos OpenMetadata. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.
Diferenciais da Ambiente Livre.
A Ambiente Livre tem 20 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.
4.245 profissionais capacitados em 351 turmas ministradas.
Atuação global, 833 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.
Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.
Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.
Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.
Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.
Inscrições, Informações e Valores