Treinamento OpenMetadata
- Publicado em Data Science
Sobre o Treinamento
O OpenMetadata é uma plataforma Open Source de governança de dados moderna, voltada para integrar e centralizar metadados técnicos, operacionais, de qualidade e de negócios em ambientes analíticos e distribuídos. Este treinamento fundamental prepara profissionais para utilizar o OpenMetadata de forma prática e estratégica, apoiando iniciativas de catalogação de dados, rastreabilidade, controle de acesso, glossários e automação de pipelines de metadados.
O conteúdo programático foi desenvolvido para capacitar os participantes a implantar, configurar e operar o OpenMetadata em ecossistemas de dados reais, promovendo governança ativa, descoberta de dados, e colaboração entre engenheiros, analistas e áreas de negócio.
O que vou aprender?
Ao final deste treinamento você será capaz de:
- Como implantar e configurar o OpenMetadata.
- Como estruturar um catálogo de dados funcional e colaborativo.
- Como monitorar e rastrear a qualidade e a linhagem dos dados.
- Como integrar com ferramentas modernas do stack de dados Open Source.
- Boas práticas para governança de dados.
Calendário de turmas.
Somente no modelo corporativo no momento.
Dificuldade: Alta.
Aplicabilidade.
Este treinamento foi desenvolvido usando o OpenMetadata 1.12.0. e foi modificado pela última vez em 25 de Fevereiro de 2026.
Conteúdo Programático.
Conceitual.
- Introdução à Governança de Dados moderna.
- O que é o OpenMetadata?
- OpenMetadata no ecossistema Data Lake, Lakehouse e Big Data.
- Comparativo: OpenMetadata X Apache Atlas X Collibra X Amundsen.
- Posicionamento do OpenMetadata no ecossistema moderno de dados.
Instalação e Deploy.
- Requisitos de infraestrutura.
- Instalando o OpenMetadata com Docker.
- Kubernetes com Kind.
- Instalando o OpenMetadata em Kubernetes.
Arquitetura do OpenMetadata.
- Componentes.
- Server.
- Metadata Store.
- Search Engine.
- Ingestion Framework.
- Arquitetura lógica e física.
- UI do OpenMetadata.
- Integrações Nativas com Trino, Airflow, Kafka, dbt, Great Expectations etc.
Conectores.
- PostgreSQL e MySQL.
- Data Lakes e Data Warehouse (S3, BigQuery, Snowflake, etc.).
- Ferramentas de ETL (Airflow, dbt, Spark, etc.).
- Dashboards (Superset, Metabase).
- Pipelines de Ingestão.
- Agendamento das Ingestões.
Catálogo de Dados e Metadados Técnicos.
- Cadastro e rastreabilidade de ativos.
- Data Discovery.
- Business Glossary.
- Modelagem de Domínios e Subdomínios.
- Estratégia de organização por domínio corporativo.
- Ownership: Data Owner, Data Steward, Data Custodian.
Qualidade de Dados Integrada.
- Regras de qualidade com Great Expectations.
- Monitoramento de falhas e alertas.
- Relatórios e dashboards de qualidade.
- Estratégia de Data Quality como produto.
- Score global por domínio.
- Alertas integrados com Slack/Email.
- Gestão de falhas recorrentes.
- SLA de qualidade.
Linhagem de Dados (Data Lineage).
- Geração automática de linhagem com Airflow, dbt e Spark.
- Linhagem técnica e lógica.
- Impact analysis.
- Visualização gráfica do fluxo de dados.
- Relações entre datasets, pipelines e dashboards.
Integrações.
- PostgreSQL e Redshift.
- dbt.
- Trino e Presto.
- Apache Kafka.
- Apache Cassandra.
- Superset.
- Apache Doris.
- Apache Iceberg.
- Apache Hive e Apache Impala.
API do OpenMetadata
- Estrutura da API REST.
- Navegação pela Swagger UI.
- Autenticação via token / JWT / API key.
- Consultas e Leitura de Metadados.
- Automatização de Cadastro e Atualização.
- SDK Python.
- Provisionar domínio via API.
- Criar times via script.
- Automatizar criação de serviços.
- Integração com CI/CD.
- GitOps de metadados.
Segurança e Governança
- Controle de acesso baseado em funções (RBAC),
- Perfis de usuário e permissões por domínio.
- Integração LDAP.
- Mapeamento de grupos LDAP para Roles (RBAC).
- Estratégia de sincronização LDAP.
- Troubleshooting de DN e filtros LDAP.
- Domain hierarchy design.
- Subdomains.
- Ownership real (data steward, data owner, data custodian).
- Performance de autenticação.
- Mapeamento Database Roles.
- Estratégia para importar owners via ingestion.
- Enriquecimento automatizado via API.
- Padronização e governança de Ownership.
- Auditoria de ações e logs.
Administração e Operação em Produção
- Backup e Restore.
- Estratégia de snapshot do Elasticsearch.
- Estratégia de upgrade e rollback de versão.
- Migrações.
- Troubleshooting.
- Ajuste de heap e performance
- Logs importantes e como interpretar.
Observabilidade e Monitoramento
- Métricas Prometheus do OpenMetadata.
- Healthcheck (porta 8586).
- Monitoramento de ingestion.
- Latência de indexação.
- Crescimento de metadata.
- Estratégia de capacity planning.
Carga Horária:
- 32 Horas de duração.
MODALIDADES DE TREINAMENTO
- Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
- On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Pré-Requisitos:
- Conhecimento de comandos e servidores Linux.
- Conhecimento básico no ecossistema de Big Data.
Requisitos:
- Todos os participantes devem trazer um notebook para realizar as atividades práticas.
- O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
- Para Online ter uma boa conectividade com a Internet.
- Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.
Requisitos mínimos de hardware
- Memória RAM : 8GB
- Espaço em Disco: 20GB
- Processador: Dual-core AMD 64, EM64T
- Sistemas Operacionais: GNU/Linux, Windows.
- VirtualBox.
Material
Serão disponibilizados os seguintes materiais aos alunos do treinamento:
- Todos os softwares OpenMetadata e acessórios na sua última versão estável.
- Material próprio em Português do Brasil.
- Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
- Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
- Apostilas com exercícios práticos desenvolvidos no treinamento.
- Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Metodologia
- Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.
Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos OpenMetadata e Cursos OpenMetadata. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.
Diferenciais da Ambiente Livre.
A Ambiente Livre tem 22 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.
5.007 profissionais capacitados em 399 turmas ministradas.
Atuação global, 845 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.
Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.
Treinamentos baseados em experiência de projetos e consultorias, 2.980 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.
Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.
Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.