OpenMetadata

Treinamento OpenMetadata

Sobre o Treinamento

O OpenMetadata é uma plataforma open source de governança de dados moderna, voltada para integrar e centralizar metadados técnicos, operacionais, de qualidade e de negócios em ambientes analíticos e distribuídos. Este treinamento fundamental prepara profissionais para utilizar o OpenMetadata de forma prática e estratégica, apoiando iniciativas de catalogação de dados, rastreabilidade, controle de acesso, glossários e automação de pipelines de metadados.

O conteúdo programático foi desenvolvido para capacitar os participantes a implantar, configurar e operar o OpenMetadata em ecossistemas de dados reais, promovendo governança ativa, descoberta de dados, e colaboração entre engenheiros, analistas e áreas de negócio.

O que vou aprender?

Ao final deste treinamento você será capaz de:

  • Como implantar e configurar o OpenMetadata.
  • Como estruturar um catálogo de dados funcional e colaborativo.
  • Como monitorar e rastrear a qualidade e a linhagem dos dados.
  • Como integrar com ferramentas modernas do stack de dados open source.
  • Boas práticas para governança de dados.

Calendário de turmas.

Somente no modelo corporativo no momento.

Dificuldade: Alta.

Aplicabilidade.

Este treinamento foi desenvolvido usando o Apache Atlas 2.4.0. e foi modificado pela última vez em 2 de Março de 2025.

Conteúdo Programático.

Conceitual Apache Atlas.

  • Introdução à Governança de Dados.
  • O que é o OpenMetadata?
  • OpenMetadata no ecossistema DataLake,Lakewouse e Big Data.
  • A importância do OpenMetadata no ecossistema de dados moderno.
  • Comparativo: OpenMetadata X Apache Atlas X Collibra X Amundsen.

Instalação OpenMetadata.

Arquitetura do OpenMetadata.

  • Principais componentes.
  • Ingestion Framework.
  • Metadata Store.
  • UI do OpenMetadata.
  • Integrações Nativas com Trino, Airflow, Kafka, dbt, Great Expectations etc.

Conectores.

  • PostgreSQL e MySQL.
  • Data Lakes e Data Warehouse  (S3, BigQuery, Snowflake, etc.).
  • Ferramentas de ETL (Airflow, dbt, Spark, etc.).
  • Dashboards (Superset, Metabase).
  • Pipelines de Ingestão.
  • Agendamento das Ingestões.

Catálogo de Dados e Metadados Técnicos.

  • Cadastro e rastreabilidade de ativos de dados.
  • Descoberta de dados (Data Discovery).
  • Glossário de Negócios (Business Glossary)

Qualidade de Dados Integrada.

  • Regras de qualidade com Great Expectations.
  • Monitoramento de falhas e alertas.
  • Relatórios e dashboards de qualidade.

Linhagem de Dados (Data Lineage).

  • Geração automática de linhagem com Airflow, dbt e Spark.
  • Visualização gráfica do fluxo de dados.
  • Relações entre datasets, pipelines e dashboard

Segurança e Governança

  • Controle de acesso baseado em funções (RBAC),
  • Perfis de usuário e permissões por domínio.
  • Auditoria de ações e logs.

Integrações.

API do OpenMetadata

  • Estrutura da API REST.
  • Navegação pela Swagger UI.
  • Autenticação via token / JWT / API key.
  • Consultas e Leitura de Metadados.
  • Automatização de Cadastro e Atualização.
  • SDK Python.

Carga Horária:

  • 24 Horas de duração.

MODALIDADES DE TREINAMENTO

  • Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
  • On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
  • In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos:

  • Conhecimento de comandos e servidores Linux.
  • Conhecimento básico no ecossistema de Big Data.

Requisitos:

  • Todos os participantes devem trazer um notebook para realizar as atividades práticas.
  • O Computador deve estar  com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
  • Para Online ter uma boa conectividade com a Internet.
  • Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware

  • Memória RAM : 8GB
  • Espaço em Disco: 20GB
  • Processador: Dual-core AMD 64, EM64T
  • Sistemas Operacionais: GNU/Linux, Windows, MacOS.
  • VirtualBox.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

  • Todos os softwares OpenMetadata e acessórios na sua última versão estável.
  • Material próprio em Português do Brasil.
  • Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
  • Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
  • Apostilas com exercícios práticos desenvolvidos no treinamento.
  • Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.

Metodologia

  • Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos OpenMetadata e Cursos OpenMetadata. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 20 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

4.245 profissionais capacitados em 351 turmas ministradas.

Atuação global, 833 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Inscrições, Informações e Valores

Powered by BreezingForms


Instrutor

Marcio Junior Vieira

  • 24 anos de experiência em tecnologia da informação, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
  • CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
  • Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
  • Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
  • Pesquisador pela UFG - Universidade de Goiás no CIAP - Centro de IA Aplicada às Políticas Públicas.
  • Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
  • Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay, PgConf e FTSL.
  • Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
  • Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
  • Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
  • Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
  • Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurveySuiteCRM e Camunda.
  • Especialista em implantação e customização de ECM com Alfresco e BPM com ActivitiFlowable e Camunda.
  • Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
  • Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
  • Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)

Log in