Apache Doris

Treinamento Apache Doris

O Treinamento em Apache Doris tem foco em ensinar como explorar, armazenar e analisar grandes volumes de dados para Big Data Analytics e Data Warehousing. Abordamos desde a instalação e configuração até a otimização de consultas para alto desempenho, utilizando sua arquitetura OLAP colunar.

O Apache Doris é um banco de dados analítico open source, projetado para fornecer consultas SQL rápidas e eficientes, suportando cenários de Business Intelligence (BI), relatórios analíticos, dashboards e processamento de Big Data. Ele se integra com diversas ferramentas como Apache Flink, Apache Spark, Hadoop, Hive, Presto e Kafka, facilitando a ingestão e análise de dados em larga escala.

Dificuldade: Média.

Aplicabilidade.

Este treinamento foi desenvolvido usando o Apache Doris 2.1.8 e foi modificado pela última vez em 9 de Fevereiro de 2025.

Modalidades do Treinamento:

  • Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
  • On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
  • In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Conteúdo Programático

Conceitual

  • O que é Business Intelligence.
  • O que é Data Warehouse.
  • O que é Lakehouse.
  • ETL (Extração, Transformação e Carga).
  • Bases OLAP, ROLAP, MOLAP e OLTP.
  • Sistemas Transacionais X Sistemas Dimensionais (OLTP X OLAP).
  • Dimensões e Modelo Dimensional.
  • Modelo Estrela (Star Schema).
  • Software Livre x Open Source.
  • Apache Software Foundation.
  • Licença Apache 2.0.

Conceitual Apache Doris.

Instalação do Apache Doris.

Table Design

  • Data Model.
  • Criando Tabelas.
  • Data Partition.
  • Rollup e Query.
  • Index.

Data Import.

  • Características de Importação.
  • External Storage Data.
  • Sincronização de dados.
  • Local Data.
  • Subscribe Kafka Data.

Data Export.

  • Exportação de Dados.
  • Export Table Structure
  • Export Query Result
  • Backup de Dados.

Update e Delete.

  • Update
  • Delete
  • Batch Delere
  • Sequence Column

Uso avançado.

  • Schema Change.
  • Data Cache.
  • Materialized view.
  • HLL ApproximateDe-duplication.
  • Time Zone.
  • Dynamic Partition
  • Join Optimization.
  • Bitmap Precise De-Duplication.
  • Variables.
  • File Manager

Ecossistema.

  • Spark Doris Connector
  • Seatunnel Connector.
  • UDF
  • Flink Doris Connector.
  • DataX doriswriter
  • Audit log plugin.

SQL.

  • SQL Function.
  • DML.
  • Utility.
  • DDL.
  • Data Type.

Cluster .

  • Cluster Upgrade.
  • Statistics Query Execution.
  • Metadata Operation.
  • Config.
  • Multi-tenancy.
  • Elastic Scaling
  • Manutenção e Monitoramento.
  • Authoriry Management.

Segurança e Autenticação.

  • Authentication and Authorization.
  • Authentication and Authorization Framework.
  • Authentication.
  • Authorization.
  • Types of Permissions.
  • Permission Levels.
  • Data Masking.

API

  • API version.
  • Meta Service API.
  • Field values.

Carga Horária.

  • 24 Horas.

Modalidade do Treinamento.

  • Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
  • On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
  • In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos.

  • Conhecimento Básico em Docker.
  • Conhecimento Básico em Banco de dados e SQL.

Requisitos:

  • Todos os participantes devem trazer um notebook para realizar as atividades práticas.
  • O Computador deve estar  com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
  • Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.

Requisitos Recomendados de Hardware.

  • Memória RAM: 12GB.
  • Espaço em Disco: 20GB.
  • Processador: 64 bits (chipsets de x64).
  • CPU: 4 núcleos.
  • Sistemas Operacionais: GNU/Linux, Windows ou Mac OS.

Material.

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

  • Todo o software Apache Doris e acessórios na sua última versão estável.
  • Material próprio em Português do Brasil.
  • Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
  • Apostilas com exercícios práticos (hacks) desenvolvidos no treinamento.
  • Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.

Metodologia.

  • Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Apache Doris e cursos Apache Doris. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores

Powered by BreezingForms

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 20 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

4.245 profissionais capacitados em 351 turmas ministradas.

Atuação global, 833 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Marcio Junior Vieira

  • 24 anos de experiência em tecnologia da informação, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
  • CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
  • Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
  • Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
  • Pesquisador pela UFG - Universidade de Goiás no CIAP - Centro de IA Aplicada às Políticas Públicas.
  • Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
  • Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay, PgConf e FTSL.
  • Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
  • Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
  • Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
  • Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
  • Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurveySuiteCRM e Camunda.
  • Especialista em implantação e customização de ECM com Alfresco e BPM com ActivitiFlowable e Camunda.
  • Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
  • Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
  • Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)

Log in