Treinamento Apache Doris
O Treinamento em Apache Doris tem foco em ensinar como explorar, armazenar e analisar grandes volumes de dados para Big Data Analytics e Data Warehousing. Abordamos desde a instalação e configuração até a otimização de consultas para alto desempenho, utilizando sua arquitetura OLAP colunar.
O Apache Doris é um banco de dados analítico open source, projetado para fornecer consultas SQL rápidas e eficientes, suportando cenários de Business Intelligence (BI), relatórios analíticos, dashboards e processamento de Big Data. Ele se integra com diversas ferramentas como Apache Flink, Apache Spark, Hadoop, Hive, Presto e Kafka, facilitando a ingestão e análise de dados em larga escala.
Dificuldade: Média.
Aplicabilidade.
Este treinamento foi desenvolvido usando o Apache Doris 2.1.8 e foi modificado pela última vez em 9 de Fevereiro de 2025.
Modalidades do Treinamento:
- Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
- On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Conteúdo Programático
Conceitual
- O que é Business Intelligence.
- O que é Data Warehouse.
- O que é Lakehouse.
- ETL (Extração, Transformação e Carga).
- Bases OLAP, ROLAP, MOLAP e OLTP.
- Sistemas Transacionais X Sistemas Dimensionais (OLTP X OLAP).
- Dimensões e Modelo Dimensional.
- Modelo Estrela (Star Schema).
- Software Livre x Open Source.
- Apache Software Foundation.
- Licença Apache 2.0.
Conceitual Apache Doris.
- A Plataforma Apache Doris.
- Arquitetura do Apache Doris.
- Licenciamento do Apache Doris.
- Histórico do Apache Doris.
- Empresas usando Apache Doris no Mundo.
- Empresas usando Apache Doris no Brasil.
- Comunidade Apache Doris.
Instalação do Apache Doris.
- Arquitetura do Apache Doris.
- Métodos de deploy.
- Instalando o Apache Doris.
- Customizando o deploy.
- Acessando o Apache Doris.
Table Design
- Data Model.
- Criando Tabelas.
- Data Partition.
- Rollup e Query.
- Index.
Data Import.
- Características de Importação.
- External Storage Data.
- Sincronização de dados.
- Local Data.
- Subscribe Kafka Data.
Data Export.
- Exportação de Dados.
- Export Table Structure
- Export Query Result
- Backup de Dados.
Update e Delete.
- Update
- Delete
- Batch Delere
- Sequence Column
Uso avançado.
- Schema Change.
- Data Cache.
- Materialized view.
- HLL ApproximateDe-duplication.
- Time Zone.
- Dynamic Partition
- Join Optimization.
- Bitmap Precise De-Duplication.
- Variables.
- File Manager
Ecossistema.
- Spark Doris Connector
- Seatunnel Connector.
- UDF
- Flink Doris Connector.
- DataX doriswriter
- Audit log plugin.
SQL.
- SQL Function.
- DML.
- Utility.
- DDL.
- Data Type.
Cluster .
- Cluster Upgrade.
- Statistics Query Execution.
- Metadata Operation.
- Config.
- Multi-tenancy.
- Elastic Scaling
- Manutenção e Monitoramento.
- Authoriry Management.
Segurança e Autenticação.
- Authentication and Authorization.
- Authentication and Authorization Framework.
- Authentication.
- Authorization.
- Types of Permissions.
- Permission Levels.
- Data Masking.
API
- API version.
- Meta Service API.
- Field values.
Carga Horária.
- 24 Horas.
Modalidade do Treinamento.
- Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
- On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Pré-Requisitos.
- Conhecimento Básico em Docker.
- Conhecimento Básico em Banco de dados e SQL.
Requisitos:
- Todos os participantes devem trazer um notebook para realizar as atividades práticas.
- O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
- Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.
Requisitos Recomendados de Hardware.
- Memória RAM: 12GB.
- Espaço em Disco: 20GB.
- Processador: 64 bits (chipsets de x64).
- CPU: 4 núcleos.
- Sistemas Operacionais: GNU/Linux, Windows ou Mac OS.
Material.
Serão disponibilizados os seguintes materiais aos alunos do treinamento:
- Todo o software Apache Doris e acessórios na sua última versão estável.
- Material próprio em Português do Brasil.
- Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
- Apostilas com exercícios práticos (hacks) desenvolvidos no treinamento.
- Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Metodologia.
- Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.
Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Apache Doris e cursos Apache Doris. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.
Inscrições, Informações e Valores

Diferenciais da Ambiente Livre.
A Ambiente Livre tem 20 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.
4.245 profissionais capacitados em 351 turmas ministradas.
Atuação global, 833 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.
Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.
Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.
Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.
Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.
Instrutor

Marcio Junior Vieira
- 24 anos de experiência em tecnologia da informação, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
- CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
- Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
- Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
- Pesquisador pela UFG - Universidade de Goiás no CIAP - Centro de IA Aplicada às Políticas Públicas.
- Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
- Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay, PgConf e FTSL.
- Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
- Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
- Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
- Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
- Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurvey, SuiteCRM e Camunda.
- Especialista em implantação e customização de ECM com Alfresco e BPM com Activiti, Flowable e Camunda.
- Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
- Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
- Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)