Treinamento PrestoDB - SQL query engine
Sobre o Treinamento.
Este treinamento capacita os alunos para com o Software PrestoDB. O Presto é um mecanismo de consulta distribuído para big data usando a linguagem de consulta SQL. Sua arquitetura permite que os usuários consultem fontes de dados como Hadoop, Cassandra, Kafka, AWS S3, Alluxio, MySQL, MongoDB e Teradata, e permite o uso de várias fontes de dados em uma consulta.
O que vou aprender?
Ao final deste treinamento você será capaz de:
- Empregar Presto conceitos-chave para otimizar os sistemas de big data modernos.
- Executar armazéns de escala de exabyte.
- Clone os dados para um sistema de armazenamento de dados proprietário.
- Configurar os principais recursos do PrestoDB.
- Utilizar as opções da interface do usuário do PrestoDB.
- Connectar-se com Ferramentas de Visualização.
Público-alvo.
Este treinamento é direcionado para as seguintes profissionais:
- Engenheiros de infraestrutura de Big Data.
- Engenheiro de Dados.
- Desenvolvedores.
- Cientistas de Dados.
Dificuldade.
Intermediário.
Aplicabilidade.
Este treinamento foi desenvolvido usando o PrestoDB 0.254 e foi modificado pela última vez em 02 de Março de 2023.
Conteúdo Programático
Introdução e conceituais.
- SQL ANSI.
- Query Engines.
- O que é o PrestoDB.
- Arquitetura do PrestoDB.
- Recursos e benefícios do PrestoDB
- Comparação com outras ferramentas de processamento de dados.
- Licenciamento (Free Software X Open Source).
- Empresas usando PrestoDB no mundo.
- Empresas usando PrestoDB no Brasil.
- Versões do PrestoDB.
- Comunidade PrestoDB no Brasil e no Mundo.
- Casos de Uso.
- Livros, sites, documentação e referências complementares.
Instalação e Configuração.
- Requisitos de hardware e software.
- Instalação do PrestoDB em diferentes sistemas operacionais.
- Configuração básica do PrestoDB.
Modelagem de Dados e Consultas
- SQL Statement Syntax.
- Tipos de dados suportados pelo PrestoDB.
- Modelagem de dados no PrestoDB.
- Consultas SQL básicas no PrestoDB.
- Consultas SQL avançadas no PrestoDB.
- Consultas distribuídas no PrestoDB.
- Filtrando dados.
- Migrando fontes de dados.
- Trabalhando com bandas de bolllinger.
- Benchmarking com TCHP.
- Trabalhando com conectores.
Administração e Gerenciamento de Cluster
- Web Interface.
- Tuning Presto.
- Properties Reference.
- Conceitos de gerenciamento de cluster no PrestoDB.
- Configuração de um cluster PrestoDB.
- Adição e remoção de nós do cluster.
- Monitoramento e solução de problemas do cluster.
Integração com outras Ferramentas
- Driver JDBC para PrestoDB.
- Integração com ferramentas de armazenamento de dados, como Hadoop HDFS, Amazon S3, Minio, e outros
- Integração com ferramentas de processamento de dados, como Apache Spark e Apache Flink.
- Integração com ferramentas de Business Intelligence e ETL (Pentaho, Hop).
Segurança
- Configuração de segurança.
- Password File Authentication.
- Authorization.
API
- HTTP Connector
- Presto Client REST API.
- Presto Worker REST API.
- SerializedPage Wire Format.
Uso Avançado
- Uso de funções personalizadas no PrestoDB.
- Uso de UDFs (User-Defined Functions) no PrestoDB.
- Uso de recursos avançados de segurança, como a criptografia de dados.
- Uso do PrestoDB em ambientes de produção.
Práticas recomendadas
- Melhores práticas para modelagem de dados e consultas no PrestoDB.
- Melhores práticas para gerenciamento de cluster no PrestoDB.
- Melhores práticas para integração com outras ferramentas.
- Melhores práticas para uso avançado do PrestoDB.
Carga Horária.
- 24 Horas.
Modalidade do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Pré-requisitos.
Este treinamento pressupõe que o aluno seja competente com as seguintes ferramentas, tecnologias e conceitos:
- Conhecimento básico em desenvolvimento Java.
- Conhecimento básico em arquitetura de microsserviços.
Requisitos:
- Todos os participantes devem trazer um notebook para realizar as atividades práticas.
- O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
- Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.
Requisitos Recomendados de Hardware.
- Memória RAM: 8GB.
- Espaço em Disco: 20GB.
- Processador: 64 bits (chipsts de x64).
- CPU: 2 núcleos.
- Sistemas Operacionais: GNU/Linux, Windows ou MacOS.
- VirtualBox.
Material.
Serão disponibilizados os seguintes materiais aos alunos do treinamento:
- Todos os softwares PrestoDB e acessórios na sua última versão estável.
- Material próprio em Português do Brasil.
- Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
- Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
- Apostilas com exercícios práticos desenvolvidos no treinamento.
- Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
- Brindes: Caneta, Pasta e Bloco de Anotações (somente em presenciais).
Metodologia.
- O treinamento apresenta uma empresa fictícia que necessita analisar dados de suas áreas e todas as fases da implantação.
- Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.
Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos PrestoDB e cursos PrestoDB. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.
Inscrições, Informações e Valores

Diferenciais da Ambiente Livre.
A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.
3.535 profissionais capacitados em 325 turmas ministradas.
Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.
Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.
Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.
Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.
Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.
Instrutor

Marcio Junior Vieira
- 22 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
- CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
- Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
- Professor de BPM no MBA de Business Intelligence da Universidade Positivo.
- Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
- Pesquisador pela Universidade de Brasília no Laboratório de Tecnologias da Tomada de Decisão - UnB/LATITUDE.
- Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
- Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay e FTSL.
- Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
- Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
- Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
- Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
- Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurvey, SuiteCRM e Camunda.
- Especialista em implantação e customização de ECM com Alfresco e BPM com Activiti, Flowable e Camunda.
- Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
- Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
- Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)