Treinamento Apache ORC
Sobre o Treinamento
Apache ORC é um formato de armazenamento de dados orientado a colunas gratuito e de código aberto. É semelhante a outros formatos de arquivo de armazenamento colunar disponíveis no ecossistema Hadoop, como RCFile e Parquet. Seu conteúdo programático oferece uma estrutura abrangente para um treinamento sobre Apache ORC, abordando desde os conceitos básicos até técnicas avançadas e aplicação prática em projetos.
Modalidades do Treinamento:
- In Company (Presencial ou Online) - Turmas fechadas para empresas a custo único para até 15 Alunos.
Conteúdo Programático.
Conceitual Apache ORC.
- O que é Apache ORC?
- Vantagens e benefícios do uso do Apache ORC.
- História e evolução do Apache ORC.
- Empresas usando Apache ORC no Brasil
- Apache ORC X Apache Parquet X RCFile.
Estrutura Interna do Apache ORC.
- Visão geral da estrutura de arquivo ORC.
- Compreensão dos tipos de dados suportados.
- Exploração da compactação e codificação de dados.
- ACID support.
- Types.
- Indexes.
Configuração e Instalação
- Instalação do Apache ORC em diferentes ambientes (local, cluster, cloud).
- Configuração inicial e ajustes recomendados.
- Building ORC.
Escrita de Dados no Formato ORC.
- Como escrever dados no formato ORC usando diversas linguagens (Python, Java, etc.).
- Melhores práticas para otimização da escrita.
- ORC Adopters.
Leitura de Dados no Formato ORC
- Como ler dados ORC em diferentes ambientes e linguagens.
- Otimização da leitura de dados.
Otimização e Desempenho
- Estratégias para otimizar consultas em dados ORC.
- Uso de índices e estatísticas para melhorar o desempenho.
Compactação e Particionamento
- Estratégias para compactação eficiente de dados ORC.
- Particionamento de dados para melhorar o desempenho.
Integração com Ferramentas de Big Data
- Integração do Apache ORC com ecossistemas de Big Data como Hadoop e Spark.
- Uso de ORC em pipelines de dados.
- Java Tools.
- Hive DDL.
- Hive Configuration.
Casos de Uso Avançados
- Estudos de caso avançados de uso do Apache ORC em ambientes reais.
- Migração de dados para o formato ORC.
- Spark DDL.
- Spark Configuration.
Projeto Prático
- Desenvolvimento de um projeto prático utilizando o Apache ORC.
- Implementação de técnicas aprendidas ao longo do curso.
Carga Horária:
- 16 Horas de duração.
Modalidades do Treinamento:
- Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
- On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Pré-Requisitos:
- Conhecimento de comandos e servidores Linux.
- Conhecimento básico de desenvolvimento.
Requisitos:
- Todos os participantes devem trazer um notebook para realizar as atividades práticas.
- O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
- Para Online ter uma boa conectividade com a Internet.
- Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.
Requisitos mínimos de hardware
- Memória RAM : 8GB
- Espaço em Disco: 20GB
- Processador: Dual-core AMD 64, EM64T
- Sistemas Operacionais: GNU/Linux, Windows, MacOS.
- VirtualBox.
Material
Serão disponibilizados os seguintes materiais aos alunos do treinamento:
- Todos os softwares Apache ORC e acessórios na sua última versão estável.
- Material próprio em Português do Brasil.
- Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
- Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
- Apostilas com exercícios práticos desenvolvidos no treinamento.
- Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
- Caneta, Pasta e Bloco de Anotações.
Metodologia
- Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.
Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Apache ORC e cursos Apache ORC. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.
Diferenciais da Ambiente Livre.
A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.
3.535 profissionais capacitados em 325 turmas ministradas.
Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.
Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.
Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.
Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.
Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.
Inscrições, Informações e Valores