Apache Kudu

Apache Kudu

Sobre o Treinamento

O HUE (Hadoop User Experience) é uma interface de usuário web que facilita o uso do ecossistema Hadoop para processamento de big data. Este treinamento fundamental em HUE prepara profissionais para explorar e utilizar eficientemente as ferramentas do Hadoop para análise e processamento de dados em larga escala. Seu conteúdo programático foi desenvolvido para capacitar os participantes a dominar as técnicas essenciais necessárias para lidar com big data de forma eficaz.

Modalidades do Treinamento:

  • In Company (Presencial ou Online) - Turmas fechadas para empresas a custo único para até 15 Alunos.

Conteúdo Programático.

Conceitual Opensearch.

Instalação do Opensearch.

Fundamentos do Opensearch

  • Arquitetura do Opensearch.
  • Sharding.
  • Arquivos Básicos.
  • Conceitos Básicos.
  • Admin UI.
  • Adicionando conteúdo ao Opensearch.
  • Alterando parâmetros da URL.
  • Adicionando conteúdo personalizado.
  • indexando coleções de documentos.
  • Deletando documentos.
  • Pesquisando Documentos
  • Operações de CRUD.

 Índices no Opensearch.

  • Introdução aos índices no Opensearch.
  • Estrutura de um índice: documentos, shards e réplicas.
  • Criação de um índice
  • Configurações de índice e mapeamento de tipos.
  • Indexação de documentos
  • Tokenização.
  • Normalização.
  • Encontrando a raiz das palavras.
  • Stopwords.
  • Sinônimos.
  • Erros ortográficos
  • Analysis.
  • Index Shard Allocation.
  • Index blocks.
  • Mapper.
  • Merge.
  • Similarity module.
  • Slow Log.
  • Index Sorting.

Configurações do Opensearch.

  • Introdução às configurações no Opensearch.
  • Arquivo de configuração Opensearch.yml.
  • Configuração de armazenamento (caminho de dados e log).
  • Configuração de plugins e módulos.
  • Configuração de indexação e busca.
  • Configuração de idioma.

Cluster

  • O modelo distribuído.
  • Configuração de um cluster Opensearch.
  • Configurações de rede e descoberta de nós.
  • Shards: número, tamanho e alocação
  • Réplicas e alta disponibilidade.

API

  • API Opensearch.
  • EQL search APIs.
  • Data stream APIs

Opensearch e Java

  • Overview.
  • Apache Maven.
  • Setup do Ambiente de Desenvolvimento.
  • Java client.
  • Conectando ao Opensearch.
  • Java Low Level REST Client.
  • Indexando documentos.

Logstash

  • Instalação e Configuração.
  • Inputs, Filters, and Outputs.
  • Backup and restore.
  • Melhores práticas.

Openseach Dashboard

  • Instalação e configuração.
  • Time Picker, Search, and Filters.
  • Opensearch Discover, Visualization, and Dashboard Interfaces.
  • Backup and restore
  • Melhores práticas.

Monitoramento

  • Monitoramento.
  • Desdobramento, desenvolvimento.
  • Manutenção e otimização básica.

Carga Horária:

  • 32 Horas de duração.

Modalidades do Treinamento:

  • Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
  • On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
  • In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos:

  • Conhecimento de comandos e servidores Linux.
  • Conhecimento básico de desenvolvimento.

Requisitos:

  • Todos os participantes devem trazer um notebook para realizar as atividades práticas.
  • O Computador deve estar  com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
  • Para Online ter uma boa conectividade com a Internet.
  • Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware

  • Memória RAM : 8GB
  • Espaço em Disco: 20GB
  • Processador: Dual-core AMD 64, EM64T
  • Sistemas Operacionais: GNU/Linux, Windows, MacOS.
  • VirtualBox.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

  • Todos os softwares Opensearch e acessórios na sua última versão estável.
  • Material próprio em Português do Brasil.
  • Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
  • Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
  • Apostilas com exercícios práticos desenvolvidos no treinamento.
  • Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
  • Caneta, Pasta e Bloco de Anotações.

 

Metodologia

  • Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Opensearch e cursos Opensearch. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Inscrições, Informações e Valores

Powered by BreezingForms


Instrutor

Marcio Junior Vieira

  • 22 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
  • CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
  • Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
  • Professor de BPM no MBA de Business Intelligence da Universidade Positivo.
  • Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
  • Pesquisador pela Universidade de Brasília no Laboratório de Tecnologias da Tomada de Decisão - UnB/LATITUDE.
  • Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
  • Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay e FTSL.
  • Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
  • Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
  • Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
  • Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
  • Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurveySuiteCRM e Camunda.
  • Especialista em implantação e customização de ECM com Alfresco e BPM com ActivitiFlowable e Camunda.
  • Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
  • Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
  • Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)