Apache Kudu

Apache Kudu

Sobre o Treinamento

O HUE (Hadoop User Experience) é uma interface de usuário web que facilita o uso do ecossistema Hadoop para processamento de big data. Este treinamento fundamental em HUE prepara profissionais para explorar e utilizar eficientemente as ferramentas do Hadoop para análise e processamento de dados em larga escala. Seu conteúdo programático foi desenvolvido para capacitar os participantes a dominar as técnicas essenciais necessárias para lidar com big data de forma eficaz.

Modalidades do Treinamento:

In Company (Presencial ou Online) - Turmas fechadas para empresas a custo único para até 15 Alunos.

Conteúdo Programático.

Conceitual Opensearch.

Introdução a Pesquisas.
Apache Lucene/Elasticsearch.
Elasticsearch no ecossistema de Big Data.
Opensearch Stack.
Text Analytics e Geo Search.
Terminologias.
Cases de Opensearch.
Empresas usando Opensearch no Brasil
Elasticsearch X AWS Opensearch X Apache Solr.

Instalação do Opensearch.

Instalando um nó de Opensearch.
Iniciando o Opensearch.

Fundamentos do Opensearch

Arquitetura do Opensearch.
Sharding.
Arquivos Básicos.
Conceitos Básicos.
Admin UI.
Adicionando conteúdo ao Opensearch.
Alterando parâmetros da URL.
Adicionando conteúdo personalizado.
indexando coleções de documentos.
Deletando documentos.
Pesquisando Documentos
Operações de CRUD.

Índices no Opensearch.

Introdução aos índices no Opensearch.
Estrutura de um índice: documentos, shards e réplicas.
Criação de um índice
Configurações de índice e mapeamento de tipos.
Indexação de documentos
Tokenização.
Normalização.
Encontrando a raiz das palavras.
Stopwords.
Sinônimos.
Erros ortográficos
Analysis.
Index Shard Allocation.
Index blocks.
Mapper.
Merge.
Similarity module.
Slow Log.
Index Sorting.

Configurações do Opensearch.

Introdução às configurações no Opensearch.
Arquivo de configuração Opensearch.yml.
Configuração de armazenamento (caminho de dados e log).
Configuração de plugins e módulos.
Configuração de indexação e busca.
Configuração de idioma.

Cluster

O modelo distribuído.
Configuração de um cluster Opensearch.
Configurações de rede e descoberta de nós.
Shards: número, tamanho e alocação
Réplicas e alta disponibilidade.

API

API Opensearch.
EQL search APIs.
Data stream APIs

Opensearch e Java

Overview.
Apache Maven.
Setup do Ambiente de Desenvolvimento.
Java client.
Conectando ao Opensearch.
Java Low Level REST Client.
Indexando documentos.

Logstash

Instalação e Configuração.
Inputs, Filters, and Outputs.
Backup and restore.
Melhores práticas.

Openseach Dashboard

Instalação e configuração.
Time Picker, Search, and Filters.
Opensearch Discover, Visualization, and Dashboard Interfaces.
Backup and restore
Melhores práticas.

Monitoramento

Monitoramento.
Desdobramento, desenvolvimento.
Manutenção e otimização básica.

Carga Horária:

32 Horas de duração.

Modalidades do Treinamento:

Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos:

Conhecimento de comandos e servidores Linux.
Conhecimento básico de desenvolvimento.

Requisitos:

Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para Online ter uma boa conectividade com a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware

Memória RAM : 8GB
Espaço em Disco: 20GB
Processador: Dual-core AMD 64, EM64T
Sistemas Operacionais: GNU/Linux, Windows, MacOS.
VirtualBox.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Todos os softwares Opensearch e acessórios na sua última versão estável.
Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
Apostilas com exercícios práticos desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Caneta, Pasta e Bloco de Anotações.

Metodologia

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Opensearch e cursos Opensearch. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Inscrições, Informações e Valores

Instrutor

Marcio Junior Vieira

Marcio Junior Vieira

22 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
Professor de BPM no MBA de Business Intelligence da Universidade Positivo.
Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
Pesquisador pela Universidade de Brasília no Laboratório de Tecnologias da Tomada de Decisão - UnB/LATITUDE.
Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay e FTSL.
Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurvey, SuiteCRM e Camunda.
Especialista em implantação e customização de ECM com Alfresco e BPM com Activiti, Flowable e Camunda.
Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)

Related items

Latest from Marcio Junior Vieira

Log in

create an account