Apache Flume

Treinamento Apache Flume

O Apache Flume é um serviço distribuído, confiável e disponível para coletar, agregar e mover de forma eficiente grandes quantidades de dados de registro. Possui uma arquitetura simples e flexível baseada em fluxos de dados de streaming. É robusto e tolerante a falhas com mecanismos de confiabilidade ajustáveis e muitos mecanismos de failover e recuperação. Ele usa um modelo de dados extensível simples que permite a aplicação analítica on-line. O nosso treinamento prepara os alunos para trabalhar com fluxos de dados streaming para dar suporte a aplicações analíticas de Big Data com base em atividades conceituais e práticas.

Calendário de turmas.

Somente no modelo corporativo no momento.

Conteúdo Programático

Conceitual.

Introdução a Streaming.
Introdução a Big Data.
Ecossistema Hadoop.
O Software Apache Flume.
Software Livre x Open Source.
Licenciamento.
Apache Software Foundation.
Histórico do Flume.
Empresas usando Flume no Mundo.
Empresas usando Flume no Brasil.
Comunidade Flume.
Versões.

Arquitetura.

Arquitetura do Apache Flume.
Flume NG.
Modelo de Fluxo de Dados.
Variáveis de Ambiente.

Instalando o Apache Flume.

Requisitos do Apache Flume.
Configurando o Apache Flume.
Instalando o Apache Flume.
Configurando Componentes.
Iniciando Agents.

Flume Sources.

Avro.
Thrift.
Exec.
JMS.
Taildir.
Apache Kafka.
HTTP Source.
Custom source.

Flume Sinks.

Data Ingestion.
Flume Sinks
HDFS Sink.
Hive Sink.
Avro Sink.
Thrift Sink.
HBase Sink
Flume Sink Processors.

Flume Channel.

Flume Channels.
Memory Channel.
JDBC Channel.
Kafka Channel.
File Channel.
Spillable Memory Channel.
Pseudo Transaction Channel.
ElasticSearch Sink.
Custom Channel.
Flume Channel Selectors.
Event Serializers.
Flume Interceptors.

Gerais.

Raw Data.
Instalando Plugins.
Flume Properties.
Network Streams.
Multi agents.
Consolidação.
Segurança no Apache Flume.

Carga Horária.

16 Horas.

Modalidade do Treinamento.

Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos.

Conhecimento Básico em algum Sistema Operacional (Windows, Linux ou MAC)
Conhecimento Básico de de Hadoop e HDFS.
Conhecimento Básico de Kafka, JDBC e HBase.

Requisitos:

Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.

Requisitos Recomendados de Hardware.

Memória RAM: 8GB.
Espaço em Disco: 20GB.
Processador: 64 bits (chipsets de x64).
CPU: 2 núcleos.
Sistemas Operacionais: GNU/Linux, Windows ou Mac OS.

Material.

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Todos os softwares Apache Flume e acessórios na sua última versão estável.
Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas com exercícios práticos (hacks) desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Brindes: Caneta, Pasta e Bloco de Anotações. (Somente em presenciais)

Metodologia.

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Apache Flume e cursos Apache Flume . caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Marcio Junior Vieira

Marcio Junior Vieira

22 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
Professor de BPM no MBA de Business Intelligence da Universidade Positivo.
Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
Pesquisador pela Universidade de Brasília no Laboratório de Tecnologias da Tomada de Decisão - UnB/LATITUDE.
Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay e FTSL.
Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurvey, SuiteCRM e Camunda.
Especialista em implantação e customização de ECM com Alfresco e BPM com Activiti, Flowable e Camunda.
Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)

Ítens relacionados

Últimos posts de Marcio Junior Vieira

Log in

crie uma conta