big data - Ambiente Livre

Treinamento em Scylla - Fundamental

Publicado em Big Data

O treinamento fundamental em Scylla Database NoSQL prepara profissionais para o mercado de trabalho com um banco de dados distribuído altamente escalável. Seu conteúdo programático foi desenvolvido para que profissionais possam implementar soluções de Big Data e NoSQL em suas corporações. O mesmo abrange, conceitos, conhecimentos de uso dos softwares, interação programática e atividades práticas.

Conteúdo Programático.

Conceitual Scylla.

O que é Big Data?
Visão geral sobre Scylla.
Características Gerais do Scylla.
Ecossistema de Big Data e Scylla.
Scylla X Outros NoSQL.
Apache Cassandra X DataStax X Scylla.
Cases do uso de Scylla.

Características do Scylla.

Escalabilidade Linear.
Alta disponibilidade.
Alto desempenho.
NoSQL X SQL.
CAP Theorem.
Arquitetura.
Tolerância a Falhas.
Versões do Scylla.

Instalação do Scylla

Requisitos de Instalação.
Adquirindo os pacotes de Instalação.
Modo de Instalação.
Configuração um cluster Scylla.
Iniciando o cluster com seus nós.
Introdução ao nodetools.

SDM e CQL (Scylla Data Model e Cassandra Query Language )

A linguagem CQL.
Flexibilidade do CQL.
Tables.
Column Family.
Row Key.
Columns, Columns name e Columns Values.
KeySpace.
Timestamps.
Partition Key Simples e Composta e Indexação.
Insert.
Select.
Consultas indexadas.
Batch Statements.

Assuntos Complementares.

Balanceamento de carga.
Testes de Stress no Cluster.
Suporte a MapReduce no Hadoop.
Apache Spark e Scylla.
Backups.
Certificações em Scylla.

Carga Horária:

24 Horas de duração.

Modalidades do Treinamento:

Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos:

Conhecimento de comandos e servidores Linux.
Conhecimento básico de programação.
Conhecimento Básico em modelo de dados, banco de dados e SQL.

Requisitos:

Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para OnLine ter uma boa conectividade com a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware

Memória RAM : 8GB
Espaço em Disco: 20GB
Processador: Dual-core AMD 64, EM64T
Sistemas Operacionais: GNU/Linux, Windows, MacOS.
VirtualBox.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Todos os softwares Scylla e acessórios na sua última versão estável.
Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
Apostilas com exercícios práticos desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Caneta, Pasta e Bloco de Anotações.

Metodologia

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Scylla e cursos Scylla. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores.

Powered by BreezingForms

Instrutor

Leia mais...

Treinamento Apache Parquet

Publicado em Big Data

O treinamento em Apache Parquet tem foco em aprofundar o conhecimento de engenheiros de dados do formato mais utilizado pelos ambiente de Big data da atualidade, além dos conceitos, vantagens e arquitetura os profissionais poderão administrar a forma mais interessante do Parquet para seu ambiente de dados / big data. O treinamento passa pelo fundamental e estende-se ao avançado.

Calendário de turmas.

Somente no modelo corporativo no momento.

Conteúdo Programático

Conceitual.

Introdução a Big Data.
Arquivos serializados.
Formato Colunar.
O Software Apache Parquet.
Motivações do Parquet.
Software Livre x Open Source.
Licenciamento.
Apache Software Foundation.
Histórico do Parquet.
Empresas usando Parquet no Mundo.
Empresas usando Parquet no Brasil.
Comunidade Parquet.
Versões do Parquet.

Apache Parquet

Arquitetura do Apache Parquet.
Otimização com Parquet.
Parquet x JSON x CSV x Apache ORC.
Tipos de dados.
Block.
File.
Row group.
Column chunk
Page.
Metadata.
Nested Encoding.

Compactação e Criptogratia.

Tipos de Compactação.
Vantagens e Desvantagens.
Criptografia do Parquet.

Parquet no Ecossistema de Big Data.

Hive e Parquet.
Spark e Parquet.
Hadoop Input/Output e Parquet.
Pentaho Data Integration e Parquet.

Build

Apache Maven.
Compilando o Parquet.

Módulos

Apache Parquet for C++.
Apache Parquet em Rust.
Parquet MR.

Parquet na Cloud.

AWS S3 Inventory

Gerais.

Extendendo o Parquet.
Config Row group size.
Config Data page size

Carga Horária.

4 Horas.

Modalidade do Treinamento.

Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos.

Conhecimento Básico em algum Sistema Operacional (Windows, Linux ou MAC)
Conhecimento Básico de de Hadoop e HDFS.

Requisitos:

Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.

Requisitos Recomendados de Hardware.

Memória RAM: 8GB.
Espaço em Disco: 20GB.
Processador: 64 bits (chipsets de x64).
CPU: 2 núcleos.
Sistemas Operacionais: GNU/Linux, Windows ou Mac OS.

Material.

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Todos os softwares Apache Parquet e acessórios na sua última versão estável.
Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas com exercícios práticos (hacks) desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Brindes: Caneta, Pasta e Bloco de Anotações. (Somente em presenciais)

Metodologia.

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Apache Parquet e cursos Apache Parquet . caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores

[No form id or name provided!]

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Leia mais...

Treinamento Real-Time Analytics com Apache Spark Streaming e Python

Publicado em Big Data

O treinamento Real-Time Analytics com Apache Spark Streaming e Python foi desenvolvido para que os alunos possam após o treinamento ser capaz de construir aplicações de Big Data e Analytics em Real-Time, usando as tecnologias mais modernas para processamento massivo o Spark Streaming com apoio de bibliotecas Python como Pandas e Numpy, são abordados conhecimentos de arquitetura e ecossistemas fundamentais para a programação com a linguagem Python e o Framework de Open Source Apache Spark, usando os modulos Apache Spark Streaming e Spark Machine Leaning Lib. Entender os principais conceitos e fluxo de trabalho de implementação, dominar tópicos avançados de manipulação de RDDs e DataFrames, e saber escrever scripts Spark com acesso a HDFS e interações com outros projetos do ecossistema Hadoop necessários para a análise de dados. Saber fazer uso de motores de processamento e desenvolver soluções que utilizam componentes em todo hub de dados da empresa. Ser capaz de construir aplicativos usando Apache Spark para processamento de stream combinando dados históricos com dados de streaming, através de análises interativas em tempo real e finalizar apresentando as informações em componentes de visualização de dados.

Calendário de turmas.

Somente turma corporativas.

Conteúdo Programático

Conceitual Big Data e Streaming.

Streaming de Dados.
Stream X Batch.
Real-time Stream.
Visão geral sobre Hadoop.
Características do Hadoop.
Sistema distribuído de arquivos.
Ecossistema Hadoop.
Quem usa o Hadoop.
Cases do uso Hadoop.
Uso de Hadware comum.
Distribuições do Hadoop (Cloudera x Hortonworks x Apache).
Free Software(GLP) X Open Source(BSD, Apache, etc)
Apache Software Foundation.
Kafka x RabbitMQ x Spark Stream x Flink Stream.

Instalação do Ambiente Python e Spark.

Pré-requisitos.
Instalando o Python.
Instalando uma IDE Python.
Conhecendo o PyPI.
Instalando Pandas.
Instalando Numpy.
Instalando Pyarrow.
Instalando Py4J.
Instalando o Spark.
Modos do Spark.
Standalone Cluster.

Programação Funcional em Python e PySpark.

O que é programação funcional?
Literais funcionais e Closures.
Recursão.
Tail Calls.
Estruturas de Dados Funcionais.
Parâmetros das Funções implícitas.
Chamada por nome.
Chamada por Valor.
PySpark.
Python Package Management.
Virtualenv.
PEX.

Primeiros passos em Apache Spark

Invocando Spark Shell.
Criando o Contexto Spark.
Carregando um arquivo no Shell.
Realizando algumas operações básicas em arquivos em Spark Shell.
Construindo um Projeto com sbt.
Executando o Projecto Spark com sbt.
Caching Overview, Persistência Distribuído.

RDD - Resilient Distributed Dataset

Transformações no RDD.
Ações em RDD.
Carregando dados em RDD.
Salvando dados através RDD.
Key-Value Pair RDD.
MapReduce e Operações RDD Pair.
Integração Python e Hadoop.
Arquivos de seqüência.
Usando Partitioner e seu impacto na melhoria do desempenho.

Formatos de Armazenamento

Trabalhando arquivos CSV com Spark.
Trabalhando arquivos JSON com Spark.
Trabalhando arquivos XML com Spark.
Parsing XML com Spark RDD.
Introdução ao Apache Parquet.
Trabalhando com arquivos Parquet.

Apache Spark SQL e PySpark.

DataFrame API.
Spark SQL.
Arquitetura Spark SQL.
Analyze Spark SQL.
Context em Spark SQL.
UDF.
Spark Session.
Column API.
Data Types.
Row.
Function.
Window.
Grouping.

Apache Spark e Pandas.

Apache Arrow.
Convertendo dados para o Pandas.
Pandas UDF.
Pandas Function.
PyArrow.

Analise de Dados com Python.

NumPy.
Pandas.
Slicing com NumPy.
Reshaping Arrays.
Pandas e Dataframes.
Pandas - Multi Dimension.
Pandas - Group By.
Pandas - Rashape.
Map,Filter e Reduce.
Lambda.
NumPy - Join,Split.
Array Numpy.
SQL Join Tables Pandas.
Pandas, NumPy e PySpark.

Apache Spark Streaming

Spark Streaming.
Query Management.
Fluxo do Streaming de Dados.

Apache Spark MLlib

Machine Learning com Apache Spark.
Aprendizagem Supervisionada.
Aprendizagem Não Supervisionada.
Aprendizagem por Reforço.
MapReduce com PySpark.
DStreams.
Spark MLLib - Regressão Linear.
Spark MLLib - Classificação com Algoritmo Decision Tree.
Spark MLLib - Classificação com Algoritmo Random Forest.
Spark MLLib - Classificação com Algoritmo Naive Bayes.
Spark MLLib - Clusterização com Algoritmo K-Means.
Spark MLLib - Algoritmos de Recomendações.

Data Visualization Tools.

Técnicas de Data Visualization.
Matplotlib.
Seaborn.
ggPlot.

Carga Horária:

32 Horas.

Pré-requisitos dos Participantes:

Conhecimento em Programação e Python.
Conhecimento de Banco de Dados e SQL.
Conhecimento Básico de Linux.
Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.

Requisitos mínimos de hardware:

Memória RAM : 8GB.
Espaço em Disco: 10GB.
Processador: Dual-core AMD 64, EM64T
deve estar ativo a Virtualização na BIOS do equipamento.
Sistemas Operacionais:Qualquer um com suporte e Virtualização com VirtualBox.
VirtualBox ( https://www.virtualbox.org/ ).
Obs. Equipamentos com menos que 8GB de Memória RAM (entre 5GB e 8GB) podem passar por lentidão nas atividades de uso de maquinas virtuais simultâneas no treinamento. Equipamentos com 4GB ou inferior não funcionarão para o treinamento.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Todos os softwares Apache Spark e Python e acessórios na sua última versão estável.
Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
Apostilas com exercícios práticos desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Caneta, Pasta e Bloco de Anotações (Quando presencial).

Metodologia

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas

Contato

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Inscrições, Informações e Valores

[No form id or name provided!]

Instrutor

Leia mais...

Treinamento Apache Spark com Databricks Plataform

Publicado em Big Data

O curso ou treinamento Apache Spark com Databricks foi desenvolvido para que os alunos possam após o treinamento ser capaz de construir aplicações de Big Data usando uma das tecnologias mais modernas para processamento massivo o Spark da DataBricks na AWS (Amazon Web Services), Microsoft Azure ou Google Cloud, são abordados conhecimentos de arquitetura e ecossistemas fundamentais para a programação com a linguagem Scala e o Framework Apache Spark. Entender as principais conceitos e fluxo de trabalho de implementação, dominar tópicos avançados de manipulação de RDDs, saber escrever scripts Spark e interações com outros projetos do ecossistema DataBricks necessários para a análise de dados. Saber fazer uso de motores de processamento e desenvolver soluções que utilizam componentes em todo hub de dados da empresa. Ser capaz de construir aplicativos usando Apache Spark para processamento de stream combinando dados históricos com dados de streaming, através de análises interativas em tempo real.

Turmas Somente inCompany

Conteúdo Programático

Conceitual Big Data e Databricks

Visão geral sobre Databricks.
Databricks Plataform.
Databricks Community X Databricks Premium.
Ecossistema Databricks.
Quem usa o Databricks.
Cases do uso Databricks.
Free Software(GLP) X Open Source(BSD e Apache).
Delta Lake.
Databricks na AWS.
Databricks na Azure (Azure Databricks).
Databricks Community.
change data capture (CDC).
Data engineering.
Scala X Python.

Cluster na Cloud.

Configurando o Ambiente na Azure.
Databricks Job scheduling.
Deploy Structured Streaming.

Notebooks.

Apache Zeppelin.
Interpreters.
Markdown.
Databricks Notebook.

Introdução a Linguagem Scala

Apresentando o Scala.
Instalando Scala.
Journey - Java para Scala
First Dive - Interactive Scala.
Escrevendo scripts Scala - Compilando Programas Scala.
Basico em Scala.
Tipos Básicos Scala.
Definindo Funções.
IDE para Scala.
Scala Community.

Linguagem Scala.

Imutabilidade em Scala - Semicolons.
Declaração método.
Literais.
Listas.
Tuplas.
Opções.
Maps.
Palavras reservadas.
Operadores.
Regras de precedência.
If Statements.
Scala Para Compreensão.
While Loops, Do-While Loops.
Operadores condicionais.
Pattern Matching.
Enumerações.
Traits Intro - Traits as Mixins.
Stackable Traits.
Criando Traits e OOPS - Classes and Objetos Básicos.
Construtores Scala.
Nested Classes.
Visibility Rules.

Programação Funcional em Scala.

O que é programação funcional?
Literais funcionais e Closures.
Recursão.
Tail Calls.
Estruturas de Dados Funcionais.
Parâmetros das Funções implícitas.
Chamada por nome.
Chamada por Valor.

Apache Spark no DataBricks.

Invocando Spark Shell.
Criando o Contexto Spark.
Carregando um arquivo no Shell.
Realizando algumas operações básicas em arquivos em Spark Shell.
Construindo um Projeto com sbt.
Executando o Projecto Spark com sbt.
Caching Overview, Persistência Distribuído.
Spark Streaming Overview.
Exemplo: Streaming Word Count.

RDD - Resilient Distributed Dataset no Databricks.

Transformações no RDD.
Ações em RDD.
Carregando dados em RDD.
Salvando dados através RDD.
Key-Value Pair RDD.
MapReduce e Operações RDD Pair.
Integração Scala e Hadoop.
Arquivos de seqüência.
Usando Partitioner e seu impacto na melhoria do desempenho.

SparkSQL e Dataframe no Databricks.

Dataframe.
SparkSQL
DataSets.
SparkSQL API.

Armazenamento

Databricks File System - DBFS.
Databricks IO Cache.
Amazon S3.
Trabalhando arquivos CSV com Spark.
Trabalhando arquivos JSON com Spark.
Trabalhando arquivos XML com Spark.
Introdução ao Apache Parquet.
Trabalhando com arquivos Parquet.

Apache Streaming e Delta

Spark Structured Streaming.
Spark Streaming Transformations.
Streaming Windows Transformations.
Create Dataframes.
Save DataFrames.
Tables and DataFrames.
Event Stream Processing (ESP).
Complex Event Processing (CEP).

Gerais

Visualizations.
SparkML.

Carga Horária:

32 Horas.

Pré-requisitos dos Participantes:

Todos alunos devem ter uma conta no Azure.
Conhecimento alguma linguagem de programação.
Noções de Big Data.
Conhecimento de Banco de Dados e SQL.
Conhecimento Básico de Linux.
Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware:

Memória RAM : 8GB.
Espaço em Disco: 10GB.
Processador: Dual-core AMD 64, EM64T
deve estar ativo a Virtualização na BIOS do equipamento.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
Apostilas com exercícios práticos desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Caneta, Pasta e Bloco de Anotações.

Metodologia

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas

Inscrições, Informações e Valores

[No form id or name provided!]

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Leia mais...

Treinamento Databricks Plataform com PySpark

Publicado em Big Data

O curso ou treinamento Databricks Plataform com PySpark foi desenvolvido para que os alunos possam após o treinamento ser capaz de construir aplicações de Big Data usando uma das tecnologias mais modernas para processamento massivo o Spark da DataBricks na AWS (Amazon Web Services), Microsoft Azure ou Google Cloud, são abordados conhecimentos de arquitetura e ecossistemas fundamentais para a programação com a linguagem Python e o Framework Apache Spark. Entender as principais conceitos e fluxo de trabalho de implementação, dominar tópicos avançados de manipulação de RDDs, saber escrever scripts Spark e interações com outros projetos do ecossistema DataBricks necessários para a análise de dados. Saber fazer uso de motores de processamento e desenvolver soluções que utilizam componentes em todo hub de dados da empresa. Ser capaz de construir aplicativos usando Apache Spark para processamento de stream combinando dados históricos com dados de streaming, através de análises interativas em tempo real.

Turmas Somente inCompany

Conteúdo Programático

Conceitual Big Data e Databricks

Visão geral sobre Databricks.
Databricks Plataform.
Databricks Community X Databricks Premium.
Ecossistema Databricks.
Quem usa o Databricks.
Cases do uso Databricks.
Free Software(GLP) X Open Source(BSD e Apache).
Delta Lake.
Databricks na AWS.
Databricks na Azure (Azure Databricks).
Databricks Community.
change data capture (CDC).
Data engineering.
Scala X Python.

Cluster na Cloud.

Configurando o Ambiente na Azure.
Databricks Job scheduling.
Deploy Structured Streaming.

Notebooks.

Apache Zeppelin.
Interpreters.
Markdown.
Databricks Notebook.

Introdução a Linguagem Python

O que é Python?
Apresentando Python.
Instalando Python.
Escrevendo scripts Python
Basico em Python.
Tipos Básicos Python.
Definindo Funções.
IDE para Python.

Programando em Python e Jython

Declaração método.
Literais.
Listas.
Tuplas.
Opções.
Maps.
Palavras reservadas.
Operadores.
Regras de precedência.
If, While Loops, Do-While Loops.
Operadores condicionais.
Pattern Matching.
Enumerações.

Programação Funcional em Python

O que é programação funcional?
Literais funcionais e Closures.
Recursão.
Tail Calls.
Estruturas de Dados Funcionais.
Parâmetros das Funções implícitas.
Chamada por nome.
Chamada por Valor.

Apache Spark no DataBricks.

Invocando Spark Shell.
Criando o Contexto Spark.
Carregando um arquivo no Shell.
Realizando algumas operações básicas em arquivos em Spark Shell.
Construindo um Projeto com sbt.
Executando o Projecto Spark com sbt.
Caching Overview, Persistência Distribuído.
Spark Streaming Overview.
Exemplo: Streaming Word Count.

RDD - Resilient Distributed Dataset no Databricks.

Transformações no RDD.
Ações em RDD.
Carregando dados em RDD.
Salvando dados através RDD.
Key-Value Pair RDD.
MapReduce e Operações RDD Pair.
Integração Scala e Hadoop.
Arquivos de seqüência.
Usando Partitioner e seu impacto na melhoria do desempenho.

SparkSQL e Dataframe no Databricks.

Dataframe.
SparkSQL
DataSets.
SparkSQL API.

Armazenamento

Databricks File System - DBFS.
Databricks IO Cache.
Amazon S3.
Trabalhando arquivos CSV com Spark.
Trabalhando arquivos JSON com Spark.
Trabalhando arquivos XML com Spark.
Introdução ao Apache Parquet.
Trabalhando com arquivos Parquet.

Apache Streaming e Delta

Spark Structured Streaming.
Spark Streaming Transformations.
Streaming Windows Transformations.
Create Dataframes.
Save DataFrames.
Tables and DataFrames.
Event Stream Processing (ESP).
Complex Event Processing (CEP).

Gerais

Visualizations.
SparkML.

Carga Horária:

32 Horas.

Pré-requisitos dos Participantes:

Conhecimento alguma linguagem de programação.
Noções de Big Data.
Conhecimento de Banco de Dados e SQL.
Conhecimento básico de Linux.
Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware:

Memória RAM : 8GB.
Espaço em Disco: 10GB.
Processador: Dual-core AMD 64, EM64T
deve estar ativo a Virtualização na BIOS do equipamento.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
Apostilas com exercícios práticos desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Caneta, Pasta e Bloco de Anotações.

Metodologia

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas

Inscrições, Informações e Valores

[No form id or name provided!]

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Leia mais...

Treinamento RabbitMQ

Publicado em Big Data

O treinamento em RabbitMQ e voltado para Desenvolvedores, Arquitetos e Administradores que tem a necessidade de trabalhar com Message-broker e suas aplicações ou arquiteturas complexas.

O Software RabbitMQ é um sistema de mensagens corporativas altamente confiável que implementa o AMQP (Advanced Message Queuing Protocol).

Calendário de turmas.

Somente no modelo corporativo no momento.

Conteúdo Programático.

Conceitual.

Introdução a Big Data.
Ecossistema de Filas.
O Software RabbitMQ.
Message-broker.
Advanced Message Queuing Protocol (AMQP).
MQ Telemetry Transport (MQTT)
Streaming Text Oriented Messaging Protocol (STOMP).
Software Livre x Open Source.
Pivotal.
Histórico do Parquet.
Empresas usando RabbitMQ no Mundo.
Empresas usando RabbitMQ no Brasil.
Comunidade RabbitMQ.
Versões do RabbitMQ.

RabbitMQ.

Arquitetura do RabbitMQ.
Consumer.
Producer.
Bindings consumers e producers.
Mensagens e durabilidade.
Como verificar a entrega.

Instalação do RabbitMQ.

Requisitos.
Pacotes e Repositórios.
RabbitMQ com Kubernetes Operator.
RabbitMQ com Docker.
Memória.

CLI Tools.

interface de linha de comando.
RabbitMQ CLI Tools.
rabbitmqctl.
rabbitmq-diagnostics.
rabbitmq-plugins.
rabbitmq-queues.

Administração do RabbitMQ.

rabbitmqadmin.
Start e Stop Nodes.
Configurações do RabbitMQ.
Privilégios.
Estatísticas e análise de registros.
Enviando alertas.
Processamento paralelo.
O plugin RabbitMQ Management.
Gerenciando RabbitMQ a partir do console da web.
Administração de usuários a partir do console da web.
Gerenciando a fila do console web.

Client Libraries.

Java Client.
Java e Spring.
Spring com RabbitMQ.
JMS Client.
Erlang Client.

Cluster RabbitMQ.

Arquitetura de um cluster.
Filas.
Configurando um cluster.
Distribuir os nodes.
Filas espelhadas.
Failover e Replication.
Load balancer-based.
Master/Slave.
Shovel.

RabbitMQ na Cloud.

Amazon EC2.
Tanzu RabbitMQ.

API REST.

API REST do RabbitMQ.
Estatísticas.

Gerais.

Pentaho Data Integration e RabbitMQ.

Carga Horária.

24 Horas.

Modalidade do Treinamento.

Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos.

Conhecimento Básico em algum Sistema Operacional (Windows, Linux ou MAC)
Conhecimento Básico de Programação.

Requisitos:

Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.

Requisitos Recomendados de Hardware.

Memória RAM: 8GB.
Espaço em Disco: 20GB.
Processador: 64 bits (chipsets de x64).
CPU: 2 núcleos.
Sistemas Operacionais: GNU/Linux, Windows ou Mac OS.

Material.

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Todos os softwares rabbitMQ e acessórios na sua última versão estável.
Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas com exercícios práticos (hacks) desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Brindes: Caneta, Pasta e Bloco de Anotações. (Somente em presenciais)

Metodologia.

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos em RabbitMQ e cursos em RabbitMQ. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores

[No form id or name provided!]

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Leia mais...

Consultoria em Big Data e Data Science

Publicado em Consultoria

Administrar os dados de sua empresa com metodologias, técnicas e ferramentas ideais pode colocar sua empresa em outro patamar. Em busca da produtividade dos serviços e produtos atuais, assim como inovação para criação de novos serviços e novos produtos. O Big Data é uma abordagem para armazenamento de um grande volume de dados de tipos variados, para que possam ser processados com alta velocidade mesmo com alto volume. O Data Science ou Ciência dos Dados é a ciência que busca encontrar insights relevantes e úteis para seus negócios.

Leia mais...

Treinamento mlFlow - Machine Learning Lifecycle

Publicado em Data Science

O treinamento mlFlow foi elaborado para apresentar e conceituar toda plataforma e o ciclo de vida do machine learning, e atende as necessidades da mlOps, sendo o cientista de dados o profissional mais atuante nesta ferramenta. O MLflow é uma plataforma para otimizar o desenvolvimento de aprendizado de máquina, incluindo experimentos de rastreamento, código de empacotamento em execuções reproduzíveis e compartilhamento e implantação de modelos. O MLflow oferece um conjunto de APIs leves que podem ser usadas com qualquer aplicativo ou biblioteca de aprendizado de máquina existente (TensorFlow, PyTorch, XGBoost etc.), onde quer que você execute o código ML (por exemplo, em notebooks, aplicativos autônomos ou na nuvem).

Calendário de turmas.

Somente no modelo corporativo no momento.

Conteúdo Programático

Conceitual.

Introdução a Data Science.
O profissional Data Scientist.
O Software mlFlow.
Software Livre x Open Source.
Licenciamento.
Databricks.
Histórico do mlFlow.
Empresas usando mlFlow no Mundo.
Empresas usando mlFlow no Brasil.
Comunidade mlFlow.
Versões do mlFlow.
Casos de Uso.

mlFlow fundamentos.

Machine Learning Workflow.
componentes do mlFlow.
Arquitetura do mlFlow.
Escalabilidade e Big Data.
A plataforma mlFlow.
O Workflow.
Linguagens suportadas.
Bibliotecas suportadas.
Jupyter Notebook.

Linguagem Python.

Apresentando Python.
Escrevendo scripts Python.
Básico em Python.
Tipos Básicos Python.
Definindo Funções.
IDE para Python.
mlFlow Python API.

Instalação.

Instalando o Python.
Instalando o mlFlow.
Instalando o Jupyter.
Instalando o Numpy.
Instalando Pandas.

mlFlow Tracking.

Scikit-learn autologging.
Local Tracking com SQLite.
Tracking Server.
Remore Tracking Server.
Artifact Stores.
Fast.ia
Tracking UI.
MLflowClinet.
Bibliotecas suportadas.

mlFlow Models.

Model Schemas.
Input examples.
Input Schema.
Output Schema.
Validate inputs.
Storage Format.
MLmodel Format.
Model Signature.
Spark MLlib.
Python Function.
Spacy Model.
Deployment com Docker.
Deployment com Apache Spark.
Deployment Plugins.
Model API.
Model Customization.

mlFlow Projects.

Backend plugins
YARN.
Arquivo MLproject.
Empacotando projetos.
Executando com Conda.
Executando com Docker.

mlFlow Model Registry.

UI Workflow.
Adicionado Modelos no Registry.
CRUD Models.
Tags.
Versionamento.
Arquivamento.
Lyfecyle.
API Workflow.

mlFlow na Cloud.

Deployment no Azure ML.
Deployment no AWS SageMaker.

Gerais.

Como criar um plugin para mlFlow.

Carga Horária.

24 Horas.

Modalidade do Treinamento.

Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos.

Conhecimento Básico em algum Sistema Operacional (Windows, Linux ou MAC)
Conhecimento Básico de Machine Learning e Data Science.
Conhecimento em alguma linguagem de programação.

Requisitos:

Todos os participantes devem trazer um notebook para realizar as atividades práticas.
O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.

Requisitos Recomendados de Hardware.

Memória RAM: 8GB.
Espaço em Disco: 20GB.
Processador: 64 bits (chipsets de x64).
CPU: 2 núcleos.
Sistemas Operacionais: GNU/Linux, Windows ou Mac OS.

Material.

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

Todos os softwares mlFlow e acessórios na sua última versão estável.
Material próprio em Português do Brasil.
Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
Apostilas com exercícios práticos (hacks) desenvolvidos no treinamento.
Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Brindes: Caneta, Pasta e Bloco de Anotações. (Somente em presenciais)

Metodologia.

Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos mlFlow e cursos mlFlow . caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores

[No form id or name provided!]

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 19 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Leia mais...

Big Data/Data Science

Conteúdo Programático.

Conceitual Scylla.

Características do Scylla.

Instalação do Scylla

SDM e CQL (Scylla Data Model e Cassandra Query Language )

Assuntos Complementares.

Carga Horária:

Modalidades do Treinamento:

Pré-Requisitos:

Requisitos:

Requisitos mínimos de hardware

Material

Metodologia

Inscrições, Informações e Valores.

Instrutor

Calendário de turmas.

Conteúdo Programático

Conceitual.

Apache Parquet

Compactação e Criptogratia.

Build

Módulos

Parquet na Cloud.

Gerais.

Carga Horária.

Modalidade do Treinamento.

Pré-Requisitos.

Requisitos:

Requisitos Recomendados de Hardware.

Material.

Metodologia.

Inscrições, Informações e Valores

Diferenciais da Ambiente Livre.

Instrutor

Calendário de turmas.

Conteúdo Programático

Conceitual Big Data e Streaming.

Instalação do Ambiente Python e Spark.

Programação Funcional em Python e PySpark.

Primeiros passos em Apache Spark

RDD - Resilient Distributed Dataset

Formatos de Armazenamento

Apache Spark SQL e PySpark.

Apache Spark e Pandas.

Analise de Dados com Python.

Apache Spark Streaming

Apache Spark MLlib

Data Visualization Tools.

Carga Horária:

Pré-requisitos dos Participantes:

Requisitos mínimos de hardware:

Material

Metodologia

Diferenciais da Ambiente Livre.

Inscrições, Informações e Valores

Instrutor

Turmas Somente inCompany

Conteúdo Programático

Conceitual Big Data e Databricks

Cluster na Cloud.

Notebooks.

Introdução a Linguagem Scala

Linguagem Scala.

Programação Funcional em Scala.

Apache Spark no DataBricks.

RDD - Resilient Distributed Dataset no Databricks.

SparkSQL e Dataframe no Databricks.

Armazenamento

Apache Streaming e Delta

Gerais

Carga Horária:

Pré-requisitos dos Participantes:

Requisitos mínimos de hardware:

Material

Metodologia

Inscrições, Informações e Valores

Diferenciais da Ambiente Livre.

Instrutor

Turmas Somente inCompany