Big Data/Data Science

Treinamento Inteligência Artificial, Machine Learning e Data Mining com Weka - Pentaho Data Mining

Sobre o Treinamento

O treinamento passa uma visão fundamental e prática de como trabalhar com Inteligência Artificial, Machine Learning e Data Mining e o uso de ferramentas de Mineração, os benefícios e os estudos sobre os dados, assim como a descoberta de conhecimento sobre bases de dados. Será apresentado como o Data Mining através da IA e do Aprendizado de Maquina pode ajudar na melhoria dos negócios nas corporações e em suas estratégias.

Calendário de turmas abertas

  1. Turma Online Ao Vivo
  • Data: - -
  • Local: Google Meet e Plataforma Virtual da Ambiente Livre
  • Inscreva-se
next
prev

Objetivo

Apresentar conceitos importantes sobre IA, Machine Learning e como aplica-los nas principais funcionalidades e técnicas de mineração de dados usando o Weka ( Pentaho Data Mining ).

Público Alvo

DBAs, gestores, desenvolvedores de sistemas, cientistas de dados, analistas de negocio, analistas de suporte e estatísticos.

Conteúdo Programático:

Conceitual:

  • O que é Inteligência?
  • Natureza do Conhecimento Humano.
  • Distinção entre dados, Informação e Conhecimento.
  • Os Sistemas Inteligentes.
  • Introdução a Inteligência Artificial.
  • Introdução a Machine Learning / Aprendizado de Máquina.
  • Introdução a Data Mining / Mineração de dados.
  • Motivações para Data Mining.
  • Cadeia de valores.
  • KDD.
  • KDD X Data Mining.
  • Seleção e Pré-Processamento.
  • Sumarização.
  • Classificação.
  • Regressão.
  • Associação.
  • Agrupamento.
  • Aprendizagem Não Supervisionada
  • Aprendizagem Supervisionada
  • Aprendizagem por Reforço
  • Extração de características
  • MBA - Market Basket Analysis.
  • Web Mining.
  • Uso do Data Mining na gestão estratégica de empresas.
  • Terminologia para classificação.
  • Matriz de confusão.
  • Acurácia, Probabilidade.
  • Recall.
  • Bases de Treinamento.

O Software - Weka Data Mining

  • Histórico do Weka ( Pentaho Data Mining ).
  • Instalando o Weka.
  • Interface e funcionalidades do Weka.
  • Os algoritmos do Weka.
  • Conhecendo o formato de arquivo ARRF.
  • Atributos e tipos de de atributos do formato ARFF.
  • Interpretação e Visualização de resultados.
  • Técnicas de apresentação de resultados.

Tratamento de Dados com o Software Pentaho Data Integration e Pentaho Machine Intelligence.

    
Hand Ons - Machine Learning e Data Mining.

  • Usando o algoritmo de classificação j48 (árvores de decisão).
  • Praticando a seleção e remoção de campos para encontrar insights interessantes e relevantes.
  • Executando algoritmos de classificação de forma supervisionada e não supervisionada.
  • Clusterizando dados com o Algoritmo SimpleKMeans.
  • Realizando uma regressão Linear com o Algoritmo LinearRegression.
  • Usando o algoritmo de associação APRIORI.
  • APRIORI para analise de carinho de compra (MBA).
  • Erros comuns e como evita-los
  • Executando algoritmos por linha de comando.
  • Realizando um trabalho prático com dados abertos.

Pré-Requisitos.

  • Ter afinidade com gerenciamento de dados ( Planilhas Eletrônicas, Banco de Dados , CSVs , etc )
  • Lógica de programação pode ajudar em alguns pontos do treinamento, mas é opcional.

Requisitos dos Alunos.

  • Todos os participantes devem trazer um notebook para realizar as atividades práticas.
  • O Computador deve estar  com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
  • Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware

  • Memória RAM : 3GB
  • Espaço em Disco: 2GB
  • Processador: Dual-core AMD 64, EM64T
  • Sistemas Operacionais : Linux, Windows , MacOS.

Carga Horária

  • 16 Horas de Duração.

Modalidade do Treinamento:

  • Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
  • Online Ao Vivo - Fazemos a transmissão Online do Treinamento.
  • In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

  • Todos os softwares Pentaho Data Integration e Weka Data Mining e acessórios na sua última versão estável.
  • Material próprio em Português do Brasil.
  • Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
  • Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
  • Apostilas com exercícios práticos desenvolvidos no treinamento.
  • Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
  • Caneta, Pasta e Bloco de Anotações.

Metodologia

  • Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Pentaho e cursos Pentaho. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

A marca Pentaho é uma marca registrada pelos seus respectivos proprietários.

Próxima Turma

  • Data: - -
  • Local: Google Meet e Plataforma Virtual da Ambiente Livre
  • Inscreva-se
 


Solicite Informações e Valores

Powered by BreezingForms

Fotos dos treinamentos Pentaho Data Mining - Pentaho Machine Intelligence - Weka

 

Instrutor

Leia mais...

Treinamento Apache Mahout

Sobre o Treinamento

O treinamento Apache Mahout passa uma visão conceitual e prática de como trabalhar com o Mahout para mineração de dados e aprendizado de maquina em grandes clusters de Big Data. Será apresentado como o Data Mining pode ajudar na melhoria dos negócios nas corporações apartir de diversos algoritmos disponíveis neste software de cógido aberto.

Objetivo

Ministrar as principais características do Apache Mahout junto a uma visão geral dos algoritmos, e sua aplicação na solução de problemas de Data Mining em ambientes de Big Data.

Público alvo do treinamento

Cientistas de Dados, Gestores de TI, Analistas de Business Intelligence, Engenheiros da Computação, Programadores, Analistas de Negócio


Turmas Somente inCompany

 

Conteúdo Programático

Conceitual Big Data e Mahout

  • Visão geral sobre Hadoop.
  • Características do Hadoop.
  • Sistema distribuído de arquivos.
  • Ecossistema Hadoop.
  • Quem usa o Hadoop.
  • Cases do uso Hadoop.
  • Uso de Hadware comum.
  • Distribuições do Hadoop (Cloudera X Hortonworks X Apache).
  • Apache Spark MLib X Apache Mahout.
  • Histórico do Apache Mahout.
  • Casos de uso de Mahout.
  • Empresas usando Mahout no Mundo.

Introdução a Mahout

  • Arquitetura do Mahout.
  • Características do Mahout.
  • Versões do Mahout.

Instalação o Apache Mahout

  • Instalando o Mahout.
  • Mahout no Cluster Hadoop.
  • Configurações do Apache Mahout.

Algoritmos no Mahout

  • Algoritmos Mahout.
  • Recomendações no Mahout (Recomender System)
  • Representando Dados de Recomendação.
  • Classificação com Mahout (Naive Bayes).
  • Clusterização com Mahout (K-Means).

Desenvolvendo com Apache Mahout.

  • Samsara Scala-DSL
  • Mahout com Scala.
  • Mahout MapReduce.
  • Mahout com Apache Spark.
  • Mahout com Apache Flink.
  • Mahout com Apache Zeppelin.

Integração com outras Ferramentas.

  • Mahout e Hive.
  • Mahout e HDFS.
  • Mahout e Apache Pig.

Tunning.

  • JVM Tunning.

Carga Horária:

  • 24 Horas.

Pré-requisitos dos Participantes:

  • Conhecimento Básico em Programação Java ou alguma linguagem com Orientação Objeto.
  • Conhecimento de Banco de Dados e SQL.
  • Conhecimento Básico de Linux.
  • Todos os participantes devem trazer um notebook para realizar as atividades práticas.
  • O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
  • Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware:

  • Memória RAM : 8 GB.
  • Espaço em Disco: 20GB.
  • Processador: Dual-core AMD 64, EM64T
  • Deve estar ativo a Virtualização na BIOS do equipamento.
  • Sistemas Operacionais:Qualquer um com suporte e Virtualização com VirtualBox e 64Bits.
  • Oracle VM VirtualBox ( https://www.virtualbox.org/ ).
  • Obs. Equipamentos com menos que 8GB de Memória RAM (Entre 5GB e 8GB) podem passar por lentidão nas atividades de uso de maquinas virtuais simultâneas no treinamento. Equipamentos com 4GB ou inferior não funcionarão para o treinamento.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

  • Todos os softwares Apache Mahout e Hadoop e acessórios na sua última versão estável.
  • Material próprio em Português do Brasil.
  • Apresentações ( slides do treinamento ) desenvolvidas pela equipe Ambiente Livre.
  • Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
  • Apostilas com exercícios práticos desenvolvidos no treinamento.
  • Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
  • Caneta, Pasta e Bloco de Anotações.

Metodologia

  • Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas

Instrutor

Leia mais...

Consultoria em Big Data e Data Science

Administrar os dados de sua empresa com metodologias, técnicas e ferramentas ideais pode colocar sua empresa em outro patamar. Em busca da produtividade dos serviços e produtos atuais, assim como inovação para criação de novos serviços e novos produtos. O Big Data é uma abordagem para armazenamento de um grande volume de dados de tipos variados, para que possam ser processados com alta velocidade mesmo com alto volume. O Data Science ou Ciência dos Dados é a ciência que busca encontrar insights relevantes e úteis para seus negócios. 

Leia mais...