Treinamento Weka - Pentaho Data Mining- Inteligência Artificial, Machine Learning e Data Mining
Sobre o Treinamento
O treinamento passa uma visão fundamental e prática de como trabalhar com Inteligência Artificial, Machine Learning e Data Mining e o uso de ferramentas de mineração, os benefícios e os estudos sobre os dados, assim como a descoberta de conhecimento sobre bases de dados. Será apresentado como o Data Mining através da Inteligência Artificial (IA) e do Aprendizado de Máquina pode ajudar na melhoria dos negócios nas corporações e em suas estratégias.
Objetivo
Apresentar conceitos importantes sobre Inteligência Artificial (IA), Machine Learning (ML) e como aplicá-los nas principais funcionalidades e técnicas de mineração de dados usando o Weka (Pentaho Data Mining).
Público Alvo
DBAs, gestores, desenvolvedores de sistemas, cientistas de dados, analistas de negocio, analistas de suporte e estatísticos.
Conteúdo Programático:
Conceitual:
- O que é Inteligência?
- Natureza do Conhecimento Humano.
- Distinção entre dados, Informação e Conhecimento.
- Os Sistemas Inteligentes.
- Introdução a Inteligência Artificial.
- Introdução a Machine Learning / Aprendizado de Máquina.
- Introdução a Data Mining / Mineração de dados.
- Motivações para Data Mining.
- Cadeia de valores.
- KDD.
- KDD X Data Mining.
- Seleção e Pré-Processamento.
- Sumarização.
- Classificação.
- Regressão.
- Associação.
- Agrupamento.
- Aprendizagem Não Supervisionada
- Aprendizagem Supervisionada
- Aprendizagem por Reforço
- Extração de características
- MBA - Market Basket Analysis.
- Web Mining.
- Uso do Data Mining na gestão estratégica de empresas.
- Terminologia para classificação.
- Matriz de confusão.
- Acurácia, Probabilidade.
- Recall.
- Bases de Treinamento.
O Software - Weka Data Mining
- Histórico do Weka (Pentaho Data Mining).
- Instalando o Weka.
- Interface e funcionalidades do Weka.
- Os algoritmos do Weka.
- Conhecendo o formato de arquivo ARRF.
- Atributos e tipos de de atributos do formato ARFF.
- Interpretação e Visualização de resultados.
- Técnicas de apresentação de resultados.
Tratamento de Dados com o Software Pentaho Data Integration e Pentaho Machine Intelligence.
- Introdução ao Software Pentaho Data Integration - PDI
- Instalando o Pentaho Data Integration.
- Integrações entre Pentaho Data Integration os plugins do Weka.
- Pentaho Machine Intelligence.
- Gerando ARRF através do Pentaho Data Integration (Kettle).
- Formado de dados em ARFF.
- Automação do processo de Data Mining.
Hand Ons - Machine Learning e Data Mining.
- Usando o algoritmo de classificação j48 (árvores de decisão).
- Praticando a seleção e remoção de campos para encontrar insights interessantes e relevantes.
- Executando algoritmos de classificação de forma supervisionada e não supervisionada.
- Clusterizando dados com o Algoritmo SimpleKMeans.
- Realizando uma regressão Linear com o Algoritmo LinearRegression.
- Usando o algoritmo de associação APRIORI.
- APRIORI para analise de carinho de compra (MBA).
- Erros comuns e como evita-los
- Executando algoritmos por linha de comando.
- Realizando um trabalho prático com dados abertos.
Pré-Requisitos.
- Ter afinidade com gerenciamento de dados ( Planilhas Eletrônicas, Banco de Dados , CSVs , etc )
- Lógica de programação pode ajudar em alguns pontos do treinamento, mas é opcional.
Requisitos dos Alunos.
- Todos os participantes devem trazer um notebook para realizar as atividades práticas.
- O Computador deve estar com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
- Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.
Requisitos mínimos de hardware
- Memória RAM : 3GB
- Espaço em Disco: 2GB
- Processador: Dual-core AMD 64, EM64T
- Sistemas Operacionais : Linux, Windows , MacOS.
Carga Horária
- 16 Horas de Duração.
Modalidade do Treinamento:
- Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
- Online Ao Vivo - Fazemos a transmissão Online do Treinamento.
- In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.
Material
Serão disponibilizados os seguintes materiais aos alunos do treinamento:
- Todos os softwares Pentaho Data Integration e Weka Data Mining e acessórios na sua última versão estável.
- Material próprio em Português do Brasil.
- Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
- Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
- Apostilas com exercícios práticos desenvolvidos no treinamento.
- Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
Metodologia
- Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.
Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Pentaho e cursos Pentaho. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.
A marca Pentaho é uma marca registrada pelos seus respectivos proprietários.
Solicite Informações e Valores
Fotos dos treinamentos Pentaho Data Mining - Pentaho Machine Intelligence - Weka
Instrutor
Marcio Junior Vieira
- 24 anos de experiência em tecnologia da informação, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
- CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
- Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
- Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
- Pesquisador pela UFG - Universidade de Goiás no CIAP - Centro de IA Aplicada às Políticas Públicas.
- Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
- Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay, PgConf e FTSL.
- Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
- Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
- Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
- Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
- Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurvey, SuiteCRM e Camunda.
- Especialista em implantação e customização de ECM com Alfresco e BPM com Activiti, Flowable e Camunda.
- Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
- Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
- Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)