Big Data/Data Science

Treinamento Inteligência Artificial, Machine Learning e Data Mining com Weka - Pentaho Data Mining

Sobre o Treinamento

O treinamento passa uma visão fundamental e prática de como trabalhar com Inteligência Artificial, Machine Learning e Data Mining e o uso de ferramentas de Mineração, os benefícios e os estudos sobre os dados, assim como a descoberta de conhecimento sobre bases de dados. Será apresentado como o Data Mining através da IA e do Aprendizado de Maquina pode ajudar na melhoria dos negócios nas corporações e em suas estratégias.

Calendário de turmas abertas

  1. Turma Online Ao Vivo
  • Data: - -
  • Local: Google Meet e Plataforma Virtual da Ambiente Livre
  • Inscreva-se
next
prev

Objetivo

Apresentar conceitos importantes sobre IA, Machine Learning e como aplica-los nas principais funcionalidades e técnicas de mineração de dados usando o Weka ( Pentaho Data Mining ).

Público Alvo

DBAs, gestores, desenvolvedores de sistemas, cientistas de dados, analistas de negocio, analistas de suporte e estatísticos.

Conteúdo Programático:

Conceitual:

  • O que é Inteligência?
  • Natureza do Conhecimento Humano.
  • Distinção entre dados, Informação e Conhecimento.
  • Os Sistemas Inteligentes.
  • Introdução a Inteligência Artificial.
  • Introdução a Machine Learning / Aprendizado de Máquina.
  • Introdução a Data Mining / Mineração de dados.
  • Motivações para Data Mining.
  • Cadeia de valores.
  • KDD.
  • KDD X Data Mining.
  • Seleção e Pré-Processamento.
  • Sumarização.
  • Classificação.
  • Regressão.
  • Associação.
  • Agrupamento.
  • Aprendizagem Não Supervisionada
  • Aprendizagem Supervisionada
  • Aprendizagem por Reforço
  • Extração de características
  • MBA - Market Basket Analysis.
  • Web Mining.
  • Uso do Data Mining na gestão estratégica de empresas.
  • Terminologia para classificação.
  • Matriz de confusão.
  • Acurácia, Probabilidade.
  • Recall.
  • Bases de Treinamento.

O Software - Weka Data Mining

  • Histórico do Weka ( Pentaho Data Mining ).
  • Instalando o Weka.
  • Interface e funcionalidades do Weka.
  • Os algoritmos do Weka.
  • Conhecendo o formato de arquivo ARRF.
  • Atributos e tipos de de atributos do formato ARFF.
  • Interpretação e Visualização de resultados.
  • Técnicas de apresentação de resultados.

Tratamento de Dados com o Software Pentaho Data Integration e Pentaho Machine Intelligence.

    
Hand Ons - Machine Learning e Data Mining.

  • Usando o algoritmo de classificação j48 (árvores de decisão).
  • Praticando a seleção e remoção de campos para encontrar insights interessantes e relevantes.
  • Executando algoritmos de classificação de forma supervisionada e não supervisionada.
  • Clusterizando dados com o Algoritmo SimpleKMeans.
  • Realizando uma regressão Linear com o Algoritmo LinearRegression.
  • Usando o algoritmo de associação APRIORI.
  • APRIORI para analise de carinho de compra (MBA).
  • Erros comuns e como evita-los
  • Executando algoritmos por linha de comando.
  • Realizando um trabalho prático com dados abertos.

Pré-Requisitos.

  • Ter afinidade com gerenciamento de dados ( Planilhas Eletrônicas, Banco de Dados , CSVs , etc )
  • Lógica de programação pode ajudar em alguns pontos do treinamento, mas é opcional.

Requisitos dos Alunos.

  • Todos os participantes devem trazer um notebook para realizar as atividades práticas.
  • O Computador deve estar  com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
  • Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 12 alunos para um melhor desempenho.

Requisitos mínimos de hardware

  • Memória RAM : 3GB
  • Espaço em Disco: 2GB
  • Processador: Dual-core AMD 64, EM64T
  • Sistemas Operacionais : Linux, Windows , MacOS.

Carga Horária

  • 16 Horas de Duração.

Modalidade do Treinamento:

  • Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
  • Online Ao Vivo - Fazemos a transmissão Online do Treinamento.
  • In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Material

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

  • Todos os softwares Pentaho Data Integration e Weka Data Mining e acessórios na sua última versão estável.
  • Material próprio em Português do Brasil.
  • Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
  • Apostilas digitais dos softwares desenvolvidas pela Ambiente Livre.
  • Apostilas com exercícios práticos desenvolvidos no treinamento.
  • Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
  • Caneta, Pasta e Bloco de Anotações.

Metodologia

  • Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos Pentaho e cursos Pentaho. caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

A marca Pentaho é uma marca registrada pelos seus respectivos proprietários.

Próxima Turma

  • Data: - -
  • Local: Google Meet e Plataforma Virtual da Ambiente Livre
  • Inscreva-se
 


Solicite Informações e Valores

Fotos dos treinamentos Pentaho Data Mining - Pentaho Machine Intelligence - Weka

 

Instrutor

Leia mais...

Consultoria em Big Data e Data Science

Administrar os dados de sua empresa com metodologias, técnicas e ferramentas ideais pode colocar sua empresa em outro patamar. Em busca da produtividade dos serviços e produtos atuais, assim como inovação para criação de novos serviços e novos produtos. O Big Data é uma abordagem para armazenamento de um grande volume de dados de tipos variados, para que possam ser processados com alta velocidade mesmo com alto volume. O Data Science ou Ciência dos Dados é a ciência que busca encontrar insights relevantes e úteis para seus negócios. 

Leia mais...

Treinamento mlFlow - Machine Learning Lifecycle

O treinamento mlFlow foi elaborado para apresentar e conceituar toda plataforma e o ciclo de vida do machine learning, e atende as necessidades da mlOps, sendo o cientista de dados o profissional mais atuante nesta ferramenta. O MLflow é uma plataforma para otimizar o desenvolvimento de aprendizado de máquina, incluindo experimentos de rastreamento, código de empacotamento em execuções reproduzíveis e compartilhamento e implantação de modelos. O MLflow oferece um conjunto de APIs leves que podem ser usadas com qualquer aplicativo ou biblioteca de aprendizado de máquina existente (TensorFlow, PyTorch, XGBoost etc.), onde quer que você execute o código ML (por exemplo, em notebooks, aplicativos autônomos ou na nuvem).

Calendário de turmas.

Somente no modelo corporativo no momento.

Conteúdo Programático

Conceitual.

  • Introdução a Data Science.
  • O profissional Data Scientist.
  • O Software mlFlow.
  • Software Livre x Open Source.
  • Licenciamento.
  • Databricks.
  • Histórico do mlFlow.
  • Empresas usando mlFlow no Mundo.
  • Empresas usando mlFlow no Brasil.
  • Comunidade mlFlow.
  • Versões do mlFlow.
  • Casos de Uso.

mlFlow fundamentos.

  • Machine Learning Workflow.
  • componentes do mlFlow.
  • Arquitetura do mlFlow.
  • Escalabilidade e Big Data.
  • A plataforma mlFlow.
  • O Workflow.
  • Linguagens suportadas.
  • Bibliotecas suportadas.
  • Jupyter Notebook.

 Linguagem Python.

  • Apresentando Python.
  • Escrevendo scripts Python.
  • Básico em Python.
  • Tipos Básicos Python.
  • Definindo Funções.
  • IDE para Python.
  • mlFlow Python API.

Instalação.

  • Instalando o Python.
  • Instalando o mlFlow.
  • Instalando o Jupyter.
  • Instalando o Numpy.
  • Instalando Pandas.

mlFlow Tracking.

  • Scikit-learn autologging.
  • Local Tracking com SQLite.
  • Tracking Server.
  • Remore Tracking Server.
  • Artifact Stores.
  • Fast.ia
  • Tracking UI.
  • MLflowClinet.
  • Bibliotecas suportadas.

mlFlow Models.

  • Model Schemas.
  • Input examples.
  • Input Schema.
  • Output Schema.
  • Validate inputs.
  • Storage Format.
  • MLmodel Format.
  • Model Signature.
  • Spark MLlib.
  • Python Function.
  • Spacy Model.
  • Deployment com Docker.
  • Deployment com Apache Spark.
  • Deployment Plugins.
  • Model API.
  • Model Customization.

mlFlow Projects.

  • Backend plugins
  • YARN.
  • Arquivo MLproject.
  • Empacotando projetos.
  • Executando com Conda.
  • Executando com Docker.

mlFlow Model Registry.

  • UI Workflow.
  • Adicionado Modelos no Registry.
  • CRUD Models.
  • Tags.
  • Versionamento.
  • Arquivamento.
  • Lyfecyle.
  • API Workflow.

mlFlow na Cloud.

  • Deployment no Azure ML.
  • Deployment no AWS SageMaker.

Gerais.

  • Como criar um plugin para mlFlow.

Carga Horária.

  • 24 Horas.

Modalidade do Treinamento.

  • Presencial - Abrimos turmas onde pode se inscrever, atuamos na maioria das capitais Brasileiras.
  • On Line Ao Vivo - Fazemos a transmissão Online do Treinamento.
  • In Company (Presencial ou Online) - Turmas Fechadas para empresas a custo único para até 15 Alunos.

Pré-Requisitos.

  • Conhecimento Básico em algum Sistema Operacional (Windows, Linux ou MAC)
  • Conhecimento Básico de Machine Learning e Data Science.
  • Conhecimento em alguma linguagem de programação.

Requisitos:

  • Todos os participantes devem trazer um notebook para realizar as atividades práticas.
  • O Computador deve estar  com acesso de administrador para possibilitar instalações de aplicativos e acesso a Internet.
  • Para turmas In-Company não trabalhamos com limite de participantes para os treinamentos, orientamos que as turmas sejam de até 15 alunos para um melhor desempenho.

Requisitos Recomendados de Hardware.

  • Memória RAM: 8GB.
  • Espaço em Disco: 20GB.
  • Processador: 64 bits (chipsets de x64).
  • CPU: 2 núcleos.
  • Sistemas Operacionais: GNU/Linux, Windows ou Mac OS.

Material.

Serão disponibilizados os seguintes materiais aos alunos do treinamento:

  • Todos os softwares mlFlow e acessórios na sua última versão estável.
  • Material próprio em Português do Brasil.
  • Apresentações (slides do treinamento) desenvolvidas pela equipe Ambiente Livre.
  • Apostilas com exercícios práticos (hacks) desenvolvidos no treinamento.
  • Materiais e documentações complementares desenvolvido pela Comunidade Open Source Mundial.
  • Brindes: Caneta, Pasta e Bloco de Anotações. (Somente em presenciais)

Metodologia.

  • Todos os dias serão apresentados novos recursos e conceitos e avaliados através de exercícios práticos em todas as aulas.

Estamos localizados em Curitiba e atendemos em todo Brasil com treinamentos mlFlow e cursos mlFlow . caso necessite de um treinamento customizado com suas necessidades também elaboramos estes treinamentos. solicite proposta comercial.

Inscrições, Informações e Valores

[No form id or name provided!]

Diferenciais da Ambiente Livre.

A Ambiente Livre tem 17 anos no mercado, pioneirismo na oferta de consultoria, treinamentos, projetos e suporte em softwares de código-fonte aberto e software livre com um ecossistema voltado a negócios, e pode lhe ajudar a gerir complexidades, reduzir custos, permitindo adaptar e oferecer inovação inteligente necessária para o seu sucesso.

3.535 profissionais capacitados em 325 turmas ministradas.

Atuação global, 807 empresas impactadas em projetos, consultorias e treinamentos no Brasil, América Latina, Europa e África.

Networking entre profissionais, comunidades e startups de tecnologias Open Source e Free Software.

Treinamentos baseados em experiência de projetos e consultorias, 2.230 tutorais documentados, atualizados e disponibilizado de forma vitalícia em EAD.

Empresa 100% focada em Open Source e Free Software e contribuidora com equipe atuante nos projetos e eventos de código aberto e software livre.

Apoio na criação de 4 startups / Spin-off baseadas em soluções Open Source ou Free Software.

Instrutor

Leia mais...

Log in