• Embraer amplia uso da Plataforma Pentaho com Data Mining, Inteligência Artificial e Machine Learning

    Treinamento Pentaho Data Mining - Embraer
     O Pentaho Open Source Business Intelligence oferece poderosas ferramentas de análise de informações, monitoramento de indicadores e data mining, para que as organizações revolucionem o uso da informação gerencial, atingindo ganhos significativos de eficiência e eficácia.

    Em 2017, a equipe de TI da EMBRAER passou pela capacitação In Company, para a solução Pentaho BI Community Edition, com os treinamentos Pentaho Business Intelligence - Fundamental e Pentaho Business Intelligence - Avançado e Pentaho Data Integration - ETL Open Source. Em 2018 retornamos, para capacitar a equipe do setor de Qualidade, com o mesmo software e treinamentos, acrescentado o Pentaho Weka Data Mining, ou seja, uma capacitação conceitual e prática, de nível fundamental, sobre inteligência artificial e aprendizado de máquina, na aplicação de data mining e o uso dos algoritmos mais comuns. O enfoque também foi sobre o uso de Mineração de Dados, através da análise de redes sociais, dados abertos, informações de sensores ou informações empresariais de qualquer volume de dados com o uso do Weka.

    Treinamento Pentaho Fundamental e Avançado - Embraer

     

     A Ambiente Livre é especialista na plataforma Pentaho Business Intelligence e atende a todo o Brasil.

  • Instalando o Pentaho Data Integration - PDI - (Kettle) no Linux

     

     

    O Pentaho Data Integration ou também chamado por seu codinome de projeto como Kettle e uma ferramenta de ETL (Extração, Transformação e Carga do inglês Extract, Transform and Load) que faz parte da plataforma Pentaho Business Intelligence e Analitycs. O mesmo pode ser instalado separadamente sem a necessidade de mais nenhum dos softwares adicional da plataforma de BI do Pentaho e usado exclusivamente para ETL.

    Pré-Requisitos.

    O único pré-requisito e ter um runtime Java (máquina virtual java ) instalada ou uma JDK (Kit de Desenvolvimento Java) , que pode ser de implementação aberta ( OpenJDK) ou fechada ( como a da Oracle) e pode ser realizado o download em https://www.oracle.com/technetwork/pt/java/javase/downloads/index.html. Cada versão do Pentaho Data Integration teremos uma versão do Java, no momento que escrevemos neste artigo usamos a versão 8.3 do Pentaho Data Integration que exige a versão 1.8 do Java ou superior.

     

    Curiosidade: Um apelido do Pentaho Data Integration usado pela maioria dos desenvolvedores e usuário do Pentaho Data Integration é a sigla PDI. 

    Download.

    Primeiramente acesse o repositório oficial do Pentaho no SourgeForge.net em http://sourceforge.net/projects/pentaho/files/ depois selecione a versão mais recente (ex. Pentaho 8.3) e depois acessar a divisão client-tools (onde estão as ferramentas clients), quando descrevemos este artigo a ultima versão era a 8.3, e o arquivo para realizar o download neste caso era o pdi-ce-8.3.0.0-371.zip (tanto para GNU/Linux como Windows o pacote de instalação e o mesmo o .zip)

    Instalando o Pentaho Data Integration.

    • Para instalar o Pentaho Data Integration no Linux crie o diretório em /opt/pentaho/client-tools  como o comando mkdir -p /opt/pentaho/client-tools (Está é uma recomendação e não obrigatoriedade, funciona em qualquer diretório).
    • Descompacte o pacote pdi-ce-x.xx.zip ( onde xx é sua versão ) no diretorio /opt/pentaho/client-tools será criado o diretório data-integration.
    • Pelo prompt shell acesse o diretório data-integration e de permissão a todos os arquivos com extensão .sh como o comando a seguir:

    chmod 755 *.sh

    • O Pentaho Data Integration tem 4 componentes de software (spoon, carte, kitchen e pan) o responsável pela criação dos ETLs (Transformações e Jobs) de forma visual é o Spoon e para iniciar o Spoon do Pentaho Data Integration execute o comando:

    ./spoon.sh

    • Será aberto a PDI com a tela de inicialização abaixo e em seguida o ambiente de trabalho de Transformações e Jobs.

     

     

    Observações específicas de alguns sistemas operacionais.

    Pentaho Data Integration no Ubuntu 11.04.

    Quem estiver utilizando o Pentaho Data Integration com o Ubuntu 11.04 poder estar tendo o seguinte problema, ao tentar arrastar os steps para um transformação os mesmos não ficam na área de transformação. constatamos isso numa versão especifica do ubuntu ainda no PDI 5, conforme a imagem a seguir.

     

    Para corrigir esse problema siga os seguintes passos:

    • Remova as bibliotecas lib:
      overlay-scrollbar
      liboverlay-scrollbar-0.1-0
    • Para remover utilize o seguinte comando:

      sudo apt-get remove overlay-scrollbar liboverlay-scrollbar-0.1-0
    • Reinicie o Pentaho Data Integration


    Quer visar um especialista em Pentaho Data Integration? participe de nossas formações especificas do Pentaho Data Integration ou uma formação completa do Pentaho Business Intelligence e Analitycs.