Tutoriais Pentaho

Conectando o Pentaho ao Banco de Dados Oracle

Avaliação do Usuário: 5 / 5

Estrela ativaEstrela ativaEstrela ativaEstrela ativaEstrela ativa
 

Com o Pentaho podemos utilizar qualquer SGBD para armazenamento do nosso Data Warehouse ou para extração de dados e apresentação de relatórios. Dois itens são importantes para conectar o Pentaho ao SGBD da Oracle, primeiramente o Driver deve estar nos seus devidos locais de bibliotecas externas e a string de conexão estar configurada corretamente.

Driver

O Driver da Oracle não pode ser distribuído juntamente com aplicações sem um contrato de OEM, porém o mesmo pode ser baixado gratuitamente do site do fabricante : https://www.oracle.com/database/technologies/appdev/jdbc-downloads.html

Faça o download de acordo com sua versão, quando publicamos este artigo o mais atual era o ojdbc10.jar, que poderia ser usado para Oracle 9,10 e 10g, etc até a versão 19c.

Para o Ambiente Server do Pentaho devemos adicionar o driver em duas localidades (diretórios):

PUC - Pentaho User Console

../pentaho-server/tomcat/lib

Este é o diretório padrão do Tomcat para bibliotecas externas.

String de Conexão


Cada SGBD tem a string de conexão com características diferentes , quando queremos usar uma conexão JNDI ou JDBC.

A String de Conexão JDBC e JNDI do Oracle e composta por alguns parâmetros , seguem quais são e uma breve descrição sobre cada um deles:

  • Driver Class:  Classe Java responsável pela conexão -> Exemplo:  oracle.jdbc.driver.OracleDriver
  • Tipo da Conexão: JDBC
  • Nome do Banco de Dados: Nesta caso oracle:thin que é o Padrão para o Oracle DB.
  • Nome ou IP do Servidor: IP ou DNS onde se encontra o servidor do Banco de Dados Oracle, caso seu Pentaho e Oracle estejam na mesma máquina informar localhost.
  • Porta: Porta de conexão com o banco de Dados , A Porta padrão do Oracle é a 1531 , caso seu banco tenha outro padrão de portal altere conforme sua necessidade.
  • SID: Nome do SID ou Oracle System ID , especificado no arquivo tnsnames.ora, geralmente conforme abaixo porem dependendo da versão ou da customização de instalação pode ter outras referencias como XE etc.

Exemplo de um tnsnames.ora com o SID chamado ORCL

ORCL =
 (DESCRIPTION =
   (ADDRESS = (PROTOCOL = TCP)(HOST = myhost)(PORT = 1521))
   (CONNECT_DATA =
     (SID = ORCL)
   )
 )


Após saber a funcionalidade de cada um dos parâmetros podemos criar a nossa string de conexão com o Oracle no Pentaho Server usando a seguinte linha de referência  e alterando seus valores:

jdbc:oracle:thin:@:porta:SID


Para um banco de Dados Oracle  no servidor oracle.ambientelivre.com.br na porta 1521 e no SID XE teríamos :

jdbc:oracle:thin:@oracle.ambientelivre.com.br:1521:XE


Esta string é solicitada no Pentaho User Console quando for criar novas conexões do Pentaho para o Oracle.

Conexão com Oracle nas CTools - CDE


O data source do grupo sqlover sqlJdbc do módulo CDE, pode ser configurado conforme parâmetros  do exemplo a seguir:

  • Name: Nome da query
  • Name: oracle.jdbc.driver.OracleDriver
  • URL: jdbc:oracle:thin:@host:porta:SID
  • user: utilizador
  • password: teste
  • Query: select sysdate from dual

Sobre a Ambiente Livre

Ambiente LivreAmbiente Livre é especialista em Open Source e Free Software e tem uma divisão especialista em Business Intelligence e Business Analytics. Fornece implantação, integração, suporte, consultoria e treinamento Business Intelligence com a plataforma Pentaho Business Intelligence e Analytics a mais de 10 anos.

Já capacitou centenas de empresas para trabalhar com Business Intelligence, ECM, BPM, CRM e Big Data e usa uma metodologia própria de ensino.

Conheça também as divisões de ECM e BPMCRM e CMS e Big Data e Data Science.

 

 

Autor

Marcio Junior Vieira

 

  • 22 anos de experiência em informática, vivência em desenvolvimento e análise de sistemas de gestão empresarial e ciência de dados.
  • CEO da Ambiente Livre atuando como Cientista de Dados, Engenheiro de Dados e Arquiteto de Software.
  • Professor dos MBAs em Big Data & Data Science, Inteligência Artificial e Business Intelligence da Universidade Positivo.
  • Professor de BPM no MBA de Business Intelligence da Universidade Positivo.
  • Professor do MBA Artificial Intelligence e Machine Learning da FIAP.
  • Pesquisador pela Universidade de Brasília no Laboratório de Tecnologias da Tomada de Decisão - UnB/LATITUDE.
  • Graduado em Tecnologia em Informática(2004) e pós-graduado em Software Livre(2005) ambos pela UFPR.
  • Palestrante FLOSS em: FISL, The Developes Conference, Latinoware, Campus Party, Pentaho Day, Ticnova, PgDay e FTSL.
  • Organizador Geral: Pentaho Day 2017, 2015, 2019 e apoio nas ed. 2013 e 2014.
  • Data Scientist, instrutor e consultor de Big Data e Data Science com tecnologias abertas.
  • Ajudou a capacitar equipes de Big Data na IBM, Accenture, Tivit, Sonda, Serpro, Dataprev, Natura, MP, Netshoes, Embraer entre outras.
  • Especialista em implantação e customização de Big Data com Hadoop, Spark, Pentaho, Cassandra e MongoDB.
  • Contribuidor de projetos open sources ou free software internacionais, tais como Pentaho, Apache Hop, LimeSurveySuiteCRM e Camunda.
  • Especialista em implantação e customização de ECM com Alfresco e BPM com ActivitiFlowable e Camunda.
  • Certificado (Certified Pentaho Solutions) pela Hitachi Vantara (Pentaho inc).
  • Ganhou o prêmio Camunda Champion em 2022 em reconhecimento a suas contribuições com o projeto Open Source Camunda.
  • Membro da The Order Of de Bee (Comunidade Alfresco trabalhando para desenvolver o ecossistema Alfresco independente)

 

Log in