I think all of us at some point we thought if it was possible send those PDI excel reports, but instead of as email attachment, embedded as HTML in email. As a picture is worth a thousand words, I share with you a video that shows we’ll obtain today.

Do you want to know how? Let’s do it…

Continue reading

Sergio Martín
Más de seis años de experiencia gestionando equipos y proyectos de Business Intelligence para diferentes sectores, apasionado de todos los procesos técnicos relacionados con la gestión de la información, el tratamiento de datos y la automatización de procesos

** Microstrategy 9.4 | Pentaho 5 (ETL) | Oracle 11g **

magnifying-glass-spreadsheet-shutterstock-kuzma

 

I share a simple query to find duplicates in all  columns that compounds our tables in the project

 Best regards

O como parsear el código html de una página web a través de Pentaho Data Integracion.

El video anterior es un ejemplo sobre recoger información de una página web de deportes sobre la que he llevado a practica lo que a continuación os relato, sin dejar de mencionar a la comunidad/foro de Pentaho en que me apoyo en todo momento en forma de respuestas y adjuntos.

Descargar ejemplo .ktr :  ExampleWS

Continue reading

job_principal

Muchas veces tenemos la necesidad de crear un proceso determinado de ETL que necesita ser ejecutado de manera repetida, pero para varios parámetros diferentes. Frente a esto, podríamos recurrir a crear una ETL con una parte de configuración inicial manual, donde en cada iteración podríamos definir una variable y lanzar el proceso a mano.

Sin embargo, con PDI, podemos automatizar esta tarea, creando una función genérica a la que le pasaremos los parámetros correspondientes en cada iteración. Vamos con ello…Continue reading

Sergio Martín
Más de seis años de experiencia gestionando equipos y proyectos de Business Intelligence para diferentes sectores, apasionado de todos los procesos técnicos relacionados con la gestión de la información, el tratamiento de datos y la automatización de procesos

** Microstrategy 9.4 | Pentaho 5 (ETL) | Oracle 11g **

Combinados

Surely, many times had to combine combine multiple CSV files with same structures but different data and have resorted to simple but tedious ETL process such as multiple data inputs on Kettle or similars. We’ll leave here a very simple trick, with a simple command, we could merge as many CSV files as you want.

Continue reading

Sergio Martín
Más de seis años de experiencia gestionando equipos y proyectos de Business Intelligence para diferentes sectores, apasionado de todos los procesos técnicos relacionados con la gestión de la información, el tratamiento de datos y la automatización de procesos

** Microstrategy 9.4 | Pentaho 5 (ETL) | Oracle 11g **

TEMPORARY_LOOKUP

Como sabéis, en casi todo proyecto de BI necesitamos una tabla de tiempos con los datos mas representativos de esta dimensión como DIA, SEMANA, MES o AÑO entre otros. Con ella seremos capaces de crear, a partir de una fecha en concreto, toda una relación de descripciones temporales asociadas. Vamos a ver como poblamos nuestra tabla lookup de tiempos usando Kettle de Pentaho (PDI).

Continue reading

Sergio Martín
Más de seis años de experiencia gestionando equipos y proyectos de Business Intelligence para diferentes sectores, apasionado de todos los procesos técnicos relacionados con la gestión de la información, el tratamiento de datos y la automatización de procesos

** Microstrategy 9.4 | Pentaho 5 (ETL) | Oracle 11g **

06-06-2014-18-14-56

En esta nueva serie de trucos y consejos sobre herramientas de BI, la primera entrada va dedicada a la plataforma de ETL de Pentaho, Kettle.

Un error frecuente  -al menos en la versión 4.1.0 e inferiores- es la, en principio, imposibilidad de poder abrir una Transformation ubicada dentro un Job, obligándonos a abrirla a través del menu File/Open.. 

06-06-2014-18-14-21
Continue reading

Sergio Martín
Más de seis años de experiencia gestionando equipos y proyectos de Business Intelligence para diferentes sectores, apasionado de todos los procesos técnicos relacionados con la gestión de la información, el tratamiento de datos y la automatización de procesos

** Microstrategy 9.4 | Pentaho 5 (ETL) | Oracle 11g **