Generar y poblar tabla LOOKUP de TIEMPO

Como sabéis, en casi todo proyecto de BI necesitamos una tabla de tiempos con los datos mas representativos de esta dimensión como DIA, SEMANA, MES o AÑO entre otros. Con ella seremos capaces de crear, a partir de una fecha en concreto, toda una relación de descripciones temporales asociadas. Vamos a ver como poblamos nuestra tabla lookup de tiempos usando Kettle de Pentaho (PDI).

Populate ETL

Populate ETL

He creado una pequeña transformation con la que podremos poblar nuestra tabla de tiempos que paso a explicaros detalladamente

  • DATE_INT
    Es un módulo de tipo Generate Rows. En él definiremos una fecha estática para comenzar sobre ella los diferentes cálculos que vamos a ir realizando.
  • DAY_SECUENCE
    Módulo de tipo Get Value from Sequence. Con él, vamos a conseguir generar una sucesión de números, en nuestro caso del 1 al 10000 para poder ir sumándole esta cifra a la fecha base.
  • DATE_CALC
    Módulo tipo Calculator. Este módulo es muy útil, si no lo conocíais, este es buen momento. Nos permite realizar cálculos con dos o más campos de nuestro flujo de transformación. En esta transformation en concreto vamos a calcular gran parte de los campos finales en este paso.
  • DATE_FILTER
    Descartaremos fechas superiores a 2021 para nuestro ejemplo. Lo hacemos con este módulo tipo Filter rows.
  • SPANISH_TEXT
    Módulo tipo Formula con el que comenzaremos a crear descripciones para los campos que lo necesitan.
  • SPANISH_DESC
    Módulo tipo Javascript donde acabamos de traducir el resto de campos de nuestra lookup de tiempos.
  • VALUES
    Módulo tipo Select / Renames values para seleccionar definitivamente nuestros campos antes de exportar al output definitivo.

El pase de diapositivas requiere JavaScript.

Os dejo la transformación para que la importéis en vuestro Kettle y trabajéis con ella.

Populate Temporary Lookup

Sergio Martín
Más de seis años de experiencia gestionando equipos y proyectos de Business Intelligence para diferentes sectores, apasionado de todos los procesos técnicos relacionados con la gestión de la información, el tratamiento de datos y la automatización de procesos

** Microstrategy 9.4 | Pentaho 5 (ETL) | Oracle 11g **

4 comments

  1. Hola, muchas gracias por compartir todo esto.
    La descarga de la transformación que has subido no funciona, la podrías re subir por favor, te lo agradecería demasiado.
    Gracias de antemano.
    Saludos

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *