Objetivo:
* Instalar Pentaho Data Integration.
* Crear una transformación que obtenga los datos de un archivo .dbf y los almacene en una base de datos MySQL.
* Crear dos pasos y enlazarlos.
* Guardar la transformación.
* Ejecutar la transformación.
Pasar de DBF a MySQL:
1) Descargar Pentaho Data Integration:
* Al día de hoy la versión más reciente es la 3.2.0-stable, dirigirse al
siguiente link y seleccionar según corresponda:
---* Para linux, descargar pdi-ce-3.2.0-stable.tar.gz
---* Para Window$, descargar pdi-ce-3.2.0-stable.zip
2) Instalar Pentaho Data Integration:
* Descomprimir el archivo recientemente descargado en donde se desee. En nuestro ejemplo: /home/datos/programas
3)Instalar MySQL:
* Para nuestro ejemplo utilizaremos MySQL, para lo cual deberíamos tenerlo previamente instalado.
* En los videos “1) Descarga de Aplicaciones” y “2) Instalación de Programas” del
tutorial de OpenI, puede verse como descargar, instalar y configurar MySQL.
4) Crear una nueva base de datos:
* Desde MySQL Query Browser, en el cuadro superior derecho, hacer clic derecho y seleccionar “Create Schema...”
* Elegir un nombre, en nuestro caso “intermedio” y presionar Aceptar.
5) Iniciar Pentaho Data Integration:
* Desde Linux:
---* cd /home/datos/programas/data-integration
---* sh spoon.sh
* Desde Window$:
---* Ir a la carpeta ”.../data-integration” y ejecutar “Kettle.exe”.
* Una vez que el programa cargue, nos pedirá información acerca del catálogo que utilizaremos. En nuestro caso seleccionaremos la opción “Sin Catálogo”.
6) Crear una Transformación:
* Ir a Fichero → Nuevo → Transformación
7) Crear pasos para pasar de .dbf a MySQL:
7.1)
*En el panel izquierdo seleccionar la pestaña “Objetos principales”.
7.2)
* Seleccionar el paso Entrada → Entrada Xbase y arrantrarlo a la zona de trabajo.
* Hacer doble clic sobre el mismo.
* Para este ejemplo, completaremos solo dos campos:
---**
Nombre de paso: es el nombre que tendrá el paso, en este caso “OLTP Articulo”.
---**
Nombre de archivo: corresponde a la ubicación del archivo .dbf, en este caso “[path]/ARTICULOS.dbf”. (este archivo esta adjuntado)
* Es una buena práctica presionar siempre que sea posible, la opción visualizar.
* Finalmente, presionar OK.
7.3)
* Seleccionar el paso Salida → Salida Tabla y arrastrarlo a la zona de trabajo.
7.4)
* Enlazar ambos pasos:
---* Clic izquierdo sobre el paso Xbase.
---* Mantener Shift presionado y hacer clic izquierdo en el paso Entrada Xbase y mantenerlo presionado.
---* Mover el cursor del ratón hasta el paso Salida Tabla.
7.5)
* Acceder al paso Salida de Tabla, haciendo doble clic sobre el mismo.
* Para este ejemplo, completaremos solo cuatro campos:
---*
Nombre de paso: es el nombre que tendrá el paso, en este caso “Intermedio Articulos”.
---*
Conexión: es la conexión a la base de datos. Para crear una conexión con nuestra base de datos debemos hacer lo siguiente:
------* Seleccionar la opción “Nuevo...”.
------* Aquí completaremos los datos necesarios:
---------Connection Name: intermedio JDBC
---------Connection Type: MySQL
---------Access: Native (JDBC)
---------Host Name: localhost
---------Database Name: intermedio
---------Port Number: 3306
---------User Name: root
---------Password: root
------* Presionar “Probar” para asegurarnos que la conexión es correcta y luego “OK”
------* Seleccionar la conexión que acabamos de crear.
---*
Tabla destino: es la tabla en la cual almacenaremos los datos. En este caso, será “Articulos”.
---*
Vaciar tabla: indica si se debe vaciar la tabla previamente a la ejecución del paso. Debemos tildar la casilla.
* Debemos presionar el botón “SQL” para crear la tabla destino en nuestra base de datos, debido a que no existe. Esta acción nos dará el siguiente código:
CREATE TABLE Articulos
(
CODART CHAR(1)
, ART VARCHAR(15)
)
;
* Presionar “Ejecutar”. Y luego cerrar la ventana.
* Finalmente, presionar “OK”.
8) Guardar la Transformación:
* Ir a Fichero → Guardar como...
* Seleccionar el lugar y nombre del archivo, en este caso “Articulos - Pje Intermedio”.
9) Ejecutar la Transformación:
* Ir a Transformación → Ejecutar
* Presionar “Ejecutar”
Listo! Si han seguido los pasos correctamente, deberían obtener el siguiente resultado:
Espero les sea útil.
Saludos.
PD: Este post esta especialmente dedicado a Leonardo M. Tito y Felipe Mullicundo, quienes me tienen como tutor en su tesis de grado.