Open Business Intelligence

La red del Business Intelligence

Objetivo:
* Instalar Pentaho Data Integration.
* Crear una transformación que obtenga los datos de un archivo .dbf y los almacene en una base de datos MySQL.
* Crear dos pasos y enlazarlos.
* Guardar la transformación.
* Ejecutar la transformación.

Pasar de DBF a MySQL:

1) Descargar Pentaho Data Integration:
* Al día de hoy la versión más reciente es la 3.2.0-stable, dirigirse al siguiente link y seleccionar según corresponda:
---* Para linux, descargar pdi-ce-3.2.0-stable.tar.gz
---* Para Window$, descargar pdi-ce-3.2.0-stable.zip

2) Instalar Pentaho Data Integration:
* Descomprimir el archivo recientemente descargado en donde se desee. En nuestro ejemplo: /home/datos/programas

3)Instalar MySQL:
* Para nuestro ejemplo utilizaremos MySQL, para lo cual deberíamos tenerlo previamente instalado.
* En los videos “1) Descarga de Aplicaciones” y “2) Instalación de Programas” del tutorial de OpenI, puede verse como descargar, instalar y configurar MySQL.

4) Crear una nueva base de datos:
* Desde MySQL Query Browser, en el cuadro superior derecho, hacer clic derecho y seleccionar “Create Schema...”
* Elegir un nombre, en nuestro caso “intermedio” y presionar Aceptar.

5) Iniciar Pentaho Data Integration:
* Desde Linux:
---* cd /home/datos/programas/data-integration
---* sh spoon.sh
* Desde Window$:
---* Ir a la carpeta ”.../data-integration” y ejecutar “Kettle.exe”.
* Una vez que el programa cargue, nos pedirá información acerca del catálogo que utilizaremos. En nuestro caso seleccionaremos la opción “Sin Catálogo”.

6) Crear una Transformación:
* Ir a Fichero → Nuevo → Transformación

7) Crear pasos para pasar de .dbf a MySQL:
7.1)
*En el panel izquierdo seleccionar la pestaña “Objetos principales”.

7.2)
* Seleccionar el paso Entrada → Entrada Xbase y arrantrarlo a la zona de trabajo.
* Hacer doble clic sobre el mismo.
* Para este ejemplo, completaremos solo dos campos:
---** Nombre de paso: es el nombre que tendrá el paso, en este caso “OLTP Articulo”.
---** Nombre de archivo: corresponde a la ubicación del archivo .dbf, en este caso “[path]/ARTICULOS.dbf”. (este archivo esta adjuntado)
* Es una buena práctica presionar siempre que sea posible, la opción visualizar.
* Finalmente, presionar OK.


7.3)
* Seleccionar el paso Salida → Salida Tabla y arrastrarlo a la zona de trabajo.

7.4)
* Enlazar ambos pasos:
---* Clic izquierdo sobre el paso Xbase.
---* Mantener Shift presionado y hacer clic izquierdo en el paso Entrada Xbase y mantenerlo presionado.
---* Mover el cursor del ratón hasta el paso Salida Tabla.

7.5)
* Acceder al paso Salida de Tabla, haciendo doble clic sobre el mismo.
* Para este ejemplo, completaremos solo cuatro campos:
---* Nombre de paso: es el nombre que tendrá el paso, en este caso “Intermedio Articulos”.
---* Conexión: es la conexión a la base de datos. Para crear una conexión con nuestra base de datos debemos hacer lo siguiente:
------* Seleccionar la opción “Nuevo...”.
------* Aquí completaremos los datos necesarios:
---------Connection Name: intermedio JDBC
---------Connection Type: MySQL
---------Access: Native (JDBC)
---------Host Name: localhost
---------Database Name: intermedio
---------Port Number: 3306
---------User Name: root
---------Password: root
------* Presionar “Probar” para asegurarnos que la conexión es correcta y luego “OK”
------* Seleccionar la conexión que acabamos de crear.
---* Tabla destino: es la tabla en la cual almacenaremos los datos. En este caso, será “Articulos”.
---* Vaciar tabla: indica si se debe vaciar la tabla previamente a la ejecución del paso. Debemos tildar la casilla.
* Debemos presionar el botón “SQL” para crear la tabla destino en nuestra base de datos, debido a que no existe. Esta acción nos dará el siguiente código:
CREATE TABLE Articulos
(
CODART CHAR(1)
, ART VARCHAR(15)
)
;

* Presionar “Ejecutar”. Y luego cerrar la ventana.
* Finalmente, presionar “OK”.


8) Guardar la Transformación:
* Ir a Fichero → Guardar como...
* Seleccionar el lugar y nombre del archivo, en este caso “Articulos - Pje Intermedio”.

9) Ejecutar la Transformación:
* Ir a Transformación → Ejecutar
* Presionar “Ejecutar”

Listo! Si han seguido los pasos correctamente, deberían obtener el siguiente resultado:


Espero les sea útil.
Saludos.

PD: Este post esta especialmente dedicado a Leonardo M. Tito y Felipe Mullicundo, quienes me tienen como tutor en su tesis de grado.

Visitas: 8292

Archivos adjuntos

Respuestas a esta discusión

Saludos Ing. muy buen tutorial

Buen día Ernesto.

Al parecer este es tu error: Field 'Analista_Key'doesn't have a default value

 

Imagino que no has incluido este campo al momento de pasar el flujo de datos al paso "Salida Tabla", verifica esto.

 

Si al configurar el paso "Salida Tabla" presionas el botón "SQL", spoon te sugerirá una consulta para crear o modificar tu tabla, fijate lo que te dice a ver si encuentras algo que no este bien.

 

Salud.

duda... este puede aplicar para un archivo access *.accdb???

 

si es que si, debo de hacer este paso por TODAS las tablas que tengo en ese archivo??

 

gracias

Buenas, te respondo.

 

>> este puede aplicar para un archivo access *.accdb?

Si, solo que debes utilizar el paso "Entrada Tabla" y crear la conexión ODBC a tu archivo access.

 

>> debo de hacer este paso por TODAS las tablas que tengo en ese archivo?

Así es.

 

Saludos.

RSS

Distintivo

Cargando…

© 2024   Creado por Emilio.   Tecnología de

Emblemas  |  Reportar un problema  |  Términos de servicio