Open Business Intelligence

La red del Business Intelligence

Pentaho Data Integration

Información

Pentaho Data Integration

Página Web: http://wiki.pentaho.com/display/EAI/Latest+Pentaho+Data+Integration+(aka+Kettle)+Documentation
Miembros: 147
Última actividad: 5 Jul 2020

Foro de discusión

[Tutorial 03] Poblar 3 Dimensiones - Id Dinámicos 10 contestaciones 

Iniciada por Bernabeu R. Dario. Última respuesta de Eduardo Piray 5 Jul 2020.

[Tutorial 04] Poblar tabla de Hechos - Crear Trabajo 33 contestaciones 

Iniciada por Bernabeu R. Dario. Última respuesta de ANDREA 14 May 2020.

Comparar Valores 6 contestaciones 

Iniciada por Exequiel Arce. Última respuesta de Juan V. 30 Ene 2019.

[Tutorial 09] Web Scraping 3 contestaciones 

Iniciada por Bernabeu R. Dario. Última respuesta de Mario Snash 18 Oct 2018.

Error en tipo de dato 5 contestaciones 

Iniciada por stefy. Última respuesta de Bernabeu R. Dario 4 Jun 2018.

Comentarios

Comentario por Danay López Burgos el febrero 13, 2013 a las 5:35am

necesito ayuda sobre unos metodos  LAV , GAV y GLAV

Comentario por JAIME SANABRIA el febrero 19, 2013 a las 9:01pm

Buenas tardes queridos amigos, la pregunta es la siguiente es recomendable colocar indices en la tabla de hechos? aumenta el performance?

Mil gracuas

Comentario por Mariano García Mattío el febrero 19, 2013 a las 10:33pm

Claro que sí!, sin ninguna duda.

Saludos

Mariano

Comentario por Mariano García Mattío el febrero 20, 2013 a las 3:03pm

Danay, no se dónde quedó tu comentario, pero puedes descargar los fuentes de PDI desde sourceforge, por ejemplo de la última versión: http://sourceforge.net/projects/pentaho/files/Data%20Integration/4...., el archivo es: pdi-ce-src-4.4.0-stable-r17588.zip

Saludos

Mariano

Comentario por Bernabeu R. Dario el febrero 24, 2013 a las 5:19am

Buenas.

Guillermo Bravo preguntaba: necesito obtener la fecha actual en la que nos encontramos (dia-mes-año).

Paso a responderte. Si estás en una Transformación puedes añadir el paso "Información de Sistema" que se encuentra en la categoría "Entradas". Aquí creas un nuevo campo y le asignas como tipo "fecha sistema". Si realizas una vista previa verás que te trae un valor como el siguiente: 2013/02/24 01:06:44.001

Si deseas en formato día-mes-año podrías añadir el paso "Selecciona/Renombra valores" (categoría "Transformar") a la salida del paso anterior y realizar lo siguiente:

* Ir a la pestaña "Meta-información".

* Crear una nueva fila en la grilla seleccionando el campo del paso anterior que trae la fecha del sistema.

* Configurar en la columna tipo el valor: DATE

* Configurar en la columna format el valor: dd-MM-yyyy

Esto te devolverá el siguiente valor: 24-02-2013

Saludos

Comentario por JAIME SANABRIA el marzo 6, 2013 a las 4:32pm

Buenos dias, queridos amigos, mi pregunta es la siguiente, tengo una transformacion la cual obtiene datos de varias tablas "UNION" y cada vez que se realiza el query carga alrededor de 4 millones de registros, cada vez que se corre el ETL realiza un full load, quisiera volverla incremental, para no procesar toda esa cantidad de registros, el problema es que la fuente OLTP no tiene campos donde puede indetificar que registros han cambiado, y esto esta en un BD mysql por lo cual no puedo utilizar las vistas materializadas de ORACLE, cual es la mejor oprcion para implementar la carga incremental, mejorando el performance.  Mil gracias

Comentario por Mariano García Mattío el marzo 6, 2013 a las 4:45pm

Te recomiendo crear una tabla intermedia (de staging) en la cual puedes implementar alguna marca que te sirva al propósito que requieres.

Luego basarás las consultas a tu BD real en los datos y marcas que posea la tabla de staging, esas marcas suelen ser estampas de tiempo y en algunos casos, dependiendo de los cambios que puedan sufrir los datos origen, alguna marca que indique la operación (eliminar, insertar, modificar).

Hay muchas ideas y formas de manejar esto en los libros que se han publicado de Kettle y Pentaho Solutions

Saludos

Mariano

Comentario por Harold Portocarrero el marzo 23, 2013 a las 1:07am

Saludos estimados, tengo una duda he diseñado un DW, y en el mismo tengo una dimensión de tiempo, el problema es que cuando vaya a analizar la información existen varios criterios de busquedas por fechas, es decir, fecha_inicio_cargo, fecha_fin_cargo, fecha_ingreso_institucion. No se como hacer para que al momento de analizar la información lo haga por cualquiera de estos criterios teniendo solo una dimension de tiempo??? No se si me explique.. Gracias de antemano por evacuar mi duda.. Saludos..

Comentario por Harold Portocarrero el marzo 23, 2013 a las 1:11am

La pregunta es: Necesito tener tres dimensiones de tiempo?? o como podría hacer al momento de crear el ETL en spoon? O creo mas de una tabla de hecho? Estoy perdido en el tema.. Toda ayuda es bienvenida.. Gracias..

Comentario por Edgar de los Santos el marzo 23, 2013 a las 1:22am

Lo "mas facil" seria tener tres tablas de dimension de tiempo, pero no lo mas optimo, con una sola tabla de dimension del tiempo, puedes construir una dimension en workbench y en tu cubo crear 3 dimensiones de tiempo, busca en la documentacion de mondrian y workbench

Comentar

¡Necesitas ser un miembro de Pentaho Data Integration para añadir comentarios!

 

Miembros (147)

 
 
 

Distintivo

Cargando…

© 2024   Creado por Emilio.   Tecnología de

Emblemas  |  Reportar un problema  |  Términos de servicio