La red del Business Intelligence
Página Web: http://wiki.pentaho.com/display/EAI/Latest+Pentaho+Data+Integration+(aka+Kettle)+Documentation
Miembros: 147
Última actividad: 5 Jul 2020
Iniciada por Bernabeu R. Dario. Última respuesta de Eduardo Piray 5 Jul 2020.
Iniciada por Bernabeu R. Dario. Última respuesta de ANDREA 14 May 2020.
Iniciada por Exequiel Arce. Última respuesta de Juan V. 30 Ene 2019.
Iniciada por Bernabeu R. Dario. Última respuesta de Mario Snash 18 Oct 2018.
Iniciada por stefy. Última respuesta de Bernabeu R. Dario 4 Jun 2018.
Estimado Edgar gracias por tu oportuna respuesta.. En workbench al momento de crear las 3 dimensiones como le especifico a cada una de ellas que fecha debe usar (fecha_inicio_cargo, fecha_fin_cargo, fecha_ingreso_institucion) ya que solo tengo un campo fecha en mi dimension de tiempo????
Es mas yo creo que el problema debe resolverse desde antes o sea al momento de crear el ETL, como en el modelo puedo incluir esos tres criterios de busqueda por fecha
No creo, yo hago eso que quieres hacer creando la dimension del tiempo fuera del cubo, y dentro del cubo creando dimensiones "usage" aqui tienes que en lazar la llave primaria de la tabla de tiempo con el campo por ejemplo fecha_inicio_cargo, luego otra dimension usage y a otro campo y asi..
Buenas. Estamos sorteando 3 e-book de Pentaho Data Integration Cookbook - Segunda Edición, si alguien quiere participar aquí están las condiciones.
Saludos
Adjunto una tranformación que genera las fechas y demás atributos (nombre de los días de la semana, meses...) de 120 años.
Gracias David, buen aporte
Bernabeu continuando con la propuesta que me has dado de detectar el número de filas a cargar si es el normal o una variación sospechosa:
- Primero comentar que si se usa TABLE INPUT ya no es necesario el uso del step Univariate statistics, ya que con un "SELECT count(*) numeroClientesNovos FROM lk_cliente" es suficiente.
- Segundo, el problema viene en el filtro, que si deseo usar una tabla de históricos, en los que en cada carga se suba el valor de nuevas altas, como hacer para que el filtro compare ambos datos, es decir, que el número de clientes detectados sea > que el número de clientes del histórico y entonces X o Y. El problema está en que el filtro solo puede recibir los datos de una vertiente.
Espero haberme explicado. Gracias.
Buenas, pues has eso mismo:
1) Calcula la cantidad de clientes detectados (ya sabes cómo hacerlo).
2) Calcula la cantidad de históricos.
3) Compara ambos valores con un filtro. Si la condición es correcta sigue por un camino, si es falsa sigue por otro.
Hay muchas formas de resolver esta situación, podrías craer una variable que almacene el valor obtenido del filtro (X o Y), y luego de acuerdo a esta variable insertar las filas o no.
Saludos
Buenas, no funciona el filter rows con dos entradas:
1) Calculo la cantidad de clientes detectados en un input table de clientes.
2) Calcula la cantidad de históricos en un input table historicos.
3) Compara ambos valores con un filter rows y sale error. Si la condición fuese correcta seguiría por un camino, si es falsa sigue por otro, en ambos casos un dummy.
4) ¿Es posible, que luego en un job llame a la transformación anterior y si sale correcto vaya por un camino, y sino por otro?
¿Es posible escribir todos los errores en un log del step "write to log" por ejemplo a la salida de un Data Validator para aquellos datos que no hayan pasado los filtros? ¿Como? ¿algún ejemplo porfavor?
Gracias.
Comentar
Bienvenido a
Open Business Intelligence
© 2024 Creado por Emilio. Tecnología de
¡Necesitas ser un miembro de Pentaho Data Integration para añadir comentarios!