La red del Business Intelligence
Saludos a todos.
Me gustaría conocer ahora un poco sobre la programación de los procesos ETLs
para que se ejecuten de manera automática.
Se que el Kettle permite guardar las transformaciones y jobs de dos formas:
Me gustaría saber qué forma es más recomendable para poder programar la ejecución automática de los mismos y cómo se hace (cuales son los pasos para cada una de las opciones).
Me sería muy útil si me pudieran abundar más detalladamente en los siguientes
aspectos:
Necesito saber cómo puedo hacer para evitar que cuando valla a incorporar datos
en una tabla del DW no me sobrescriba toda la tabla, sino que empiece por donde
se quedó la última actualización.
Esto se podría hacer desde el propio job en el Kettle si la Tabla guardara un
Id por el cual se podría buscar la existencia del mismo en ambas tablas OLTP y
la OLAP, pero cuando la tabla del OLAP no guarda un Id , sino cantidades, no
tengo cómo ver cuál fue la última en insertarse, y en el proceso de carga
podrían ocurrir inconvenientes como que se ve afectado el fluido eléctrico o se
cae la conexión.
Podrían explicarme como podría hacer que siempre que se realice el proceso ETL
este empiece por donde se quedo la carga y no me pase por encima otra vez a
toda la tabla?
Gracias de antemano
Etiquetas:
Bienvenido a
Open Business Intelligence
© 2024 Creado por Emilio. Tecnología de