Estoy trabajando con pentaho y extrayendo los datos (algunos) desde una base de datos posgresql (la cual funciona como el datawerehouse).
Pero tengo el problema de que tengo que extraer los datos desde un excel que se entrega semanalmente. Y la idea es que postgres lo haga automaticamente una vez a la semana. Existe alguna forma o programa que haga eso.
Permalink Responder para edu el noviembre 19, 2010 a las 8:52pm
Hola Miguel,
en el campo del BI uno de los componentes principales son los procesos ETL. Un proceso ETL, a grandes rasgos, consta de un conjunto de procedimientos para obtener los datos desde un origen prdefinido, realizar los cambios y aplicar las operaciones necesarias y finalmente almacenar estos daatos tratados en el destino elegido. Una herramienta muy potente y gratuita es kettle (Pentaho Data Integration). Esta utilidad facilita de una forma visual e intuitiva la construcción de este tipo de desarrollos. Lo que necesitas hacer es muy fácil con Kettle. Es posible leer datos desde casi cualquier fuente de datos, entre ellas una hoja de excel y después escribir estos datos en cualquier tipo de formato como puede ser una base de datos postgres entre otras muchas. Una vez tienes el proceso creado puedes planificar su ejecución diaria mediante el uso de un planificador de tareas como el scheduler de windows o el cron en unix.
En la sección grupos de esta red hay un grupo dedicado a Kettle donde puedes encontrar más ayuda sobre como crear el proceso que necesitas. Además, si te descargas la herramienta puedes encontrar ejemplos prácticos de como leer una hoja de excel y como transmitir el contenido hacia una tabla en bbdd.
Un saludo.
Puedes descragar kettle desde esta url: http://sourceforge.net/projects/pentaho/files/Data%20Integration/4....