Hola.
Estoy construyendo un DW, donde mi fuente de datos son 4 archivos excel, los cuales almacenan los puntajes de las pruebas de lenguaje, matemática y naturales de los alumnos de mi país, así como la cantidad de alumnos que dan esas pruebas, tanto por region, departamento, comuna y establecimiento educacional, respectivamente.
En mi tabla de hechos he puesto como métrica los puntajes y la cantidad de alumnos que rinden las pruebas, pero a la hora de crear las dimensiones es donde tengo una duda.
¿Sería mejor crear una dimensión llamada por ejemplo, "ubicacion", cuyos campos sean region, departamento, comuna y establecimiento, o cada uno de estos campos nombrados anteriormente hacerlos como dimension?
Les cuento además, que en cuanto a la variable de tiempo, la he puesto como campo dentro de un modelo de ER, y como dimensión en otro... aún no estoy decido cuál elegir, aunque solo cuento con los años en que se toman estas pruebas, por lo que estoy más inclinado a dejarla como campo dentro de la tabla de hechos.
Como dato final, estoy usando Pentaho Data Integration (Kettle) para la creación de las tablas que formarán el DW, y Pentaho Schema Workbench (PSW) para la creación del cubo multidimensional.
Voy a probar ambos modelos de ER en Kettle y en PSW, pero me gustaría que me dieran sus opiniones, para construir el DW de la mejor forma.
Bueno, les dejo los dos esquemas de ER que he hecho, abarcando las posibilidades nombradas arriba.
De antemano gracias.
Saludos.