Hola Israel, esa era una de mis grandes dudas. Para comprobarlo, primero utilicé el operador Read Database, que accede directamente a la base de datos, y luego de varios minutos de procesamiento, apareció un mensaje de "memoria agotada" y una sugerencia para utilizar el operador Stream Database, con una funcionalidad limitada con respecto al Read Database. La cuestión es que para realizar minería de datos es necesario preprocesar los datos, y resumirlos. Por lo general se crea un archivo de texto o una tabla con los datos resumidos, y sobre éstos se aplican los algoritmos de MD para generar los modelos, según el objetivo de MD. Los millones de registros de datos en bruto pasan a ser uno pocos miles luego del preprocesamiento.
¡No hay comentarios todavía!
Necesitas ser un miembro de Open Business Intelligence para añadir comentarios!
Comentario (1 comentario)
Hola Israel, esa era una de mis grandes dudas. Para comprobarlo, primero utilicé el operador Read Database, que accede directamente a la base de datos, y luego de varios minutos de procesamiento, apareció un mensaje de "memoria agotada" y una sugerencia para utilizar el operador Stream Database, con una funcionalidad limitada con respecto al Read Database. La cuestión es que para realizar minería de datos es necesario preprocesar los datos, y resumirlos. Por lo general se crea un archivo de texto o una tabla con los datos resumidos, y sobre éstos se aplican los algoritmos de MD para generar los modelos, según el objetivo de MD. Los millones de registros de datos en bruto pasan a ser uno pocos miles luego del preprocesamiento.
Necesitas ser un miembro de Open Business Intelligence para añadir comentarios!
Participar en Open Business Intelligence