miércoles, 5 de noviembre de 2014

OpenRefine : aplicación de escritorio de código abierto para la limpieza y transformación de datos a otros formatos

OpenRefine es una aplicación de escritorio de código abierto independiente para la limpieza y transformación de datos a otros formatos. Es similar a las aplicaciones de hoja de cálculo ( y puede trabajar con formatos de archivo de hoja de cálculo) , sin embargo , se comporta más como un base de datos.
OpenRefine opera con filas de datos organizados en columnas, muy similar a las tablas de bases de datos relacionales. Uno de los proyectos OpenRefine es una tabla. El usuario puede filtrar las filas que desea mostrar utilizando facetas que definir criterios de filtrado . A diferencia de las hojas de cálculo, la mayoría de las operaciones en OpenRefine se hacen en todas las filas visibles. Todas las acciones que se realizaron en un conjunto de datos son almacenada en un proyecto y se pueden reproducir en otro conjunto de datos.
A diferencia de las hojas de cálculo las fórmulas se utilizan para transformar los datos, y la transformación se realiza sólo una vez. El programa cuenta con una interfaz de usuario web. Sin embargo, no se encuentra alojado en la web ( SAAS ) , pero está disponible para su descarga y uso en local . Al iniciar OpenRefine , inicia un servidor web y se inicia un navegador para abrir la interfaz de usuario web que funcionará con este servidor web.
USOS
  • Limpieza de datos desordenados:., Por ejemplo, si tienes un archivo de texto con algunos datos semiestructurados, puede editarlo usando las transformaciones, las facetas y la agrupar para que los datos estructurados limpiamente
  • Transformación de los datos: la conversión de valores a otros formatos, normalización y desnormalización.
  • Análisis de datos de sitios web:. OpenRefine tiene una URL característica y analizador de HTML con  motor DOM
  • Agregar datos al conjunto de datos desde servicios web. Por ejemplo se puede utilizar para la geocodificación de direcciones a coordenadas geográficas.
  • Trabajar con Freebase

0 comentarios: