Cada día se multiplican por millones las fuentes de datos no sólo a nivel global, sino también dentro de la misma empresa. Aplicaciones personalizadas o desarrolladas en muchos casos por los propios usuarios, que generan información sensible para su entorno, pero que en ocasiones dificulta su utilización fuera de las fronteras del escritorio. Y casos existen tantos como causas. SQL Server 2012 ha introducido una nueva herramienta capaz de solucionar muchos de estos problemas: SQL Server Data Quality Services (DQS).
SQL Server Data Quality Services (DQS) es un producto de calidad de datos basada en el conocimiento. DQS le permite construir una base de conocimiento y utilizarlo para realizar una variedad de tareas de calidad de datos críticos, incluyendo corrección, enriquecimiento, normalización y detección de duplicados en sus datos.
La base de conocimientos de Data Quality Services DQS es un repositorio de metadatos que se crea por parte del el administrador de datos para su uso en mejora de la calidad de los datos a través de depuración de datos y datos coincidentes. El proceso de gestión del conocimiento DQS incluye los procesos utilizados para crear y administrar la base de conocimientos, tanto de manera asistida por ordenador e interactiva.
DQS permite realizar limpieza de datos mediante el uso de servicios de referencia alojados en la nube y que son proporcionados por los proveedores. DQS también le proporciona perfiles que se integran en sus tareas de calidad de los datos, permitiéndole analizar la integridad de sus datos. DQS consiste en servidor de calidad de datos y el cliente de calidad de datos, ambos de los cuales se instalan como parte de SQL Server 2012. El Servidor de calidad de datos es una característica de la instancia de SQL Server que consta de tres catálogos de SQL Server con el almacenamiento y la funcionalidad de calidad de los datos.
El cliente de calidad de datos es un servidor SQL Server compartido y que los usuarios de negocios, trabajadores de la información y profesionales de IT pueden utilizar para realizar análisis de calidad de datos asistido por computadora y gestionar la calidad de los datos interactivamente. Los orígenes de estos datos pueden abarcar desde una hoja de cálculo Microsoft Excel, hasta una base de Datos completa. La utilización de estos servicios también es posible a través de la tarea de Limpieza de Datos en los paquetes de Integration Services (SSIS) de SQL Server. Esta es la herramienta que muchos trabajadores de la información (Data Stewards) han estado esperando durante mucho tiempo. A partir de ahora esta tarea de consolidar los datos será mucho más agradable.
Más información:
Ernesto Téllez Acosta se ha desempeñado durante 23 años como desarrollador, consultor y arquitecto de soluciones de Software, especializándose en los últimos 16 años en tecnologías Microsoft. Desde 2008 trabaja en Sogeti como Arquitecto de Soluciones Microsoft, aportando su experiencia en diferentes entornos de trabajo y colaborando activamente en las consultorías y procesos de pre-venta.
0 comments on “CONSOLIDACIÓN DE DATOS: UNA TAREA ENGORROSA Y COMPLEJA… HASTA AHORA”