array(5) { [1]=> int(1063) [2]=> int(1095) [3]=> int(683) [4]=> int(1048) [5]=> int(1073) }
03/02/2015

La opinión del experto

La opinión del experto

Arturo SALAZAR
Business Solution Manager for Data Management at Southwest Europe.

1. ¿Por qué la calidad de datos es tan importante para Big Data?

Empecemos por definir la calidad de los datos. Es la capacidad de los datos para satisfacer un conjunto de criterios que hacen que los datos sean considerados como correctos, y así que puedan ser explotados de forma fiable. Entre estos criterio encontramos la integridad, oportunidad, exactitud, coherencia, pertinencia e integridad. Sin esta calidad el proceso de explotación y análisis llevaría un alto riesgo, puesto que se complicaría su explotación, y de la misma forma podrían estar al origen de una incorrecta información, y por consecuencia de una incorrecta toma de decisiones.

Entonces volviendo a la pregunta de inicio con respecto al Big Data. Además de la parte de capacidad de almacenamiento y procesamiento, Big Data sigue siendo datos y tienen que responder a esos criterios mínimos de calidad para que puedan ser considerados como útiles.

Sin esta calidad, los datos provenientes del Big Data serán considerados como inexplotables y se convertirán rápidamente en un problema de almacenamiento, en lugar de ser una fuente de conocimiento infinita como lo podrían llegar a ser.

Un estudio reciente en Europa muestra que las empresas almacenan y gestionan un promedio de 110T de datos. Pero el estudio también revela que las empresas utilizan sólo un 5% de estos datos para análisis. Una de las razones más importantes de esta diferencia es la falta de calidad, la falta de gobernabilidad de datos o incluso la ausencia de tecnología adaptada.

2. ¿Qué es lo que necesita una estrategia de negocio de metadatos?

Comunicación de su valor para el negocio, y una buena gestión del cambio.
Uno de los primeros pasos de esta estrategia es identificar e implementar una estructura de metadatos, a perímetro limitado, que aporte valor al negocio. Y luego comunicar fuertemente esta iniciativa con el fin de aumentar la confianza y estimular la adherencia de los principales actores. Al mismo tiempo, no hay que olvidar la necesidad de gestión del cambio, es decir que esta estrategia de metadatos se integre de las acciones y procesos cotidianos. Esto será también parte de lo que se conoce como el gobierno de datos.

En general, los metadatos deben ser percibidos como una oportunidad para alinear toda la organización en torno a los datos estratégicos, y no como una limitación operacional que es lo que sucede generalmente.

A pesar de ser comúnmente evocados por los equipos IT, los metadatos responden principalmente a criterios de negocio. Ellos permiten de transformar los datos en información de negocio, además de agilizar el intercambio de datos entre las diferentes unidades de negocios. Los metadatos también estarán en el corazón de una estrategia analítica puesto que es a partir de esos datos que se identifican los principales ejes de análisis

Metadatos bien definidos permitirán una mejora notable en los siguientes dominios:
• Comunicación e intercambio de datos entre los sistemas
• Aceleración del diseño e implementación de informes
• Aceleración de la implementación de soluciones analíticas
• Identificar los datos claves a explotar a partir de los repositorios Big Data
• Asegurar que los usuarios tienen acceso a los datos que necesitan, y solo estos

3. ¿Qué es SAS Lineage y cómo podría ayudar a las empresas a implementar una estrategia de big data? ¿Cuáles son las ventajas?

SAS Lineage es un componente de las herramientas de gestión de datos que permite visualizar gráficamente cómo interactúan los metadatos en la organización, incluidas las relaciones con los distintos procesos, personas y sistemas existentes.

Un etapa clave de la estrategia de big data es identificar la relación entre los datos existentes en la organización y los datos provenientes de Big data. Recordemos que el volumen de datos que provienen de big data es enorme y por lo general no están estructurados, lo cual complica esta tarea.

En este contexto, SAS Lineage puede ayudar a integrar Big Data correctamente, vinculando los datos y brindando una visión completa de los metadatos gestionados en la organización. Así como lo mencionamos previamente, los metadatos nos permiten intercambiar datos entre los sistemas y las diferentes unidades de negocio.

Entre las principales ventajas podemos listar:
• Provee la visión 360 de los datos y sus interacciones.
• Facilita la identificación de los datos claves en la organización, para la explotación y análisis de datos
• Permite vincular los datos provenientes de big data con los datos existentes
• Vincula los datos con sus responsables. Gobierno de Datos

4. ¿Por qué una empresa debe poner en marcha una política de gobierno de datos?

En primer lugar, las organizaciones tienen que tomar conciencia de la importancia de los datos para su actividad cotidiana, así como para la definición de su estrategia de negocio. Estos deben ser reconocidos como un activo al mismo nivel que los recursos humanos o las finanzas, y deben ser gestionados como tal.

Una política de gobierno de datos es esencial para mantener este activo bajo control y así asegurar su buena calidad.

El Gobierno de datos va a permitir entre otras cosas de:
• Definir los datos a nivel corporativo
• Definir procesos estándar de manipulación de datos clave.
• Identificar los procesos de negocios en los cuales los datos están involucrados.
• Definir los criterios de calidad de datos y asegurar su control
• Identificar a las personas que interactúan con los datos, y quien tiene acceso a que. Entre ellas a los responsables
• Definir una organización de personas alrededor de los datos
• Identificar los sistemas que hacen uso de esos datos y asegurarse que estos respetan los criterios de calidad definidos previamente
• Y de forma más general, asegurarse de la coherencia global de los datos a través de toda la organización

Otro punto que merece una atención especial, es que el gobierno de datos va a facilitar el uso de los datos a fines de soportar el proceso analítico: servir como base de un proceso de toma de decisiones, identificación de una estrategia de negocio y así soportar el alineamiento con la única visión de la empresa.

En la actualidad, la falta de políticas de datos es una de las principales razones de la incoherencia de datos, tanto en los procesos operacionales como en los procesos de análisis. De la misma forma que la existencia de silos de datos que no pueden ser explotados a nivel corporativo.

CompárteloShare on FacebookTweet about this on TwitterShare on LinkedInShare on Google+Email this to someone

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *