Con el Big Data viene además un “Big Problem” Ético

Con el Big Data viene además un “Big Problem” Ético

29/06/2018 0 Por World of Data

Según el White-paper de IDC «Data Age 2025 Data Age 2025: The Evolution of Data to Life-Critical Don’t Focus on Big Data; Focus on the Data That’s Big» de abril 2017, se espera que en 2025 la economía digital multiplique por 10 el volumen de datos generados, hasta alcanzar 163 Zettabytes, una vez que el volumen de datos críticos para la vida pasará del 10% (16 ZB), hasta el 20%. Es decir más de 32 Zb, donde la mayor parte se destinará al tratamiento  en tiempo real, que representa aproximadamente 1/4 de los 163 Zb (más de 40 Zb).

La economía digital conlleva igualmente a riesgos asociados a las informaciones que se pueden descubrir, mediante la obtención de dichos volúmenes, variedad y frecuencia de datos. Hoy en día, aunque no se utilicen datos considerados como personales según la RGPD, es posible descubrir/determinar el perfil de alguien mediante Inteligencia Artificial y Machine Learning. Esto trae muchas cuestiones éticas e incluso legales. En particular si se combinan con mecanismos automáticos de toma de decisiones, basados en modelos analíticos/Algorítmicos, cuyas acciones adoptadas en tiempo real y/o a posteriori, basadas en Big Data, tengan impacto en la justicia social y/o económica individual o de una comunidad.

Ahora bien, directa o indirectamente muchos de estos datos podrán considerarse datos personales – sensibles, muy sensibles,… – y, como tal, están vinculados a normas / leyes de protección y auditoria. Pero eso no es suficiente, ya que, en general, las leyes de protección de datos personales no incluyen aspectos de orden ético y moral, aunque puedan estar subyacentes o en el ámbito de la ley. Así, incumbe a las organizaciones aplicar códigos de moral y de ética que abarquen el ciclo de vida completo de los datos, desde la recogida, preparación, tratamiento, agregación, definición de perfiles, intercambio, retención, archivo y destrucción.

Ethics Risk Assessments

Hoy en día, la mayoría de las organizaciones no tiene plataformas/procesos de administración de datos, ni de información y, aún menos, las que tienen dichos procesos regidos por un código de ética. Algunas clases profesionales están sometidas a un código ético y/o de conducta, pero para profesiones no reglamentadas, cuando las hay, dicho código existe como un conjunto de políticas internas, donde la mayoría de los casos no son efectivamente conocidas o comprendidas por los funcionarios.

En mi opinión, las organizaciones tienen la obligación de aplicar procesos de gobierno de datos y de información que deberán incluir una gestión efectiva del consentimiento para la recogida de datos, su manejo/tratamiento/uso e intercambio. Además, y quizá aún más importante, deberán incluir protocolos de gobierno de modelos de IA/ML, desde el por qué y de la definición de los criterios de creación (cuál el objetivo del modelo y por qué), recogida de datos para desarrollo, para entrenamiento, metodologías de pruebas preproducción y del tratamiento del feedback de su aplicación/ejecución. Está claro que los Data Scientists que llevarán a cabo su desarrollo son clave para garantizar que los principios éticos se respetan.

Así, la definición de Ethics Risk Assessments debería implementarse desde la idea, fase de concepción, diseño de procesos, diseño de modelos analíticos / inteligencia artificial, hasta la entrada en producción, incluyendo el feedback de su ejecución. Ethics Risk Assessements, como un conjunto de preguntas de filtrado y validación de los principios éticos, debería incluir un seguimiento eficaz con registro de acciones y capacidad de análisis inversa (logging and back tracing), garantizando que la ejecución está de acuerdo con los principios éticos y que podrá ser auditada en su totalidad.

Por lo tanto, la aplicación Ethics Risk Assessments en el uso de Big Data es esencial, siendo todavía más relevante cuando se toman decisiones en Edge (cerca del sitio donde se da el evento) y en tiempo real.

 

João Oliveira
Principal Business Solutions Manager, Information Management, CoE. SAS