protección de datos para proyectos big data. 2017

35
MÁSTER EN INGENIERÍA INFORMÁTICA, ESPECIALIDAD BIG DATA Javier Alvarez Hernando. Abogado @_JavierAlvarez Valladolid, 9 de noviembre de 2017

Upload: javier-alvarez-hernando

Post on 24-Jan-2018

146 views

Category:

Law


8 download

TRANSCRIPT

MÁSTER EN INGENIERÍA INFORMÁTICA, ESPECIALIDAD BIG DATA

Javier Alvarez Hernando. Abogado

@_JavierAlvarez

Valladolid, 9 de noviembre de 2017

En el ano 2000, solamente ¼ de toda la informacion mundial estaba almacenada en formato digital; el resto se almacenaba en medios analogicos como el papel. Sin embargo, en la actualidad mas del 98% de toda nuestra informacion es digital.Kenneth NEIL CUKIER y Viktor MAYER-SCHOENBERGER. «The Rise of Big data. How It’s Changingthe Way We Think About the World». Fore- ign Affairs Vol. 92, n.o 3 (2013).

Desde el inicio de la historia hasta 2003 los humanos habíamos creado 5 exabytes (es decir, 5 mil millones de gigabytes) de informacion. En 2011 ya creabamos esa misma cantidad de informacion cada dos dias. Dave Turek, responsable de desarrollo de superordenadores de IBM.

DATAFICACION: Permite transformar en información datos no estructurados de nuestra vida cotidiana como fotografías, imágenes o audio; la geolocalización (GPS); análisis de palabras por sistemas de data mining; amistades o preferencias por los likesen redes sociales.

“(…) gigantescas cantidades de informaciondigital controlada por companias, autoridades y otras organizaciones, y que estan sujetas a un analisis extenso basado en el uso de algoritmos GRUPO DE TRABAJO DEL ARTICULO 29, «Opinion 03/2013 on Purpose Limitation» (2013).

El big data es el conjunto de tecnologias que permiten tratar cantidades masivas de datos provenientes de fuentes dispares, con el objetivo de poder otorgarles una utilidad que proporcione valor. Este puede ser descubrir patrones de comportamiento de los clientes de una organizacionpara crear publicidad dirigida mucho más efectiva, predecir tendencias economicas o descubrir relaciones antes desconocidas entre variables que puedan abrir las puertas a la innovacion.

“Uso que se le da al conjunto de tecnologías que permiten tratar cantidades masivas de datos provenientes de fuentes dispares con el objetivo de poder otorgarles una utilidad que proporcione valor” (Gil González E. Big data, privacidad y protección de datos. AEPD. Madrid 2016).

Gran volumen de datos a tratar.

Procedentes de una variedad de fuentes (estructuradas o no).

Que se puedan obtener con gran rapidez, incluso a tiempo real.

Que permitan su análisis a gran velocidad y se lleguen a conclusiones.

VOLUMEN + VARIEDAD (TIPOLOGIA DATOS Y FUENTES) + VELOCIDAD

VERACIDAD (CALIDAD DE LOS DATOS)+ VARIABILIDAD + VALOR ($)

El Big Data no hay que entenderlo únicamente como el almacenamiento y procesamiento de muchos datos que se transmiten a gran velocidad. Juega un papel muy importante la ANALITICA DESCRIPTIVA y sobre todo la PREDICTIVA. Es decir convertir esos datos en bruto en información que tenga una aplicación.

1. Obtención de datos de diversas fuentes que deben ser procesados y almacenados.“DATA LAKE”: repositorio de almacenamiento a gran escala que permite potencia de procesamiento. Se comparte con toda la organización si bien los procesos son distintos, sin fricciones.

2. Aplicación de algoritmos a esos datos, que de forma automatizada llevan a unas conclusiones: vincular datos con una determinada persona (p.e. crear perfiles de hábitos de consumo…)

OJO: derecho a no verse sometidos a decisiones únicamente en tratamientos automatizados de datos que evalúen la personalidad, salvo contrato o consentimiento del afectado (art. 22 RGPD).

El objetivo del Big Data es aportar y descubrir un conocimiento oculto a partir de grandes volúmenes de datos. No es relevante el volumen de datos o su naturaleza. Lo que importa es su valor potencial que solo las tecnologías especializadas pueden explotar.

En este contexto, es claro que las oportunidades que genera el big data son enormes, y estas oportunidades, son ya hoy en dia, en muchos casos, un beneficio tangible: Sector sanitario (reducir listas espera); Smart Cities (tráfico,

contaminación); sector de la distribución (prever el desabastecimiento..)

Amazon; Google; IBM; llevan anos invirtiendo en descubrir nuevos usos de los datos, cómo tratarlos y cómo transformarlos en valor.

IBM (2012):suelos inteligentes que analicen las pisadas de trabajadores y los reconozcan por su peso y su forma de moverse

Recoge datos sobre las compras de sus clientes que despues analiza para comprender sus habitos de consumo. Con los millones de bytes de informacion que posee, la empresa decidio intentar realizar predicciones de ventas en determinadas circunstancias, como en situaciones de alarma de huracan. El analisis de los datos descubrio patrones tan sorprendentes como que el producto estrella que los consumidores compran antes de estos huracanes es cerveza, o que ante una amenaza de huracan, se disparan las ventas de los dulces de fresa «Pop Tarts» hasta siete veces por encima de las ventas ordinarias. Con este conocimiento, la cadena se abastece antes de un huracan, y esta informacion no es solo poder, sino tambien dinero.

Caer en conclusiones erróneas que nadie revisa. Es imprescindible poder diferenciar la causalidad de la casualidad. Por ejemplo, es mero azar que el nivel de PIB de un pais este correlacionado con el tamano del pene de los hombres de dicho pais. Es necesario anadir un enfoque subjetivo que explique una verdadera conexión o bien se trate de coincidencias. http://www.tylervigen.com/spurious-correlations

El riesgo para la privacidad de las personas.

Análisis de datos masivos sea usado para castigar a las personas basándose en predicciones… CESARE LOMBROSSO (concepción del delito como resultado de tendencias innatas, de orden genético, observables en ciertos rasgos físicos o fisonómicos de los delincuentes habituales (asimetrías craneales, determinadas formas de mandíbula, orejas, etc.). L'uomodelinquente, 1876

http://www.tylervigen.com/spurious-correlations

Correlación del número de ahogados por caídas en piscinas y películas de Nicolas Cage

PERE BRACHFIELD, UNO DE LOS MAYORES ESPECIALISTAS EN MOROSIDAD

1.- Por lo general es un varón con una edad entre los 30 y 70 años y con buena salud. Es una persona proveniente de la clase media-alta, educada, con estudios superiores y con un elevado nivel cultural.

2.- Es un individuo que tiene la habilidad de hacerse pasar por empresario, pretendiendo ser un hombre de negocios respetable o profesional liberal. En realidad suele ser un emprendedor fracasado e insolvente.

3.- Posee una buena capacidad de comunicación interpersonal, viveza de espíritu, buena memoria, aplomo y tiene una enorme inteligencia emocional.

4.- Tiene una situación familiar irregular (no se sabe si está casado, soltero, divorciado o separado). Es promiscuo, cambia con frecuencia de pareja. Es frecuente verlo en compañía femenina, generalmente con mujeres jóvenes y atractivas. A pesar de tener múltiples amantes acostumbra a vivir solo para tener más libertad y desarraigo. También puede emparejarse con señoras con buena posición que le ayudan en sus actividades económicas.

5.-Tiene un carácter sumamente afable, simpático, es un gran seductor, es divertido, atractivo, tiene un gran don de gentes, cae bien a los demás e inspira confianza.

6.- Es un sujeto urbano, prefiere vivir en las grandes ciudades y suele residir en una zona de clase alta o en un barrio residencial (siempre de alquiler) pero cambia con frecuencia de domicilio ya que no suele pagar los arrendamientos y además cambiando a menudo de lugar de residencia, le permite eludir a sus acreedores.

7.- Siempre tiene múltiples proyectos de negocio, pero ninguno sólido, con arraigo o con activos; sólo tiene tarjetas de visitas con anagramas diversos.

8.- Es un individuo totalmente insolvente, ya que no tiene propiedades registradas a su nombre ni ningún activo embargable. En ocasiones ha creado un entramado de sociedades para ocultar sus bienes o los tiene a nombre de su pareja.

9.- Suele conducir coches de alta gama que ha conseguido en régimen de renting o leasing.

10.- Suele impagar a sus acreedores bastante pronto, generalmente cuando ha conseguido ganarse la confianza del nuevo proveedor y haber obtenido suficiente crédito para que le resulte rentable su esfuerzo.

11.- Nunca asume responsabilidades directas por el impago. Él nunca tiene la culpa y siempre tiene tendencia a implicar a terceras personas. Nunca dice que no paga, sino que el responsable de la falta de pago es otro: es culpa de su socio, de su contable, de su secretaria, del banco, de la crisis o la clásica excusa de que no puede pagar porque a su vez alguien no le ha pagado todavía.

12.- Le da lo mismo que le lleven ante los tribunales, ya que por un lado es totalmente insolvente, por lo que no le pueden embargar nada, ni le pueden meter en la cárcel por deudas, y por otro como cambia habitualmente de denominación social, de sector y de zona de actuación, no le preocupa lo más mínimo que se divulgue su condición de moroso contumaz en el entorno actual.

Uno de los riesgos más importantes: la privacidad de las personas.

El talon de Aquiles de las empresas que operan con datos es la privacidad, y el riesgo reputacional al que se enfrentan es muy elevado. Grandes empresas como Google, Facebook, AOL o Microsoft se encuentran entre las peor percibidas por los usuarios en términos de privacidad.

La defensa de la privacidad y la proteccion de datos es uno de los retos mas importantes a los que se enfrenta el big data en la actualidad.

Directiva 95/46/CE, de 24 de octubre.

LOPD (Ley Orgánica 15/1999, de Protección de Datos) y RLOPD (R.D. 1720/2007) reconoce unos derechos.

REGLAMENTO (UE) 2016/679 DEL PARLAMENTO EUROPEO Y DEL CONSEJO de 27 de abril de 2016 relativo a la protección de las personas físicas en lo que respecta al tratamiento de datos personales y a la libre circulación de estos datos y por el que se deroga la Directiva 95/46/CE (Reglamento general de protección de datos) ……..ENTRADA EN VIGOR EN MAYO 2018.

Se entiende por dato de caracter personal «cualquier informacion concerniente a personas fisicasidentificadas o identificables». Una persona es identificable cuando su identidad pueda determinarse, directa o indirectamente, mediante cualquier informacion referida a su identidad fisica, fisiologica, psiquica, economica, cultural o social, salvo que dicha identificacion requiera actividades o plazos desproporcionados.

El análisis de identificabilidad debe basarse en dos criterios: razonabilidad de la disponibilidad de medios (humanos,

técnicos…)Proporcionalidad de los esfuerzos para identificar a una

persona.

Datos anonimizados: no es de aplicación la normativa.

Protección de datos es un derecho fundamental, no absoluto. exclusivo de personas físicas. (excluido del ámbito de aplicación: fallecidos y personas de contacto de personas jurídicas).

Las personas físicas titulares de sus propios datos personales almacenados en ficheros, sean automatizados o en soporte papel, tienen la facultad de ejercer, frente a cualquier responsable del fichero o del tratamiento (o en su caso, encargado), los derechos de acceso, rectificación, cancelación, oposición, supresión….exclusión de ficheros incluidos en fuentes de acceso al público (FAP), además de impugnar valoraciones y, en su caso, reclamar una indemnización ante la jurisdicción civil si como consecuencia de vulneraciones de la normativa de protección de datos, por parte de los responsables de los ficheros, han sufrido una lesión en sus bienes o derechos.

El Tribunal Constitucional (Sentencia 290/2000, de 30 de noviembre) reconoció expresamente el poder de disposición y control por parte de los interesados sobre sus datos personales.

Derecho del ciudadano / Obligación de las empresas y AAPP: Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos …. NUEVO REGLAMENTO EUROPEO y REFORMA DE LA LOPD.

Es el amparo debido a los ciudadanos contra la posible utilización por terceros, en forma no autorizada, de sus datos personales susceptibles de tratamiento automatizado, (o no automatizado) para, de esta forma, confeccionar una información que, identificable con él, afecte a su entorno personal, social o profesional, en los límites de su intimidad.

Conceptos de Responsable y encargado del tratamiento: contrato por escrito.

Sanciones MUY ELEVADAS.19

Principio de consentimiento: libre, explícito y específico para cada finalidad y que pueda ser revocado (…el ppio. de finalidad supone una barrera para el big data…)

Principio de información y transparencia.

Principio de calidad.. Los datos solo pueden tratarse de manera lícita, leal y transparente. Datos pertinentes y adecuados a la finalidad. ACTUALIZADOS.

Principio de minimización y conservación de los datos. El tratamiento deberá limitarse a lo necesario en relación con fines determinados, explícitos y legítimos. Los datos no pueden conservarse por mas tiempo que el necesario (no vale el lo guardo por si acaso…)

El principio de legitimación, relacionado con el de información, por el que el interesado debe ser informado con claridad acerca de las finalidades para las que se recaban sus datos. El Big Data por su propia esencia puede llevar a situaciones en los que la finalidad inicial se vea difuminada cuando el dato es “explotado”.

Principio de seguridad: análisis de riesgos.20

El tratamiento de datos (art. 4.2. RGPD): es cualquier operación o conjunto de operaciones realizadas sobre datos personales o conjuntos de datos personales, ya sea por procedimientos automatizados o no, como la recogida, registro, organización, estructuración, conservación, adaptación o modificación, extracción, consulta, utilización, comunicación por transmisión, difusión o cualquier otra forma de habilitación de acceso, cotejo o interconexión, limitación, supresión o destrucción;

Consentimiento de afectado.

Existencia de una relación contractual.

Existencia de un interés legítimo prevalente del responsable o de

terceros a los que se ceden o comunican los datos personales.

Justificado en una necesidad vital del interesado.

Cuando resulte una obligación legal para el responsable del

tratamiento.

Exista un interés público o se derive del ejercicio de poderes

públicos: smart cities; servicios públicos de salud…

Tal y como se define en el artículo 4.11 del RGPD el consentimiento del interesado toda manifestación de voluntad libre, específica, informada e inequívoca por la que el interesado acepta, ya sea mediante una declaración o una clara acción afirmativa, el tratamiento de datos personales que le conciernen. Se descarta, por tanto, la validez del consentimiento tácito.

Se aclara en el Considerando (32) que el silencio, las casillas previamente seleccionadas o la inacción no constituyen un consentimiento válido. Por otro lado, cuando el tratamiento tenga varias finalidades, debe constar el consentimiento para todos ellos.

Por su parte el consentimiento del afectado en el anteproyecto de reforma de la LOPD, en el mismo sentido que lo expuesto, se recoge en el artículo 7.

El artículo 6.1 f) del RGPD, señala que el tratamiento será lícito si es necesario para la satisfacción de intereses legítimos perseguidos por el responsable del tratamiento o por un tercero, siempre que sobre dichos intereses no prevalezcan los intereses o los derechos y libertades fundamentales del interesado que requieran la protección de datos personales, en particular cuando el interesado sea un menor de edad.

El artículo 35.7.a del RGPD, por su parte, contempla que las evaluaciones de impacto de protección de datos deben incluir “una descripción sistemática de las operaciones de tratamiento previstas y de los fines del tratamiento, inclusive, cuando proceda, el interés legítimo perseguido por el responsable del tratamiento”.

El Considerando (47) del RGPD se refiere a esta figura, destacando que la existencia de un interés legítimo requeriría una evaluación meticulosa considerándose que constituye un interés legítimo los tratamientos de datos: necesarios para la prevención del fraude.

con fines de mercadotecnia directa.

No existe esta legitimación para la ejecución de perfilados de clientes (Dictamen 6/2014 GT29).

Los datos personales no podrán usarse para finalidades incompatibles con aquellaspara las que los datos hubieran sido recogidos, lo que no significa que no puedanutilizarse para finalidades diferentes para las que se recogieron, si no que éstas nodeben ser incompatibles

El análisis de no incompatibilidad es básico en el Big Data: (Dictamen WP 203 GT29 recomienda):i. Debe existir una relación entre la finalidad original y la finalidad o finalidades ulteriores.

ii. El tratamiento ulterior debe encontrarse dentro de las expectativas razonables del interesado.

iii. Debe tenerse en cuenta la naturaleza de los datos objeto de tratamiento y la sensibilidad de los mismos.

iv. Debe considerarse el impacto que este tratamiento va a tener en los interesados.

v. Deben considerarse las medidas de protección que el responsable del tratamiento establece, en particular las medidas técnicas y organizativas: encriptación, seudonimización, separación funcional, transparencia, oposición al tratamiento.

Art. 6.4. RGPD: Cifrado y seudonimización.

También, se hace mención en el Reglamento al principio de integridad y confidencialidad de los datos. Consiste, en que los datos tienen que ser tratados de forma que se garantice una seguridad adecuada frente a intromisiones no autorizadas y contra su pérdida o destrucción, ya sea consciente o accidental. A tal fin se exige aplicar medidas técnicas y organizativas apropiadas.

Medidas tecnológicas: 1) anonimización (irreversible) 2) cifrado 3)control de accesos 4) trazabilidad.

La calidad de los datos primarios puede quedar comprometida de inicio y arrastrarse durante todo su ciclo de vida.

Problema de los metadatos…. Principio de minimización de datos y limitación de la finalidad (uso de los metadatos con finalidades incompatibles…)

Hay que estar al caso particularEjemplo. Una foto con el móvil lleva consigo 40 metadatos….

Una de las grandes novedades que presenta el Reglamento Europeo es el denominado principio de responsabilidad activa (en su concepción anglosajona, accountability), que viene a imponer al responsable, y al encargado del tratamiento, estar en condiciones de demostrar que cumple con las previsiones normativas en materia de protección de datos de carácter personal.

La exigencia de esta responsabilidad activa o accountability puede enlazarse con el concepto de cumplimiento normativo o compliance.

Medidas de Protección de datos desde el diseño (artículo 25.1 RGPD), que veremos a lo largo del curso.

Se impone la obligación al responsable del tratamiento de establecer medidas técnicas y organizativas adecuadas (como, por ejemplo, la seudonimización y la minimización de datos) para aplicar principios de protección de datos de forma eficaz y proteger así los derechos de los afectados.

Medidas de Protección de datos por defecto (artículo 25.2 RGPD).

Es decir, se exige al responsable que adopte medidas técnicas y organizativas adecuadas a fin de que el tratamiento (fijado por defecto) emplee los datos personales estrictamente necesarios para cada fin específico. Esta obligación se debe extender a la cantidad de los datos recopilados, a la extensión del tratamiento, al periodo de almacenamiento, a la accesibilidad y en particular, debe evitarse la accesibilidad a un número indeterminado de datos personales sin intervención de alguien.

Existencia y mantenimiento de un registro de las actividades de tratamiento de datos (artículo 30 RGPD). Se exige para proyectos big data.

Existencia de un delegado de protección de datos (artículos 37 a 39 del RGPD). Se exige en proyectos big data por el tratamiento de datos a gran escala.

Autorización previa o consultas previas con la Autoridad de control.

Evaluaciones de impacto (artículo 35.7.d RGPD). Recomendable/necesario en proyectos Big Data: si el resultado arroja riesgo debe consultarse a la AEPD (art 36 RGPD).

Adopción de medidas de seguridad adecuadas (artículo 32 del RGPD).

Notificación de «quiebras de seguridad», tanto a la autoridad de control, como a los interesados.

Adhesión (según el artículo 24.3 RGPD) a códigos de conducta (artículo 40 RGPD) o mecanismos de certificación (artículos 25.3 y 42 RGPD).

ACCESO, RECTIFICACION Y SUPRESION (DERECHO AL OLVIDO).

OPOSICION Todo interesado tendrá derecho a no ser objeto de una decisión basada únicamente en el

tratamiento automatizado (sin intervención humana), incluida la elaboración de perfiles, queproduzca efectos jurídicos en él o le afecte significativamente de modo similar. EXCEPCIONES:1/Contrato 2/consentimiento 3/Autorizada por una norma (art 22 RGPD). Prohibición generalpara datos sensibles.

DERECHO DE LIMITACION DEL TRATAMIENTO, cuando el interesado impugna laautenticidad de los datos etc.

DERECHO DE PORTABILIDAD DE LOS DATOS: derecho a recibir los datos personales que leincumban que haya facilitado previamente a un responsable, en un formato estructurado y de usohabitual y de lectura mecánica; y a transmitirlos a otro responsable del tratamiento. ESTAPORTABILIDAD SE REFIERE A DATOS PROPORCIONADOS POR EL USUARIO, PERO LO SE REFIERE A LOSDATOS DEDUCIDOS O INFERIDOS CREADOS POR EL RESPONSABLE.

Estrategias de privacidad en la cadena de valor de un proyecto big data

Fuente: CÓDIGO DE BUENAS PRÁCTICAS EN PROTECCIÓN DE DATOS PARA PROYECTOS BIG DATA de la AEPD e ISMS

Principio de finalidad - Fines determinados, explícitos y legítimos - ¿Reutilización de los datos: usos futuros? - Compatibilidad de fines .

Principio de calidad de los datos : Datos adecuados, pertinentes y no excesivos en relación con el ámbito y las finalidades

determinadas, explícitas y legítimas para las que se hayan obtenido.

Los datos no podrán usarse para finalidades incompatibles con aquellas para las que los datos hubieran sido recogidos. No se considerará incompatible el tratamiento posterior de éstos con fines históricos, estadísticos o científicos.

Los datos de carácter personal serán exactos y puestos al día de forma que respondan con veracidad a la situación actual del afectado.

Conservación de los datos - Cancelación de los datos no necesarios

- ¿Datos conservados para usos futuros? Derecho al olvido.

- Cancelación o anonimización.

Derechos de los interesados.

Datos sensibles o especialmente protegidos.

Riesgo de re-identificación - Identificación directa e indirecta

- Combinación de datos de múltiples BBDD

Retribucion por la “venta de los datos personales” Según un estudio de Mediabrands Marketing Sciences, basado en una muestra británica, los consumidores están dispuestos a vender su información personal por unas 500 libras esterlinas al

año, lo que al cambio vendría a ser unos 694 euros.

http://www.warc.com/Content/News/Consumer_data_valued_at_163;500_a_year_.content?ID=36bcf2e8-90c6-4980-8f5f-845fda3ea317

Estereotipos y exclusión social Los algoritmos no son neutrales

La predicción perfecta es imposible

Efecto negativo o desalentador - Autocensura y comportamiento artificial

- Pérdida de confianza en autoridades públicas

- Efecto negativo en la libertad de expresión

- Personalización de los servicios y empobrecimiento de la democracia

GRACIAS…

Javier Alvarez Hernando. Abogado

@_JavierAlvarez