Analítica de datos responsable
En «El hombre que sabía demasiado» de Alfred Hitchcock, un hombre común se ve envuelto en un complot internacional tras escuchar una verdad que no debía saber. Este blog explora una verdad incómoda, pero igualmente crucial, de nuestra era digital: la información es poder, y a menudo, su conocimiento nos coloca en una encrucijada moral. Cada clic, cada dato, así como el uso de modelos de inteligencia artificial nos enfrentan a una pregunta: ¿Es correcto saber lo que sabemos? Y para los empleadores y responsables de proteger el uso de los datos, la pregunta se convierte en ¿Los colaboradores de la organización saben única y exclusivamente lo que necesitan saber para cumplir sus funciones? ¿Han “escuchado alguna verdad” que no deberían saber?

A lo largo de mi carrera, he tenido la suerte de trabajar en proyectos que buscan mejorar la vida de las personas. Esta misión de generar valor y contribuir a la sociedad es lo que me motiva día a día. En este contexto, el tema de la protección de datos es de gran relevancia para mí. Creo en el potencial de la tecnología, pero su verdadero poder se manifiesta cuando se utiliza de manera ética y consciente.
Para entender mejor este desafío, echemos un vistazo a la nueva Ley de Protección de Datos Personales en Chile.
La Ley de Protección de Datos Personales en Chile (21.719)
Las regulaciones a menudo evocan una sensación de restricción o complejidad. Sobre todo cuando vienen acompañadas de una sanción cuando no se cumplen. En Chile estamos frente a una nueva Ley de Protección de Datos personales. A pesar de esto, mi perspectiva es muy positiva. Lejos de verla como una limitación, la considero un marco esencial que promueve la innovación responsable. Esta ley nos da las herramientas para que las empresas puedan desarrollar soluciones avanzadas con la tranquilidad de que están cuidando la privacidad de las personas.
Es una dualidad perfecta: guiar a las empresas a la vanguardia tecnológica mientras se fortalece la confianza de los usuarios. Se trata de construir confianza, proteger a las personas y, al mismo tiempo, desbloquear nuevas oportunidades de negocio y valor a través de datos bien gestionados. En lugar de frenar el avance, esta ley nos invita a ser más creativos y a diseñar soluciones que, desde su concepción, respeten la privacidad y aseguren la confianza digital.
En este blog comparto mi visión de cómo es posible abordar la ley de forma estratégica, para impulsar el desarrollo de iniciativas que cumplen con la ley y potencian el valor de negocio para las empresas que utilizan Google Cloud.
La Ley de Protección de datos en simple
A continuación comparto un breve resumen para los temas que trataremos a continuación.
Principios
Rigen el tratamiento de datos personales y son ocho, entre ellos:
- Licitud: Se debe acreditar la licitud del tratamiento de datos, por ejemplo mediante un consentimiento de uso de datos expresado por el usuario.
- Confidencialidad: Se deberá guardar secreto o confidencialidad de los datos.
- Finalidad: Los datos personales deben ser recolectados y tratados con fines específicos.
Modelo de prevención de infracciones
Los responsables de datos deberán adoptar acciones destinadas a prevenir la comisión de infracciones. La correcta aplicación y supervisión del MPI es una circunstancia atenuante de las infracciones y podría reducir la severidad de las sanciones impuestas.
Derechos ARCO
Los dueños de los datos personales, pueden ejercer derechos sobre sus datos, exigiendo al responsable:
- Acceso: Entregar de la información
- Rectificación: Actualización o corrección
- Supresión y oposición: Eliminarla o impedir el tratamiento respectivamente.
- Portabilidad
Agencia de Protección de Datos Personales
Es un ente fiscalizador con autonomía que podrá multar desde 5.000 hasta 20.000 UTM dependiendo varios factores, incluyendo:
- La gravedad de la conducta
- El perjuicio producido con motivo de la infracción
- El beneficio económico obtenido con motivo de la infracción
- Si el tratamiento realizado incluye datos personales sensibles o datos personales de niños, niñas y adolescentes.
Cumplimiento regulatorio y gobierno de datos
¿Cómo se parte el camino al cumplimiento de Ley de Protección de datos? Una propuesta es a través de un programa de Data Governance.
Según IBM: La gobernanza de datos consiste en establecer cómo se va a recopilar, almacenar y procesar los datos para garantizar la calidad, seguridad y disponibilidad durante todo su ciclo de vida. El cumplimiento normativo consiste en adherirse a los requisitos legales y regulatorios aplicables. Podríamos decir entonces que la gobernanza de datos es el enfoque integral para garantizar que sus datos sean valiosos, accesibles, útiles y creíbles. Uno de los resultados de esto es el cumplimiento normativo.

Soluciones tecnológicas para abordar la ley
A continuación comparto algunas ideas de cómo pueden ser abordados los puntos de la ley que mencioné anteriormente por considerarlos los más relevantes y los cuales se pueden apalancar en soluciones de Gobierno de Datos.
- Reporte de accesibilidad de datos
Para auditar accesos a BigQuery, se pueden analizar los logs de acceso y ejecución de BigQuery a las tablas, construyendo un panel interactivo con herramientas como Looker Studio. Este panel permite a los auditores visualizar métricas clave como usuarios, IPs, tablas consultadas, facilitando el análisis de seguridad y el cumplimiento de normativas.

- Capacidad de rastrear la creación y transformación de los datos
El linaje de datos es como un mapa que muestra el viaje de la información, desde su punto de origen hasta su destino final. Permite rastrear cómo los datos se crean, mueven y transforman. Esto nos ayuda a entenderlos mejor, asegurando que su calidad sea alta y facilitando la solución de problemas, ya que podemos encontrar la causa de cualquier error de manera rápida.


- Catálogo de datos para poder cumplir con los derechos ARCO
Para poder cumplir con cualquier requerimiento de Acceso, Rectificación, Cancelación, Oposición o Portabilidad, las empresas necesitan saber dónde están los datos personales. Un catálogo de datos permite contar con una vista única de todas las fuentes de información, con las etiquetas relevantes (metadata) sobre el tipo de datos contenido, el dueño, si se rige por alguna regulación, etc.

- Clasificación de datos no estructurados con inteligencia artificial
En la actualidad, la cantidad de datos no estructurados es abrumadora, aprox. el 80% del total de los datos. La inteligencia artificial generativa, con su capacidad para procesar contenido multimodal (audio, video, documentos), se ha vuelto fundamental. Esta tecnología permite clasificar y entender datos que antes eran imposibles de analizar, transformando el caos de la información en conocimiento útil. Esto ayuda a identificar y proteger la información sensible, lo que facilita el cumplimiento normativo y la gestión de riesgos.

- Portal de datos corporativo
Por último, una vez que se tiene un catálogo, regido por una correcta clasificación de los datos, entregar un portal de datos donde los usuarios finales pueden descubrir información de manera intuitiva es el endgame. El portal actúa como un punto de contacto único para identificar a los dueños, solicitar acceso a los datos y recibir soporte. Con IA generativa, un agente conversacional integrado que explique el contenido de los datos, resuelva dudas y guíe a los usuarios, permite impulsar la democratización del acceso a la información, y fomentando una cultura de datos en toda la organización.

Innovación sin riesgos: El beneficio de la protección de datos
A medida que las empresas buscan aprovechar el poder de la IA generativa para crear nuevos productos, mejorar la eficiencia y personalizar las experiencias, se enfrentan al desafío de utilizar grandes cantidades de datos, muchos de los cuales son de carácter personal o sensible.
Según McKinsey, la IA Generativa podría aumentar los beneficios anuales a nivel mundial hasta en US $4.4 trillones, significando un incremento de 15-40%. Esto demuestra el enorme potencial, pero también la gran responsabilidad que tenemos al usar los datos

Contar con datos fiables y de alta calidad, es esencial para poder aprovechar modelos de IA Generativa de forma precisa, justa y efectiva. En última instancia, la inversión en la protección de los datos se traduce en un retorno tangible de la inversión:
- Confianza: manifestado en una mayor adopción por parte de los clientes
- Cumplimiento: menor fricción regulatoria
- Innovación: de manera responsable y sostenible en la era de la IA.
Luis Gerardo Baeza
Customer Engineer, Google Cloud
CDMC Certified
Google Professional Cloud Security Engineer Certified
Protección de datos en Chile, por Ley de Datos.com
Esta opinión es a título personal y no representa ningún tipo de recomendación legal ni de cumplimiento.
























