Luis Gerardo Baeza

Destacada

El hombre que sabía demasiado

Analítica de datos responsable

En «El hombre que sabía demasiado» de Alfred Hitchcock, un hombre común se ve envuelto en un complot internacional tras escuchar una verdad que no debía saber. Este blog explora una verdad incómoda, pero igualmente crucial, de nuestra era digital: la información es poder, y a menudo, su conocimiento nos coloca en una encrucijada moral. Cada clic, cada dato, así como el uso de modelos de inteligencia artificial nos enfrentan a una pregunta: ¿Es correcto saber lo que sabemos? Y para los empleadores y responsables de proteger el uso de los datos, la pregunta se convierte en ¿Los colaboradores de la organización saben única y exclusivamente lo que necesitan saber para cumplir sus funciones? ¿Han “escuchado alguna verdad” que no deberían saber?

Imagen 1: Generada con Imagen 4 de Google Cloud

A lo largo de mi carrera, he tenido la suerte de trabajar en proyectos que buscan mejorar la vida de las personas. Esta misión de generar valor y contribuir a la sociedad es lo que me motiva día a día. En este contexto, el tema de la protección de datos es de gran relevancia para mí. Creo en el potencial de la tecnología, pero su verdadero poder se manifiesta cuando se utiliza de manera ética y consciente.

Para entender mejor este desafío, echemos un vistazo a la nueva Ley de Protección de Datos Personales en Chile.

La Ley de Protección de Datos Personales en Chile (21.719)

Las regulaciones a menudo evocan una sensación de restricción o complejidad. Sobre todo cuando vienen acompañadas de una sanción cuando no se cumplen. En Chile estamos frente a una nueva Ley de Protección de Datos personales. A pesar de esto, mi perspectiva es muy positiva. Lejos de verla como una limitación, la considero un marco esencial que promueve la innovación responsable. Esta ley nos da las herramientas para que las empresas puedan desarrollar soluciones avanzadas con la tranquilidad de que están cuidando la privacidad de las personas.

Es una dualidad perfecta: guiar a las empresas a la vanguardia tecnológica mientras se fortalece la confianza de los usuarios. Se trata de construir confianza, proteger a las personas y, al mismo tiempo, desbloquear nuevas oportunidades de negocio y valor a través de datos bien gestionados. En lugar de frenar el avance, esta ley nos invita a ser más creativos y a diseñar soluciones que, desde su concepción, respeten la privacidad y aseguren la confianza digital.

En este blog comparto mi visión de cómo es posible abordar la ley de forma estratégica, para impulsar el desarrollo de iniciativas que cumplen con la ley y potencian el valor de negocio para las empresas que utilizan Google Cloud.

La Ley de Protección de datos en simple

A continuación comparto un breve resumen para los temas que trataremos a continuación.

Principios

Rigen el tratamiento de datos personales y son ocho, entre ellos:

Licitud: Se debe acreditar la licitud del tratamiento de datos, por ejemplo mediante un consentimiento de uso de datos expresado por el usuario.
Confidencialidad: Se deberá guardar secreto o confidencialidad de los datos.
Finalidad: Los datos personales deben ser recolectados y tratados con fines específicos.

Modelo de prevención de infracciones

Los responsables de datos deberán adoptar acciones destinadas a prevenir la comisión de infracciones. La correcta aplicación y supervisión del MPI es una circunstancia atenuante de las infracciones y podría reducir la severidad de las sanciones impuestas.

Derechos ARCO

Los dueños de los datos personales, pueden ejercer derechos sobre sus datos, exigiendo al responsable:

Acceso: Entregar de la información
Rectificación: Actualización o corrección
Supresión y oposición: Eliminarla o impedir el tratamiento respectivamente.
Portabilidad

Agencia de Protección de Datos Personales

Es un ente fiscalizador con autonomía que podrá multar desde 5.000 hasta 20.000 UTM dependiendo varios factores, incluyendo:

La gravedad de la conducta
El perjuicio producido con motivo de la infracción
El beneficio económico obtenido con motivo de la infracción
Si el tratamiento realizado incluye datos personales sensibles o datos personales de niños, niñas y adolescentes.

Cumplimiento regulatorio y gobierno de datos

¿Cómo se parte el camino al cumplimiento de Ley de Protección de datos? Una propuesta es a través de un programa de Data Governance.

Según IBM: La gobernanza de datos consiste en establecer cómo se va a recopilar, almacenar y procesar los datos para garantizar la calidad, seguridad y disponibilidad durante todo su ciclo de vida. El cumplimiento normativo consiste en adherirse a los requisitos legales y regulatorios aplicables. Podríamos decir entonces que la gobernanza de datos es el enfoque integral para garantizar que sus datos sean valiosos, accesibles, útiles y creíbles. Uno de los resultados de esto es el cumplimiento normativo.

Imagen 2: Generada por Imagen 4 de Google Cloud

Soluciones tecnológicas para abordar la ley

A continuación comparto algunas ideas de cómo pueden ser abordados los puntos de la ley que mencioné anteriormente por considerarlos los más relevantes y los cuales se pueden apalancar en soluciones de Gobierno de Datos.

Reporte de accesibilidad de datos

Para auditar accesos a BigQuery, se pueden analizar los logs de acceso y ejecución de BigQuery a las tablas, construyendo un panel interactivo con herramientas como Looker Studio. Este panel permite a los auditores visualizar métricas clave como usuarios, IPs, tablas consultadas, facilitando el análisis de seguridad y el cumplimiento de normativas.

Imagen 3: Reporte de acceso a BigQuery, Google Cloud Blog.

Capacidad de rastrear la creación y transformación de los datos

El linaje de datos es como un mapa que muestra el viaje de la información, desde su punto de origen hasta su destino final. Permite rastrear cómo los datos se crean, mueven y transforman. Esto nos ayuda a entenderlos mejor, asegurando que su calidad sea alta y facilitando la solución de problemas, ya que podemos encontrar la causa de cualquier error de manera rápida.

Imagen 4: Ejemplo de un flujo de datos end-to-end típico

Imagen 5: Ejemplo de un flujo de datos automático en Google Cloud

Catálogo de datos para poder cumplir con los derechos ARCO

Para poder cumplir con cualquier requerimiento de Acceso, Rectificación, Cancelación, Oposición o Portabilidad, las empresas necesitan saber dónde están los datos personales. Un catálogo de datos permite contar con una vista única de todas las fuentes de información, con las etiquetas relevantes (metadata) sobre el tipo de datos contenido, el dueño, si se rige por alguna regulación, etc.

Clasificación de datos no estructurados con inteligencia artificial

En la actualidad, la cantidad de datos no estructurados es abrumadora, aprox. el 80% del total de los datos. La inteligencia artificial generativa, con su capacidad para procesar contenido multimodal (audio, video, documentos), se ha vuelto fundamental. Esta tecnología permite clasificar y entender datos que antes eran imposibles de analizar, transformando el caos de la información en conocimiento útil. Esto ayuda a identificar y proteger la información sensible, lo que facilita el cumplimiento normativo y la gestión de riesgos.

Imagen 7: Clasificación de datos no estructurados con IA Generativa

Portal de datos corporativo

Por último, una vez que se tiene un catálogo, regido por una correcta clasificación de los datos, entregar un portal de datos donde los usuarios finales pueden descubrir información de manera intuitiva es el endgame. El portal actúa como un punto de contacto único para identificar a los dueños, solicitar acceso a los datos y recibir soporte. Con IA generativa, un agente conversacional integrado que explique el contenido de los datos, resuelva dudas y guíe a los usuarios, permite impulsar la democratización del acceso a la información, y fomentando una cultura de datos en toda la organización.

Imagen 8: Datos para todos sin intermediarios, a través de un portal de datos. Medium

Innovación sin riesgos: El beneficio de la protección de datos

A medida que las empresas buscan aprovechar el poder de la IA generativa para crear nuevos productos, mejorar la eficiencia y personalizar las experiencias, se enfrentan al desafío de utilizar grandes cantidades de datos, muchos de los cuales son de carácter personal o sensible.

Según McKinsey, la IA Generativa podría aumentar los beneficios anuales a nivel mundial hasta en US $4.4 trillones, significando un incremento de 15-40%. Esto demuestra el enorme potencial, pero también la gran responsabilidad que tenemos al usar los datos

Imagen 9, potencial de la IA a nivel mundial, McKinsey

Contar con datos fiables y de alta calidad, es esencial para poder aprovechar modelos de IA Generativa de forma precisa, justa y efectiva. En última instancia, la inversión en la protección de los datos se traduce en un retorno tangible de la inversión:

Confianza: manifestado en una mayor adopción por parte de los clientes
Cumplimiento: menor fricción regulatoria
Innovación: de manera responsable y sostenible en la era de la IA.

Luis Gerardo Baeza
Customer Engineer, Google Cloud
CDMC Certified
Google Professional Cloud Security Engineer Certified
Protección de datos en Chile, por Ley de Datos.com

Esta opinión es a título personal y no representa ningún tipo de recomendación legal ni de cumplimiento.

Destacada

Anticipando el futuro de Generative AI

Por Luis Gerardo Baeza

¿Conoces la novela El fantasma de la ópera? Es una novela francesa que se ha adaptado a numerosas películas, obras de teatro, programas de TV y piezas musicales. De acuerdo con ChatGPT (explicado más adelante), podemos resumirla de la siguiente forma:

«Una cautivadora historia de amor, obsesión y tragedia ambientada en la Ópera de París. Mientras los rumores se propagan sobre un fantasma desfigurado que acecha el teatro, la misteriosa figura se enamora de Christine, una talentosa joven cantante, proporcionándole entrenamiento vocal para transformarla en una cantante excepcional. En medio de su compleja relación, Erik, el Fantasma recurre a la violencia, causando accidentes e incluso asesinatos. La historia alcanza su clímax cuando Christine debe elegir entre la peligrosa obsesión del Fantasma y su amor por Raoul, lo que lleva a un enfrentamiento dramático que determina el destino de todos los involucrados.»

Menciono esta novela (que me fascina), porque estamos en un momento donde la relación GenAI y humanos puede parecerse a la de Christine y Erik. Por un lado, el poder que tiene la inteligencia artificial generativa es indudable, citado por muchos como «la cosa más importante en la que la humanidad está trabajando» o «la tecnología que define nuestros tiempos». Por otro lado, están los cuestionamientos sobre el impacto que va a generar en la sociedad.

Photo 171270756 / Analytics © BiancoBlue | Dreamstime.com

Qué es GenAI y por qué tanto buzz al respecto

La inteligencia artificial generativa, (Generative AI o GenAI), es un enfoque de la inteligencia artificial puede generar contenido original y creativo como textos, imágenes, música u otros tipos de datos sintéticos asemejándose a los creados por seres humanos.

Los Modelos de Lenguaje de Aprendizaje Automático (LLMs) desempeñan un papel fundamental en GenAI, ya que están diseñados para aprender patrones y estructuras del lenguaje humano a partir de grandes cantidades de datos de texto. El entrenamiento de LLMs les permite capturar la gramática, la semántica y el estilo del lenguaje humano, lo que los convierte en herramientas poderosas para generar textos coherentes y relevantes.

ChatGPT es un ejemplo de un LLM utilizado en aplicaciones de chat y conversación, y ha generado gran interés por parte de usuarios finales que lo han utilizado para crear chistes, programadores que lo usan para crear o revisar código fuente o estudiantes para fines de aprendizaje. Además, las empresas empiezan a pensar cómo utilizar estas capacidades con fines de negocio.

Posibilidades y riesgos

Cuando fantaseamos con todo el trabajo que se puede ahorrar con AI, el incremento en la productividad, resolver los retos más complejos para la humanidad como curar enfermedades o detener el cambio climático; veo a la sociedad en el lugar de Christine después de conocer a Erik y aprovechar las técnicas para mejorar su forma de cantar. Los beneficios de estas nuevas habilidades de GenAI están ahí, tal como lo estuvieron luego de aquel encuentro de Christine en el techo de la Opera House de París.

El senador de USA Josh Hawley, incluso, ha preguntado si la AI será equivalente a la invención de la imprenta: que difundió el conocimiento, expandió aprendizaje, empoderando a personas comunes, y conduciendo a la humanidad a hacia la libertad. Sundar Pichai (CEO de Google Cloud) comenta su perspectiva optimista de cómo los super asistentes estarán presentes en todas las áreas laborales para hacer más fácil y productivas las actividades.

Sin embargo, está el otro lado de la moneda: así como Christine desconocía en un inicio el carácter violento y obsesivo de El fantasma, que lo habían llevado a actos de sabotaje en la producción causando accidentes y lastimando gente, ¿es posible que estemos perdiendo de vista o incluso que desconozcamos todo el daño potencial que la GenAI podría causar en la civilización? Múltiples líderes de opinión han comentado sobre estos riesgos. El mismo Sam Altman (CEO de Open AI, la empresa creadora de ChatGPT), ha mencionado la posibilidad de que múltiples trabajos sean incluso reemplazados por completo por AI, para favorecer la creación de otros mejores y que aprovechen más de capacidades humanas.

Instruí a ChatGPT para que creara un texto de 30 palabras que asociara el concepto de existencia con la inteligencia artificial utilizando como base autores conocidos y este fue el resultado:

«En el tejido de cables y algoritmos, la inteligencia artificial emerge como una manifestación de la existencia, desafiando nuestras nociones tradicionales de lo que significa ser y existir en el mundo.»

El texto anterior ejemplifica una de las preocupaciones más importantes relacionadas con la creatividad: si ChatGPT puede usar como base contenido creado por terceros y va a eliminar la necesidad de sus empleos ¿no deberían estos creadores ser remunerados por ello?

En una audiencia del congreso de Estados Unidos, un senador reprodujo un video muy convincente creado por GenAI usando palabras y con una voz que no era suya, resaltando que las opiniones artificiales eran compartidas por él, pero ¿qué hubiera pasado si las opiniones hubieran sido sobre la guerra y contrarias a su opinión? La desinformación que se puede crear, según Gary Marcus (científico y líder de opinión en AI), es a tal grado que nadie va a poder confiar en absolutamente nada. Otro riesgo consiste en actores malintencionados que pueden utilizar estas tecnologías para manipular a las personas en temas tan delicados como una elección, por ejemplo.

Así como el inesperado incidente donde El fantasma causa que el candelabro caiga al escenario para mostrar su poder ¿Podría la GenAI eventualmente destacar en alguna tarea para la cual no fue diseñada? Desarrolladores de Google comentaron en una entrevista que uno de sus modelos fue capaz de entender Bengali, un idioma en el que originalmente no fue entrenado. Debido a que en AI hay algo conocido como “cajas negras” que no se entiende por completo cómo funcionan, es muy difícil poder entender de dónde surgió esta habilidad de su modelo. Para prevenir este tipo de situaciones, Gary Marcus propone que los modelos deben contemplar una combinación de redes neuronales y sistemas simbólicos, estando sujetos a reglas que permitan controlar su funcionamiento.

El rol de los gobiernos

¿Quién determina qué puede o no responder un chatbot? ¿Qué temas pueden ser demasiado sensibles para dejar que un LLM responda cuando existen black boxes presentes en su funcionamiento? ¿La información con la que fue entrenado un LLM es transparente y está libre de sesgo?

Una petición conjunta del sector privado es el establecimiento de guardrails para el uso de la inteligencia artificial. La sugerencia del CEO de OpenAI es que sea la sociedad misma quien decida, a través de sus representantes electos, es decir, el gobierno.

En 2021, la Comisión Europea propuso el Artificial Intelligence Act como la introducción de un marco normativo y jurídico para la AI basado en evaluación del riesgo, incluyendo categorías desde mínimo con reglas de uso definidas, hasta inaceptable donde la AI no debería ser utilizada en absoluto. En Mayo de 2023, Sam Altman junto con otros actores relevantes como la VP de privacidad de IBM, se presentaron en una audiencia ante el congreso de Estados Unidos para presentar sus opiniones y discutir sobre los potenciales riesgos de AI. El congreso es muy enfático en no repetir errores del pasado, por ejemplo, con los medios sociales donde la regulación no se introdujo rápidamente y eso implicó múltiples tipos de problemas en temas de privacidad, discurso de odio, explotación, manipulación de la opinión pública, entre muchos otros.

Gary Marcus, además, propone que las regulaciones deben ser desarrolladas en un contexto global, ya que de lo contrario podría ser muy difícil para las empresas re-entrenar modelos para cada país, así como sumamente costoso para el medio ambiente por la cantidad de poder de cómputo que se requiere.

Anticipando el futuro

Se dice que la AI va a potenciar el conocimiento acercándolo a todas las personas, no obstante, Jeannette Von Wolfersdorff, en su libro Capitalismo, expone que la brecha entre las naciones y clases sociales podría incrementarse, ya que el acceso a esta tecnología puede no estar disponible para todos. Según el World Bank, hasta 2021, sólo el 65% de la población tenía acceso a internet, sin mencionar las estadísticas desglosadas por país, que sin duda son alarmantes. No tener acceso a internet se traduce a no tener acceso a LLMs, al cómputo en la nube que lo hace posible y por ende al poder que este representa.

Así como en El fantasma de la Ópera, Christine tiene en sus manos el destino de todos los involucrados con su decisión de amor, cada uno de nosotros tenemos la responsabilidad de familiarizarnos y generar una postura al respecto del Generative AI, la cual se asegura que cambiará por completo nuestras vidas. Asimismo, entender el impacto en nuestra carrera si somos profesionales, en nuestra industria si somos dueños de una empresa, y en nuestra sociedad; nos permitirá tomar un poco de control respecto a qué acciones personales y colectivas tomaremos.

Si quieres conocer un poco más sobre estos temas que recopilé, acá te dejo el material que usé como base:

US Senate AI hearing
Entrevista a Sam Altman, CEO de Open AI
The AI revolution – with Sundar Pichai – Interview on 60 minutes
The urgent risk of runaway AI – Gary Marcus TED Talk
The EU AI Act
Política Nacional de Inteligencia de Chile

Destacada

El lenguaje no sólo describe la realidad, es capaz de crearla

La adopción de los asistentes de voz es inminente

¿Alguna vez le has preguntado a tu teléfono inteligente cómo se llama la canción que está sonando? ¿O has preguntado a Alexa que guarde un recordatorio? ¿Le has pedido al control por voz de tu automóvil que llame al celular de papá? Si respondiste si a alguna de las preguntas anteriores, entonces perteneces al 52% de las personas que de acuerdo con Hubspot han utilizado un asistente por voz como Google Assistant, Alexa o Siri.

Fuente: The state of the voice: looking ahead to 2019

Algo que me resulta interesante remarcar de este estudio es que del 48% restante que no ha utilizado un asistente de voz, solo el 4% aceptó no estar familiarizado con el término.

En su libro Vivir es un asunto urgente, Mario Alonso Puig menciona que “El lenguaje no sólo describe la realidad, sino que además es capaz de crearla.” La razón por la cual decidí tomar esta frase como título del artículo, es porque me parece que estamos muy cerca de poder observar a esta frase convertirse en realidad en el sentido literal de la misma, y en parte se debe a los avances logrados recientemente con los asistentes de voz.

Los fabricantes de asistentes de voz han seguido una estrategia que ha probado ser la correcta a lo largo de la historia del hardware y software: construir plataformas y no productos, dejando así a los desarrolladores ser los responsables del crecimiento de la cantidad de comandos de voz.

Al día de hoy esta estrategia parece estar funcionando, ya que la cantidad de comandos de voz publicados crece cada vez más rápido, pareciera que se intenta habilitar la ejecución de cualquier acción a través de comandos de voz en Amazon Alexa, que cuenta con más de 80,000 comandos de voz en todo el mundo (1), o en Google Home que ya cuenta con 4,253 tan solo en Estados Unidos (2), o en Siri que a pesar de no contar con un número oficial de comandos publicados, diversos posts en internet mencionan que cuenta con más de 600 (3).

Desde ordenar una pizza, pedir un Uber, preguntar por el clima, hacer una lista de compras, ¿Para qué está usando más la gente a los asistentes virtuales? Es sorprendente que según el análisis de HubSpot el 15% lo utiliza para realizar compras.

Fuente: The state of the voice: looking ahead to 2019

Probablemente esta es una de las razones que explicaría el crecimiento tan acelerado de los comandos disponibles, ya que tanto los grandes retaileros como nuevos jugadores pequeños están buscando colarse en esta plataforma para ser de los primeros en ganar la mente de los usuarios con fines comerciales.

Un ejemplo de mi comentario anterior, es Wal-Mart, quien en abril 2019 anunció que los usuarios de Google Home podrán hacer su lista del súper en el gigante del retail solamente a través del comando “Google, talk to Wal-Mart”. Algunos expertos dicen que esto está alineado a la estrategia de reforzar el crecimiento de la producción y venta de comida por parte del gigante azul, que representa $200 mil millones de dólares al año para Wal-Mart (4).

Ejemplos reales en México

IBM, uno de los fabricantes de software de procesamiento de lenguaje natural más relevantes del mercado, promueve la atención a clientes como uno de los casos de uso más relevantes de asistentes virtuales. En 2018 fue muy sonado en México el caso de la implementación de un asistente de voz parte de BBVA en la atención telefónica de clientes, ocasionando la reducción y despido de hasta 1,500 personas de acuerdo con Forbes (5). A pesar de que no cuento con un análisis a profundidad que respalde este punto de vista (sería interesante realizarlo), BBVA observó una disminución considerable en el número de quejas por parte de los clientes. Según informa El Universal, en 2018 los bancos alcanzaron el máximo histórico en quejas, con un total de 9 millones 397 mil reclamos registrados en la Comisión Nacional para la Protección y Defensa de los Usuarios (CONDUSEF).

A pesar de que el incremento en número de quejas entre 2017 y 2018 fue de un 6.3%, BBVA mostró una disminución en de casi el 50%.

Fuente: El Universal

Si consideramos que el despido masivo de empleados por parte de BBVA fue anunciado a mitad de año, pareciera tener sentido que en parte la disminución en el número de quejas se debió a una mejor atención a través del asistente de voz habilitado para atención a los clientes.

Otro ejemplo de la aplicación de las tecnologías de asistentes de voz en México es RoomieBot, una startup reconocida por MIT, FORBES, Excelsior. Esta empresa creó un robot asistente para el hogar que puede asistirte en el control de tu casa, convirtiéndola en inteligente una vez que cuentas con los aditamentos necesarios (como un Samsung Smart Hub por ejemplo). Adicional al uso del robot como asistencia en el hogar, RoomieBot vende su producto a empresas para diferentes casos de uso, por ejemplo: self check-in en hoteles, promoción y venta de productos en sucursales, entre muchos otros.

Checa su página web, ya que también proveen capacitación en el uso de estas tecnologías: www.roomie-it.org

Las tecnologías detrás de los asistentes

Después de platicar acerca de la relevancia de los asistentes virtuales en la actualidad, quisiera comentar un poco acerca de algunas de las tecnologías que permiten su existencia y funcionamiento.

Para ello vamos a explorar 3 tecnologías que considero importantes: natural language processing (NLP), automatic speech recognition (ASR) y speech synteshis.

Natural language processing es un campo de estudio de Machine Learning y refiere la habilidad de un sistema para analizar, manipular, entender e incluso generar lenguaje humano. Este campo está dividido en dos grandes disciplinas: el entendimiento de lenguaje NLU (por sus siglas en inglés Natural Language Understanding) y la generación de lenguaje NLG por sus siglas en inglés Natural language generation)
Automatic speech recognition por su parte, hace referencia al reconocimiento las palabras presentes en la voz humana a través del procesamiento de señales acústicas.
Speech synthesis a su vez, es el proceso de generación de voz humana de manera sintética, a partir de un texto escrito.

La forma en la cual estas tecnologías interactúan entre ellas para dar vida a un asistente de voz, se muestra en el siguiente diagrama:

Fuente: Blog

Cuando le dices a tu teléfono inteligente “muéstrame las indicaciones para llegar a mi casa” ASR se encarga de transformar el sonido de tus palabras en texto, para que NLU pueda extraer conceptos importantes como la acción que deseas lograr (ver indicaciones en un mapa) el destino (tu casa), el teléfono entonces busca en sus direcciones almacenadas la ubicación de tu casa, las pone en la pantalla y entonces genera una respuesta a través de NLG.

Ahondando un poco más en NLP, quisiera mencionar algunas de las formas en las cuáles puede ser utilizado:

Traducción por máquina
Análisis de sentimiento
Auto-corrección

El estudio de NLP es bastante antiguo, algunas de las primeras patentes para máquinas de traducción fueron registradas a mediados de la década de los 30’s.

Un avance importante se presentó en 1970 con la introducción de las redes de transición aumentada (ATN por sus siglas en inglés Augmented Transition Network) las cuales evolucionaron el método de captura de datos del lenguaje, pasando del modelo de definición de reglas (Reglas de estructura de frases) a un conjunto de máquinas autómatas recursivos.

Reglas de estructura de frases VS Automáta recursivo

Otro avance importante ya en el campo de Deep learning, se realizó en 2018, donde el equipo de Google AI publicó un paper describiendo el modelo de representación BERT (por sus siglas en inglés Bidirectional Encoder Representations from Transformers). A diferencia de otros modelos de representación, BERT realiza el entrenamiento de las representaciones de manera bi-direccional, considerando el contexto izquierdo como derecho en todas las capas de la arquitectura de la red neuronal. Debido a esto, las representaciones BERT pueden ser ajustadas únicamente agregando una capa adicional de salida para crear modelos novedosos para un rango amplio conjunto de tareas, sin realizar modificaciones sustanciales a la arquitectura para cada una de esas tareas.

BERT logró resultados no vistos anteriormente en 11 tareas de procesamiento de lenguaje natural.

Fuente: Google AI – BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

En conclusión

¿Alguna vez has escuchado acerca de la prueba de Turing? Esta prueba establecida en los 50’s por Alan Turing, consiste en determinar si una máquina puede mostrar habilidades conversacionales tan similares a las humanas que sea imposible para un humano distinguir que se trata de una máquina.

Observa el siguiente video y deja tus comentarios acerca de ¿Qué tan cerca crees que estamos de llegar a ese punto?

Referencias

Luis Gerardo Baeza
Artificial Intelligence & Data Science Enthusiast
https://www.linkedin.com/in/lgbaeza/

Destacada

Inteligencia (artificial) en la experiencia del cliente

“El objetivo de una empresa debería ser un cliente que atraiga más clientes.” Shiv Singh

Las compañías han transformado la manera en la que interactúan con sus clientes. El enfoque de individualidad que prosperó durante la década anterior, en el cual cada departamento de una empresa contaba con sus propios procesos de servicio al cliente, nos ha enseñado que una comunicación deficiente genera en los clientes la sensación de interactuar con diferentes empresas, en lugar de varios componentes de una misma.

Hoy en día, enfocarse en la experiencia del cliente se ha convertido en el diferenciador clave que brinda ventaja competitiva y permite a una organización alcanzar el éxito. Mejorar la aceptación de un producto o disminuir los tiempos de espera no es suficiente, la relación de una empresa con sus clientes implica mucho más que eso. A través del mapa de experiencia, se busca aprender lo que experimentan los clientes desde el momento que consideran una compra hasta que la realizan y aún después de eso.

La premisa anterior, nos ayuda a entender que lo más importante es el acompañamiento del cliente a lo largo de cada interacción con un producto o servicio. Si consideramos algunos datos con respecto al tipo de servicio esperado por los clientes, encontraremos grandes retos, mismos que están poniendo en ridículo la estrategia de servicio al cliente de muchas empresas:

Los datos del gráfico siguiente corresponden a un estudio realizado por Zendesk en Mayo de 2015 en el cual se encuestaron ciudadanos americanos. El último dato corresponde a un estudio realizado en Abril de 2017 en México por la Asociación de Internet.

Para responder a las demandas de los clientes, diversas compañías han realizado esfuerzos para crear opciones de acompañamiento y autoservicio, sin embargo, no necesariamente han logrado el objetivo deseado. A continuación, se describen algunos escenarios como ejemplo.

Escenario 1: En el sitio web de esta aerolínea, se brinda al cliente la facilidad de chatear con alguien que le asista durante el proceso de reserva de su vuelo. La estrategia consiste en embeber Messenger, el chat de Facebook dentro de su portal web.

En este escenario, el cliente ha encontrado el vuelo buscado y desea completar el proceso de compra, sin embargo, su pago es rechazado. Después de comunicarse con su banco se da cuenta que no existe ningún bloqueo y al observar el botón de chat de Messenger decide preguntar por qué su pago está siendo rechazado en el portal web de la aerolínea.

Para sorpresa del cliente, nadie responde. El cliente entonces decide ir al sitio web de otra aerolínea, busca el vuelo deseado, coloca sus datos de pago y completa la compra sin ningún problema. Un poco más de un día después (30h), recibe una respuesta en Facebook Messenger por parte de la primera aerolínea preguntando si logró realizar la compra.

Escenario 2. Un programa de emprendedores ha decidido facilitar las preguntas frecuentes (FAQ) para los visitantes de su página de Facebook, esto a través de un esquema autoservicio utilizando el chat de Messenger. Al iniciar el chat, el visitante se encuentra con 3 opciones que lo guían para entender qué puede preguntar al bot.

El visitante pregunta acerca de cómo puede ingresar al programa, y se encuentra ante la situación de que el bot no responde su pregunta, de hecho, no responde ninguna de ellas, ya que únicamente es posible interactuar con él a través de los botones que éste le despliega.

Conclusión. Generar una falsa expectativa a un usuario puede resultar en perder su confianza y finalmente su lealtad a una compañía. En el primer escenario el usuario optó por acudir al portal de otra compañía, no debido al problema que se encontró al momento de realizar el pago, sino debido a que no contó con apoyo para resolverlo. En el segundo escenario, el visitante espera poder conversar con una persona (ya que ese es el objetivo de Facebook Messenger) y se encuentra simplemente ante un menú “interactivo”, rompiendo completamente la expectativa que tenía de poder recibir orientación acerca de sus preguntas.

El papel de la inteligencia artificial se vuelve sumamente importante cuando se habla de experiencia y satisfacción del cliente. Pensar en que una compañía cuente con suficientes personas listas para responder cualquier pregunta de sus clientes a través del teléfono, email, live chat o Facebook resulta complicado económica y administrativamente. Y es ahí donde diversas empresas están buscando y otras ya han adoptado una ventaja competitiva, utilizando inteligencia artificial (Ver El futuro del servicio a cliente).

Existen diferentes tecnologías que hacen posible el uso de inteligencia artificial en diversos procesos empresariales, incluso hay algunos videos que en 10 minutos prometen enseñar a los internautas los fundamentos para entrenar a un sistema de inteligencia artificial para atender a sus clientes https://www.youtube.com/watch?v=Z8KvfN0IpG8&.

En el siguiente recipe, encontrarán un tutorial paso a paso para entrenar un agente virtual que responda a las preguntas de sus clientes utilizando IBM Watson.

IBM Watson es una tecnología de inteligencia artificial reconocida, que ofrece a las empresas una forma de proveer servicios automatizados a cualquier hora en cualquier lugar. Consiste en una experiencia de autoservicio que provee respuestas en tiempo real. Las empresas pueden entrenar a Watson para cumplir con sus necesidades específicas, proveer contenido personalizado y alinearlo con la voz de su empresa.

Si estás interesado en integrar inteligencia artificial en algún proceso de tu empresa, contáctame a través de linkedin@lgbaeza/

Luis Gerardo Baeza Castro
Software Architect at IBM
Certified Watson App Development

Destacada

«Escribir es la manera más profunda de leer la vida»

«Escribir es la manera más profunda de leer la vida»
Francisco Umbral.

Hace tiempo que intento terminar este primer post. Corrijo, hace tiempo que intento iniciar este primer post. Llevo un rato intentando iniciar tantas cosas, que pienso que procrastinar debería estar escrito en mi CV como un soft skill. Tal vez lo anote mañana… En fin, hoy que si he conseguido dedicar un tiempo quisiera que fuera un excelente primer post, quisiera que muchas personas lo leyeran y se volviera viral, quisiera que me convirtiera en famoso para luego hacer videos y renunciar al sistema capitalista opresor en el que vivimos… espera; no, ese no es el sentido de la vida. Quise iniciar mi blog compartiendo el sentir de Francisco Umbral: «Escribir es la manera más profunda de leer la vida.» Quizás de eso se trate todo esto, de poder escudriñar mi vida, mi persona. Algunas veces nos llenamos de tantas actividades en el trabajo, con la familia, con los amigos, con la pareja (o con la que quisiéramos que fuera nuestra pareja) que olvidamos tener esos momentos en los que estás contigo y disfrutas de ti mismo, haciendo lo que a ti te gusta, en soledad. Sin duda Charlton Brooker logró capturar en Nosedive de Black Mirror de manera tan fidedigna la tendencia social de actuar por complacer al entorno que nos rodea y ganar así reconocimiento a costa de todo libre albedrío.

Gran parte del contenido que encontrarán aquí será de tecnología, emprendimiento e innovación, ya que una parte fundamental de mi persona consta de tales temas y es mi intención poder compartir las lecciones aprendidas esperando sea de utilidad para l@s lectores. Tal como expresó Elie Wiesel, Premio Nobel de la Paz y sobreviviente del Holocausto: «Decidimos contar la historia para que el mundo sea mejor, para que aprenda y recuerde.»

Agradezco a mis grandes amigos Danito (Escritor) y Omar (Full Stack Developer) así como a mi amada hermanita Bere por apoyarme con la revisión de este mi primer post, serán mis acompañantes a lo largo de todas mis publicaciones.

Blockchain for not Dummies

“Blockchain será a los negocios lo que internet fue a las comunicaciones” son las palabras de Ginni Rometty CEO de IBM al explicar cómo es que los participantes de una cadena de suministro, podrían confiar en esta tecnología, que proporciona un registro descentralizado y compartido por todos los participantes, en lugar de que cada uno de ellos tenga que utilizar registros propios, los cuales muchas veces se basan en papel y son susceptibles a errores y falsificaciones.

El término Blockchain se ha popularizado muy rápidamente, de acuerdo con Google, la cantidad de búsquedas realizadas durante 2017 se incrementó en un 250%, sin embargo, ¿Las empresas realmente conocen cómo funciona esta tecnología, y sus casos de uso más allá de Bitcoin? La siguiente imagen ejemplifica lo que está sucediendo en la oficina del CEO / CIO / CTO de muchas empresas hoy en día:

De acuerdo con un artículo de Forbes, el mercado de productos relacionados con Blockchain está valuado en $7,700 millones de USD para 2022, razón por la cual no resulta increíble que haya tantas empresas intentando integrar esta tecnología a su compañía.

En entrevista con Endeavor para la publicación Blockchain Insights, compartí mi punto de vista acerca de cómo este efecto se ve replicado con startups en México, las cuales están utilizando Blockchain como sinónimo de una base de datos segura, ya sea para levantar capital de inversionistas curiosos, o bien, por el desconocimiento mismo de la tecnología. Sin embargo, para que valga la pena que una empresa invierta en blockchain se necesitan tres cosas: una red de participantes, un activo que esté siendo transferido entre ellos y una serie de condiciones sobre las cuales se ejecutan esas transacciones. Si no tienes eso, lo que necesitas es una base de datos, no blockchain.

Otro de los fenómenos que reveló este análisis, es que la mayoría de las startups que están utilizando esta tecnología en México, la están orientando a criptomonedas (como lo es Bitcoin), sin embargo, Blockchain tiene muchas más aplicaciones empresariales.

¿Cómo funciona blockchain?

Blockchain provee una mejor forma de ejecutar transacciones, generando confianza. Cada segundo de cada día, las empresas intercambian valor, ya sea en bienes o servicios, con proveedores, clientes, socios, entre otros. El éxito de las empresas radica en que este intercambio sea rápido, preciso e irrefutable por los participantes.

Los conceptos fundamentales que debemos entender de blockchain son los siguientes:

Business network: red formada por todos los participantes que intercambian valor de inicio-a-fin: proveedores, clientes, asociados, étc
Transacciones: Intercambio de valor entre empresas. Cada intercambio corresponde a una transacción
Activo: Es el objeto que es transferido como parte de la transacción que genera valor a la empresa, puede ser tangible o intangible
Ledger: Consiste en el registro de todas las transacciones. En blockchain, el ledger es compartido, esto significa que cada empresa tiene una copia del MISMO ledger, en lugar de tener cada su propio ledger, lo que hace que sea imposible que alguien altere la información
Smart Contract: Son las reglas bajo las cuales se ejecutan las transacciones y que debe ser firmado por las partes que lo “celebran”
Consenso: Dado que cada empresa tiene su propia copia sincronizada del ledger, nadie puede alterar la información, ni si quiera el famoso “admin”, ya que todos los participantes del blockchain deben estar de acuerdo en que una transacción es válida para aceptarla y escribirla en el ledger

Funcionamiento técnico de Blockchain

Existen 2 grandes tipos de blockchain, el público que todos conocen dado que Bitcoin es la mayor implementación existente, y el «permisionado» o blockchain para empresas, donde los participantes son previamente aprobados y solo ellos pueden leer y/o escribir transacciones.

Hyperledger es la única plataforma existente bajo el enfoque permisionado, modular, open source (cualquiera lo puede utilizar y modificar), y con la capacidad de soportar grandes casos de uso empresariales. Hyperledger Fabric fue desarrollado inicialmente por IBM y luego liberado a Linux Foundation para ser open source. De acuerdo con un estudio del laboratorio de investigación de IBM en Zurich, Hyperledger tiene la capacidad de ejecutar 3,500 transacciones por segundo.

Hyperledger utiliza 3 principios tecnológicos básicos que es importante entender:

Criptografía
Chaincode
Firma digital

Criptografía

El término blockchain, hace alusión a la vinculación de todas las transacciones registradas en el ledger en forma de cadena. Cada transacción es encriptada a través de una función Hash.

Hash es una función matemática que transforma cualquier texto en una cadena de exactamente 255 caracteres. Ya sea el texto “hola luis” o el texto “Hola luis” (nótese la mayúscula en la letra H), la cadena será totalmente diferente, respetando uno de los principios básicos de seguridad informática que es la confidencialidad. Esto permite que, aunque todos los participantes de la business network tienen una copia del ledger, no pueden ver su contenido a menos que se cumplan ciertas condiciones (que explicaremos más adelante).

Una vez que se obtiene el hash de la información de la transacción 1 (T1), cuando llega una nueva transacción 2 (T2), esta es “hasheada” y posteriormente se obtiene un hash de los hashes de T1 y T2. Este proceso continúa hasta tener el primer bloque (llamado génesis o Bloque A en nuestro ejemplo), el cual a su vez será “hasheado” para ser incorporado como parte de la información del Bloque B. La siguiente imagen muestra esto de una manera simple:

Gracias a esta forma de almacenar la información, resulta imposible modificar una sola letra del contenido de cualquier transacción, ya que esto implicaría necesariamente que el hash del bloque correspondiente (y por ende todos los bloques sucesivos) fuera modificado.

Chaincode

Chaincode es un programa que actualmente puede ser escrito en lenguaje Go. Próximamente existirá la posibilidad de más lenguajes como node.js y java.

El chaincode es responsible del ledger del blockchain, mantiene interacción constante con el mismo y gestiona la lógica de negocio bajo la cual se ejecutan las transacciones enviadas por las aplicaciones. Es la implementación tecnológica del Smart contract.

El chaincode vive dentro de los peers, donde cada peer es un participante de la business network con su copia del ledger. En la siguiente imagen encontramos en color azul los peers (P), en amarillo el Smart contract o chaincode (S), y en rojo el ledger (L).

En Hyperledger todos los participantes de una red, deben tener el mismo chaincode para que puedan interactuar entre ellos y participar del consenso cuando una nueva transacción es enviada, esto garantiza que todos están siguiendo las mismas reglas.

Firma Digital

Todas las transacciones en hyperledger están firmadas para saber exactamente quién las realizó, la firma se realiza a través de un certificado. ¿Qué es un certificado? Simple, consiste de dos llaves, una pública y otra privada, que están ligadas matemáticamente entre sí. Cada llave consiste de una cadena de texto muy larga.

El principio es sencillo, yo comparto mi llave pública con todos los participantes de la red del blockchain, y cada vez que realizo una transacción, firmo con mi llave privada. Por firmar, se refiere a que se hacen cálculos matemáticos utilizando la llave privada para transformar el texto original, en un nuevo texto, el cual es almacenado.

Posteriormente, cuando alguien quiere validar que fui yo quien realizó dicha transacción, utiliza mi llave pública. Dado que las llaves pública y privada están ligadas matemáticamente, se puede corroborar que yo y solo yo pude firmar esa transacción, al mismo tiempo que se puede asegurar que el contenido de la transacción que está almacenado, es el que yo originalmente envié.

Además de los peers que mencioné cuando expliqué qué es el chaincode, dentro de la red de hyperledger debemos contar con un componente llamado certification authority, el cual se encarga de generar certificados para que los participantes puedan escribir y leer transacciones del ledger.

Acelerando el proceso de adopción

IBM Blockchain Platform permite a las empresas acelerar el journey de adopción de Blockchain. Esta solución de “Blockchain as a Service”, está lista para uso empresarial, ya que está construida sobre Hyperledger Fabric y contiene de manera integrada funciones que ayudan a gestionar el ciclo de vida de una red de blockchain multi-empresarial:

Desarrollo: de redes de negocio, aplicaciones y chaincode
Gobierno: Gestión e invitación de miembros simplificada, aplicación de modelos de gobierno y diseminación de certificados
Operación: Monitoreo de salud y actividad de la red, gestión de ciclo de vida de chaincode y de canales, así como soporte

IBM ha desarrollado más de 400 proyectos de blockchain a nivel mundial, y es reconocido actualmente como la empresa líder del mercado no solo por su plataforma, sino también por la consultoría de negocios.

Consigue un cupón para probar gratuitamente IBM Blockchain aquí.

Conclusiones

Recordemos que de acuerdo con el hype cycle de Gartner, todo avance en la tecnología dispara un interés atropellado por su utilización, seguido de un gran golpe de realidad, para finalmente llegar a un momento de estabilidad, cuando la tecnología y sus usuarios, han madurado suficientemente.

En la medida que más empresas conozcan cómo funciona esta tecnología, podremos ver más casos de uso reales, en lugar de proyectos forzados que intentan migrar de una base de datos tradicional a un blockchain. Mis conclusiones en pro de esto último serían las siguientes:

Ledger compartido no significa ledger único, cada participante debe contar con su copia a través de un peer (esto en la mayoría de los casos), y para ello es necesario encontrar el valor que justifique la inversión
Los blockchains públicos (como bitcoin) son lentos debido al anonimato, con cada nueva transacción, se tiene que recorrer todo el histórico para garantizar que dicha transacción es legítima. En casos empresariales esto no es factible por lo cual es mejor utilizar un blockchain permisionado como Hyperledger
De acuerdo con un reporte del World Economic Forum, para 2025 el 10% de las transacciones a nivel mundial serán almacenadas utilizando blockchain. Solo diez por ciento, no el cien por ciento, no es una base de datos.

Si quieres aprender más de blockchain, lee en mi siguiente post sobre un curso que te dará skills prácticos, así como un badge de IBM.

Si estás interesado en integrar blockchain en tu empresa, contáctame a través de linkedin@lgbaeza/

Luis Gerardo Baeza Castro
Software Architect at IBM
Certified Cloud Solutions Architect

Quien malgasta una hora, no ha descubierto el valor de la vida

«El mundo está cambiando muy rápido. Ya no será el grande quien golpee al pequeño, será el rápido quien golpeará al lento» – Rupert Murdoch

Esta frase describe de manera concreta el punto que quiero compartir en este post. El cómputo en la nube se volvió popular cuando empresas como Amazon Web Services y Google lanzaron sus servicios de nube pública bajo una simple promesa: cero administración de dispositivos físicos para los clientes. ¿Necesitas un servidor con 8 cores y 32 GB de RAM para correr tus procesos de cómputo? Olvídate de ordenar las partes, pagar por que alguien las ensamble, contratar una red decente que soporte conectar tu equipo al internet, electricidad, clima, controles de acceso físico, etc; únicamente da un par de clics y lo tienes en la nube. Hace 10 años esto era realmente una gran oferta para cualquier empresa; hace 10 años.

En estos días, vivimos en la era de la agilidad. Si no eres lo suficientemente rápido para concebir una idea y hacerla realidad no estás en posibilidades de competir con un mercado cada vez más demandante. Encuentra una oportunidad de negocio, gasta mucho tiempo planeando y desarrollando la idea, y para cuando la lleves al mercado, ya habrá cambiado el interés del mismo hacia algo diferente y más novedoso.

Hoy día, hay diferentes formas de aprovechar los servicios de nube (además del tradicional infraestructura como servicio o IaaS), y a continuación les comparto un ejemplo muy claro que encontré en internet donde explican, a través de una pizza estas diferentes formas:

La imagen anterior es muy clara, los servicios de nube que están más a la derecha (software como servicio, y plataforma como servicio) requieren menos administración por parte de la empresa cliente, ya que el proveedor toma esa responsabilidad. Pensando en una pizza, si tú la compraras en un esquema de IaaS, podrías aprovechar el que alguien te proporcione los ingredientes ya listos para preparar, pero aún tendrías que preocuparte por calentar el horno, contar con gas y electricidad y hornear los ingredientes, mientras que en un esquema PaaS, simplemente recibes la pizza preparada, consigues una bebida para acompañarla y preparas la mesa para disfrutar tu pizza.

Para hacer este post lo más práctico posible, aquí les comparto algunas alternativas de PaaS para servicios tradicionales de IaaS, las cuales pueden ahorrarles mucho tiempo «preparando la pizza de sus empresas».

Object Storage – Almacenamiento

El object storage es un servicio que almacena la información gestionándola como objetos individuales, en lugar de ofrecerte un disco de cierta cantidad de espacio. Algunas de las ventajas son las siguientes:

No requiere crecimiento, escala automáticamente
No requiere pago upfront: Cobro por GB utilizado
Usualmente cuenta con opciones de protección de datos automáticamente (replicación, encriptación)
Es posible integrarlo con Docker para crear volúmenes de manera transparente
Es posible integrarlo en diversas soluciones de backup

Cloud Runtimes – Cómputo

No requiere gestión de un sistema operativo: patches, backups, gestión de discos de almacenamiento, etc.
La configuración del runtime se realiza con base en buildpacks, sin instalaciones complicadas
Escalamiento con base en horarios, número de peticiones o uso de memoria
El código se puede administrar a través de un sistema de control de versiones

Con estas dos alternativas que les comparto, estoy seguro que pueden hacer más eficiente la gestión de sus aplicaciones, enfocándose en lo que es realmente importante: la funcionalidad de las mismas, y sus datos.

Solo como un último tip enfocado a startups y pymes que tienen grandes aplicaciones y que están tratando de crecer rápidamente: hay empresas muy grandes en el mercado con grandes equipos de IT capaces de administrar su infraestructura (servidores, almacenamiento y todo lo anteriormente mencionado). Difícilmente van a poder competir con estas empresas utilizando el mismo paradigma, pero si un desarrollador puede asistir a un hackathon y crear un MVP en unas cuantas horas utilizando cloud runtimes por ejemplo, imaginen la ventaja que podría dar a sus empresas adoptar este tipo de tecnologías.

En IBM Cloud podrán encontrar diferentes opciones de Cloud Runtimes como Cloud Foundry, o Kubernetes, así como diferentes opciones para Object Storage de acuerdo a sus necesidades.

Esta imagen que encontré en la comunidad de Bluehack México es con la que me gustaría cerrar el post.

Si estás interesado en modernizar el desarrollo de aplicaciones en tu empresa, contáctame a través de linkedin@lgbaeza/

Luis Gerardo Baeza Castro
Software Architect at IBM
Certified Cloud Solutions Architect

La Ley de Protección de Datos Personales en Chile (21.719)

La Ley de Protección de datos en simple

Cumplimiento regulatorio y gobierno de datos

Soluciones tecnológicas para abordar la ley

Innovación sin riesgos: El beneficio de la protección de datos

Comparte esto:

Comparte esto:

La adopción de los asistentes de voz es inminente

Ejemplos reales en México

Las tecnologías detrás de los asistentes

En conclusión

Referencias

Comparte esto:

Los datos del gráfico siguiente corresponden a un estudio realizado por Zendesk en Mayo de 2015 en el cual se encuestaron ciudadanos americanos. El último dato corresponde a un estudio realizado en Abril de 2017 en México por la Asociación de Internet.

Comparte esto:

Comparte esto:

Comparte esto:

Comparte esto: