TECNOLOGIA, TABLETS Y MOVILES: Las tecnologías con las que Google simulará ser tú escribiendo correos

miércoles, 4 de noviembre de 2015

Las tecnologías con las que Google simulará ser tú escribiendo correos

Gestionar el correo electrónico es una tarea a menudo pesada y farragosa: muchos de los mensajes que recibimos necesitan respuestas rápidas y urgentes, pero cuando su número es muy elevado ese proceso lleva tiempo. O lo llevaba, porque Google ha anunciado una nueva característica que hará que desde Google Inbox podamos generar respuestas automáticas predeterminadas a diversos mensajes.

La característica Smart Reply que se pone en marcha estos días y que se limitará por el momento al soporte del inglés es una demostración más de los avances que la empresa está haciendo en aprendizaje automático (o aprendizaje máquina) y que se combina con el uso del lenguaje natural que los servidores de Google pueden generar para simular algo sorprendente: que las respuestas automáticas parezcan realmente nuestras.

Las Redes Neuronales Profundas entran en acción

En el blog de Google Research encontrábamos ayer un detallado artículo en el que Greg Corrado, responsable de este desarrollo en particular, explicaba cómo se había logrado implementar esta característica en Google Inbox. La base de todo está en el aprendizaje automático y en concreto en los algoritmos de aprendizaje profundo.

Este tipo de sistemas han sido ya aprovechados en otros servicios de Google de forma extensiva. Ocurre por ejemplo en el ámbito de la búsqueda por voz de Google, que aprovecha las Redes Neuronales Profundas (DNNs) como la tecnología sobre la que se asientan estos modelos. Las mejoras sobre los Modelos de Mezclas Gaussianas (GMM) eran evidentes, y permitían mejorar la velocidad y precisión de reconocimiento de la voz de forma notable.

Otra de las aplicaciones de esas DNNs ha sido la realizada al obtener algo tan aparentemente aleatorio como las miniaturas de los vídeos de YouTube. Detrás de ese proceso hay estudios realmente detallados sobre cómo elegir la imagen que hará que los usuarios hagan finalmente clic en ese vídeo porque esa miniatura llama la atención.

Así funciona Smart Reply

La base de esta característica es el uso del llamado sequence-to-sequence learning, un sistema que permite la síntesis conversacional automática y que entre otras cosas sirvió para que en Google crearan un simpático experimento: un chatbot que debatía sobre el sentido de la vida con un humano, y lo hacía notablemente bien.

La aplicación de ese sistema de aprendizaje para la generación de respuestas a todo tipo de correos fue todo un reto, pero lograron resolver el problema con el uso de Redes Neuronales Recurrentes. Una de ellas "codifica" el correo entrante, y la otra genera posibles respuestas.

El codificador de correos trabaja estudiando las palabras de un correo y generando un vector que permite "comprender" a la máquina lo que se está diciendo y con qué tono. No solo eso: es capaz de identificar que dos frases formuladas de distinta forma significan lo mismo. Así, esta parte del sistema sabe que "¿Estás libre mañana?" y "¿Qué te parece si nos reunimos mañana?" tienen el mismo objetivo.

El segundo sistema, el "decodificador", toma ese vector y sintetiza una respuesta correcta palabra por palabra. Para evitar respuestas de decenas y cientos de palabras en Google utilizaron una variante de una red neuronal del tipo "Long Short-Term Memory" (LSTM) que permite que el sistema se centre en la parte del correo que es más útil para luego predecir la respuesta, restando importancia a frases menos relevantes antes y después.

La privacidad por bandera

En todo este sistema había un claro componente potencialmente polémico: la privacidad. El buen funcionamiento de este sistema de aprendizaje máquina o aprendizaje automático se basa precisamente en el entrenamiento con millones de correos electrónicos.

Sin embargo, esos correos nunca son leídos por un humano, y como afirmaba Corrado "eso significa que los investigadores tenían que hacer funcionar el aprendizaje en un conjunto de datos que no podían leer, lo que era algo así como tratar de resolver un puzzle con los ojos tapados".

Aún así el prototipo funcionó tras la corrección de varios simpáticos fallos iniciales. Por ejemplo, en las primeras etapas de desarrollo una respuesta sugerida constantemente por el sistema era "I love you" ("te quiero"). El sistema, explicaba Corrado, "hacía justo lo que se le había entrenado hacer, generar respuestas probables, y resulta que respuestas como "gracias", "me parece bien" o "te quiero" son súper comunes, así que el sistema se apoyaría en ellas como apuesta segura si no estaba seguro en otros casos".

Para resolverlo normalizaron la probabilidad de una respuesta candidata contrastándolas con respuestas pasadas, algo que hizo que el sistema fuera menos "amoroso", pero como dice Corrado, mucho más útil. Si queréis, podéis probar los resultados -en inglés- utilizando Inbox para Android e iOS. Veremos si vuestros conocidos detectan que esa respuesta es automática.

En Xataka | Las redes neuronales: qué son y por qué están volviendo