Alexa

Proyectos Más Influyentes: #13

Share to0

ArticleSpanish Articles1 October 2019

PM Network

How to cite this article:

Alexa: Proyectos Más Influyentes: #13 (2019). PM Network, 33(0), 32–33.
Reprints and Permissions – opens in a new tab

Por convertir la interfaz computacional activada por voz en parte de la vida diaria

img

FOTOGRAFÍA CORTESÍA DE AMAZON

Alexa, ¿cómo estará el tiempo? Alexa, fija un temporizador para las 3:30. Alexa, ¿en qué año Brasil fue el anfitrión de la Copa Mundial? Alexa, reproduce “Purple Rain” de Prince.

El asistente activado por voz, Alexa, se ha extendido a hogares de todo el mundo e incorporado a millones de momentos cotidianos. Amazon ha vendido más de 100 millones de dispositivos habilitados con Alexa, y despertó una avalancha de esfuerzos por desarrollar habilidades para el asistente de voz. Hoy existen aproximadamente 70.000 habilidades disponibles a través del dispositivo, y cada una de ellas otorga mayor valor a la tecnología y la incorpora al mercado masivo.

El tremendo éxito e influencia de Alexa comenzó como un secreto. En 2011, cuando Amazon adquirió la startup de reconocimiento de voz Yap, el ex Vicepresidente de Investigación, Jeff Adams, y su equipo de ingenieros fueron trasladados a las oficinas centrales de Amazon sin recibir mayor información. Solo una vez que llegaron a las instalaciones se informó al equipo la idea confidencial de Amazon: crear un sistema de reconocimiento de voz que permitiera que los usuarios interactuaran con un altavoz inteligente desde cualquier parte de una habitación y sin usar la pantalla.

“Mi primera respuesta fue ‘Lo siento, no se puede hacer’”, afirma Adams. Esto no desanimó a Amazon. “Sabían que sería un arduo trabajo”, continúa Adams. “Me dijeron que gastara todo lo que fuera necesario para lograrlo”.

El proyecto, cuyos patrocinadores esperaban en un principio que finalizara en nueve meses, en definitiva tardó tres años en ver la luz y se calcula que el presupuesto superó los USD 200 millones solo para la tecnología de voz. El alto precio no disuadió al CEO de Amazon, Jeff Bezos. “En favor de Amazon, una vez que comprobamos que era factible con un gran esfuerzo, ellos entregaron los recursos”, comenta Adams. “Sabían que era un problema que valía la pena resolver”. El viaje resultó memorable.

img

Jeff Adams, ex Vicepresidente de Investigación en la startup de reconocimiento de voz Yap

El sonido y la señal

En Amazon, el proyecto Alexa se denominaba Proyecto D.

“Nadie sabía qué estábamos tramando”, señala Adams. La empresa había dado luz verde a tres iniciativas confidenciales anteriormente, cuyos resultados variaban entre el éxito del lector electrónico Kindle hasta el espectacular fracaso del teléfono inteligente Fire Phone. Un tropiezo público podría indicar a algunas empresas que deben reformular el trabajo de sus laboratorios de innovación, pero Amazon se tomó con calma el fracaso del teléfono, asegura Ahmed Bouzid, ex Jefe de Productos en el equipo del proyecto de Alexa.

“La cultura en Amazon era que los fracasos son oportunidades de aprendizaje”, explica Bouzid, ahora CEO de Witlingo, la empresa de desarrollo de habilidades para Alexa. “Las personas de ese equipo sintieron que habían hecho lo posible, y estaban listos para emprender el siguiente proyecto”. Muchos de los miembros de ese equipo fueron asignados a Alexa.

A cualquier persona que haya fijado un temporizador activado por voz mientras revuelve una olla hirviendo y escucha música le sería difícil recordar que, en los inicios del reconocimiento del habla, la tecnología no podía interpretar el lenguaje humano, excepto a corta distancia. “Se crean tantos ecos que el micrófono obtiene ocho o nueve copias de un sonido con distintos retardos”, explica Adams. Se volvía confuso e imposible de interpretar.

Para solucionar ese desafío, Adams armó un equipo con 60 de los mejores científicos e ingenieros del habla y el lenguaje. Durante casi un año el equipo afinó las tecnologías de aprendizaje automático capaces de separar el habla humana del ruido de fondo y los ecos ambientales. Luego, para entrenar la tecnología de manera que realmente interpretara ese lenguaje, el equipo incorporó cantidades inmensas de datos de voz. Arrendaron espacios en todo el país y pasaron un año contratando empleados temporales con distintos acentos, patrones de habla y cadencias vocales para que leyeran guiones a distintas distancias del micrófono. (Adams dejó Amazon justo antes de que se lanzara Alexa para fundar la empresa de tecnología de voz Cobalt Speech and Language).

Al finalizar el tercer año, el equipo de Alexa había creado tecnología capaz de reconocer e interpretar el habla a más de 1,5 metros (5 pies) de distancia. Simultáneamente, equipos paralelos desarrollaban el hardware para el altavoz Echo, creaban la voz de Alexa y desarrollaban aplicaciones, como informes del clima y la hora, activar la música y fijar recordatorios y alarmas. El dispositivo final de Echo incluye una herramienta de reconocimiento del habla que solo escucha su nombre y, una vez que lo hace, activa una segunda herramienta de reconocimiento del habla basada en la nube que interpreta lo que dice el usuario, busca la respuesta y responde.

Permitir que terceros crearan aplicaciones para la plataforma fue una parte esencial de la estrategia de Amazon para ampliar el alcance de Alexa e impulsar el mercado general de los asistentes de voz, asegura David Attwater, experto en experiencia del usuario de Enterprise Integration Group. Aunque la mayoría de las personas aún utiliza Alexa para unas cuantas aplicaciones, tienen un enorme rango para elegir. “Desde una perspectiva de proyecto”, señala Attwater, “el equipo consideró meticulosamente los aspectos que lo harían útil y entregó una solución completa y bien pensada”.

Cuando comenzó el proyecto, Amazon calculó que Echo Dot, un módulo de altavoz inteligente con la tecnología de Alexa, se vendería en las tiendas minoristas a USD 50. Al momento del lanzamiento, debido a los costos del proyecto, el precio para el consumidor aumentó a cerca de USD 200. Amazon implementó el producto como un plan piloto solo con invitación en noviembre de 2014. “Ya en junio teníamos claro que el producto sería un éxito”, recuerda Bouzid.

Desde entonces, Alexa no solo se ha masificado, sino que se ha integrado a todo tipo de cosas, desde sistemas de música para el hogar y salidas eléctricas hasta automóviles, aspiradoras, lámparas, espejos de baño, televisores, detectores de humo y termostatos.

“Estamos recién comenzando a apreciar cómo la tecnología Voice-first (voz primero) puede ayudar a las personas en su vida diaria”, indica David Hakanson, Vicepresidente, Director Ejecutivo de Información y Director Ejecutivo de Innovación de la Universidad de Saint Louis, donde se lleva a cabo una competencia entre los estudiantes para desarrollar habilidades de Alexa en St. Louis, Missouri, EUA. Bouzid comenta: “No solo creamos una plataforma. Ayudamos a crear el nuevo sector de Voice-first”.

Like what you just read?

Log in or register for a free PMI account to get access 
to even more articles like this one.

Offer from our training partner

Advertisement

Offer from our training partner

Advertisement

Related Content

Offer from our training partner

Advertisement