Alexa

Projetos Mais Influentes: #13

Share to0

ArticlePortuguese Articles1 October 2019

PM Network

How to cite this article:

Alexa: Projetos Mais Influentes: #13 (2019). PM Network, 33(0), 32–33.
Reprints and Permissions – opens in a new tab

Por tornar a interface de computador ativada por voz parte da vida cotidiana

img

FOTO DE CORTESIA DA AMAZON

Alexa, qual a previsão do tempo? Alexa, defina o temporizador para 3:30. Alexa, em que ano o Brasil sediou a Copa do Mundo? Alexa, toque “Purple Rain” do Prince.

Em residências em todo o mundo, o assistente ativado por voz Alexa se tornou onipresente, integrado a um milhão de momentos cotidianos. A Amazon vendeu mais de 100 milhões de dispositivos habilitados para Alexa, e desencadeou um frenesi de iniciativas para desenvolver habilidades para o assistente de voz executar. Atualmente, existem cerca de 70.000 habilidades disponíveis no dispositivo, cada uma delas deixa a tecnologia mais valiosa — e mais presente.

O sucesso e a influência desenfreada do Alexa começaram sob um manto de segredo. Em 2011, quando a Amazon comprou a startup de reconhecimento de voz Yap, o ex-vice-presidente de pesquisa Jeff Adams e sua equipe de engenheiros foram levados de avião para a sede da Amazon, sem detalhes por antecipação. Com uma única visita, a equipe foi informada sobre a ideia ultrassecreta do projeto da Amazon: criar um sistema de reconhecimento de voz que permitisse aos usuários interagir com um alto-falante inteligente em qualquer lugar da sala sem o uso de telas.

“Minha primeira resposta foi: ‘Sinto muito, isso não pode ser feito’”, disse Jeff. A Amazon não se deteve. “Eles sabiam que era um tacada de longa distância”, continuou Jeff. “Disseram-me para gastar o que fosse necessário para que isso acontecesse”.

Um projeto que os patrocinadores originalmente esperavam que fosse concluído em nove meses levou três anos e um orçamento estimado em mais de US$ 200 milhões apenas para a tecnologia de voz. O alto preço não dissuadiu o CEO da Amazon, Jeff Bezos. “Para crédito da Amazon, uma vez que provamos que isso poderia ser feito com muito trabalho, eles investiram os recursos”, disse Jeff. “Eles entenderam que era um problema que valia a pena resolver”. A jornada foi realmente memorável.

img

—Jeff Adams, ex-vice-presidente de pesquisa da startup de reconhecimento de voz Yap

O ruído e o sinal

Na Amazon, a iniciativa Alexa foi chamada de Projeto D. “Ninguém sabia o que estávamos fazendo”, disse Jeff. A empresa já havia aprovado três iniciativas ultrassecretas, com resultados que variavam do leitor eletrônico Kindle de sucesso ao fracasso fenomenal do smartphone Fire Phone. Um passo em falso público pode ter levado algumas empresas a repensar seus laboratórios de inovação, mas a Amazon absorveu o fracasso do telefone rapidamente, disse Ahmed Bouzid, ex-chefe de produto da equipe do projeto do Alexa.

“A cultura da Amazon considera falhas como oportunidades de aprendizado”, explicou Ahmed, hoje CEO da Witlingo, empresa de desenvolvimento de habilidades para o Alexa. “As pessoas dessa equipe sentiram que fizeram o que podiam e estavam prontas para enfrentar o próximo projeto”. Muitos dos membros da equipe foram transferidos para o Alexa.

Qualquer pessoa que tenha definido um temporizador ativado por voz enquanto mexe em uma panela borbulhando e ouve música pode se sentir pressionada a lembrar que, nos primeiros dias do reconhecimento da voz, a tecnologia só conseguia entender a linguagem humana a uma curta distância . “São criados tantos ecos que o microfone capta oito ou nove cópias de um som a intervalos diferentes”, disse Jeff. Ficava confuso e impossível de interpretar.

Para resolver esse desafio, Jeff reuniu uma equipe de 60 dos melhores cientistas e engenheiros de fala e linguagem. Por quase um ano, sua equipe aprimorou as tecnologias de aprendizado de máquina capazes de analisar a fala humana dos sons de fundo e do ambiente. Então, para treinar a tecnologia para realmente interpretar a linguagem, a equipe forneceu enormes quantidades de dados de voz. Eles alugaram espaços em todo o país e passaram um ano contratando trabalhadores temporários — com diferentes sotaques, padrões de fala e cadências vocais — para ler roteiros a várias distâncias do microfone. (Jeff deixou a Amazon pouco antes do lançamento da Alexa para fundar a empresa de tecnologia de voz Cobalt Speech and Language.)

No final do terceiro ano, a equipe do Alexa criou uma tecnologia de fala capaz de reconhecer e interpretar a fala a mais de 1,5 metro de distância. Ao mesmo tempo, as equipes paralelas estavam desenvolvendo o hardware do alto-falante Echo, criando a voz do Alexa e desenvolvendo aplicativos, como informar a hora e a previsão do tempo, ligar a música e definir lembretes e alarmes. O dispositivo Echo final inclui uma ferramenta de reconhecimento de voz que apenas escuta seu nome e, depois disso, aciona uma segunda ferramenta de reconhecimento de voz baseada em nuvem que interpreta o que o usuário diz, obtém a resposta e responde.

Permitir que terceiros criem aplicativos para a plataforma foi uma parte vital da estratégia da Amazon de aumentar o alcance do Alexa e aumentar o mercado geral de assistentes por voz, disse David Attwater, especialista em experiência do usuário no Enterprise Integration Group. Embora a maioria das pessoas ainda use o Alexa com apenas um punhado de aplicativos, há uma variedade enorme para escolher. “Do ponto de vista do projeto”, disse David, “a equipe considerou minuciosamente os aspectos do que o tornaria útil e forneceu uma solução bem pensada”.

Quando o projeto começou, a Amazon estimou que um Echo Dot — um módulo de alto-falante inteligente com tecnologia Alexa — seria vendido por US$ 50. No lançamento, os custos do projeto elevaram o preço ao consumidor para quase US$ 200. A Amazon lançou o produto como piloto apenas para convidados, em novembro de 2014. “Em junho, estava claro que o produto seria um sucesso”, disse Ahmed.

Desde então, o Alexa não apenas se popularizou, como também se integrou a tudo, de sistemas estéreo domésticos e tomadas elétricas até carros, aspiradores de pó, luminárias de mesa, espelhos de banheiro, televisões, detectores de fumaça e termostatos.

“Estamos apenas começando a ver como tecnologia focada em voz pode ajudar as pessoas em suas vidas diárias”, disse David Hakanson, vice-presidente, diretor de informações e diretor de inovação da Universidade de Saint Louis, que organiza uma competição para que os alunos desenvolvam as habilidades do Alexa em St. Louis, Missouri, EUA. Ahmed disse: “Não criamos apenas uma plataforma. Ajudamos a criar uma nova indústria focada na voz”.

Like what you just read?

Log in or register for a free PMI account to get access 
to even more articles like this one.

Offer from our training partner

Advertisement

Offer from our training partner

Advertisement

Related Content

Offer from our training partner

Advertisement