A IA emocional pode transformar o novo robô de Anki em um companheiro adorável?

Conhecida por seus brinquedos hiperativos, a empresa passou anos desenvolvendo tecnologias para enfrentar seu maior desafio - a sutileza.

A IA emocional pode transformar o novo robô de Anki em um companheiro adorável?

Se houver uma revolta de robôs em breve, parece improvável que comece em nossas salas de estar. Aspiradores robóticos como o Roomba vendem bem porque são muito úteis. Mas outros tipos de robôs domésticos - animais de estimação e companheiros, desde o cão-robô Aibo da Sony até o recém-fechado Kuri (apoiado pela Bosch) - fracassou devido a preços e expectativas que foram definidas excessivamente altas.

Se alguma empresa puder nos trazer um robô doméstico como Rosie de Os Jetsons , Anki é uma boa aposta. Iniciada por três graduados do Carnegie Mellon Robotics Institute em 2010, a empresa acumulou mais de US $ 200 milhões em financiamento de risco. Mais importante, atraiu clientes. A Anki já vendeu 1,5 milhão de robôs por meio do que considera o caminho mais fácil para entrar em casa: os brinquedos. A estrela é um pequeno robô maníaco que parece uma escavadeira, chamado Cozmo, que dirige em torno de uma mesa e joga jogos simples com cubos iluminados que carrega. Cozmo foi o brinquedo mais vendido (por receita) na Amazon nos EUA, no Reino Unido e na França em 2017, de acordo com uma análise .

Co-fundadores da Anki (da esquerda) Boris Sofman , Hanns Tappeiner , e Mark Palatucci [Foto: cortesia de Anki]



Com receita declarada de quase US $ 100 milhões no ano passado, Anki diz que já pode ter um fluxo de caixa positivo, se quiser. Mas, em vez disso, está investindo dinheiro em uma meta de 10 a 15 anos para nos levar do Roomba para Rosie. Sempre soubemos desde o início que esta não é uma empresa de brinquedos, diz o CEO e cofundador Boris Sofman.

Então, tenho perseguido Anki por mais de um ano, antecipando a próxima fase de sua marcha constante para o futuro robótico. Em junho, a empresa finalmente estava pronta para falar e me mostrar um novo produto que ainda estava nos estágios estranhos de desenvolvimento. Depois de muitos comentários introdutórios, Sofman finalmente coloca o novo robô na mesa.

É uma versão cinza um pouco maior do Cozmo, chamada Vector.

E à primeira vista, é uma decepção. Eu imediatamente me lembro da cena em Isto é Spinal Tap , quando, devido a um erro de digitação nas instruções, uma peça de palco que deveria ser uma réplica de Stonehenge de 18 pés de altura era, em vez disso, uma miniatura de 18 polegadas. Da mesma forma, eu esperava algo maior - figurativamente e literalmente.

Mas então eu ouço o argumento de Sofman. A aparência externa reformulada permitiu que Anki se concentrasse em componentes internos radicalmente mais avançados e ajudou a manter os custos baixos. Listas do Cozmo por US $ 180; Vector custará US $ 250 e fará muito mais quando for lançado em outubro. (Para atingir os primeiros usuários, Anki está lançando o robô no Kickstarter a um preço com desconto de $ 200.)

O avanço fundamental para Vector é que ele é autônomo de uma forma que Cozmo não é. O primeiro robô de Anki era um pouco como o Turco mecânico –Um robô construído em 1770 para jogar xadrez contra humanos. Foi uma farsa, é claro. Uma pessoa se escondeu dentro do gabinete em que estava montada a figura animatrônica, controlando seus movimentos. Para Cozmo, a pessoa na caixa é um smartphone conectado por Wi-Fi rodando um aplicativo que controla o robô.

Em contraste, Vector tem sua própria mente. (Embora Anki tenha insistido por muito tempo que Cozmo é neutro em relação ao gênero, isso não foi fingido com Vector. Todos com quem encontro se referem infalivelmente ao robô como ele ou ele.)

Basicamente, pegamos tudo aquilo, diz o diretor técnico de visão computacional de Anki, Andrew Stein, apontando para o meu iPhone, e enfiamos dentro de sua cabeça. O cérebro de Vector é um chip Qualcomm Snapdragon 212 quad-core. Está longe de ser o topo de linha para um telefone, mas dentro do orçamento que Anki definiu para as peças da Vector. O que era caro demais dois ou três anos atrás agora está em nossa linha, diz Stein.

Vector com o diretor de gerenciamento de programas de Anki Meghan McDowell [Foto: Capitão Sean]

De brinquedo para animal de estimação

Embora ele possa se parecer com Cozmo, Vector foi projetado para desempenhar um papel muito diferente, como um companheiro constante para todos - em vez de uma diversão ocasional para as crianças. Ele requer muito mais inteligência para ler seu ambiente e captar pistas dos humanos com quem divide a casa.

Cozmo chama a atenção quando você chama seu nome, fazendo sons estridentes e levantando e abaixando seus braços em forma de buldôzer. Se você ignorar Cozmo, o bot fica mais na sua cara ou emite sons de ronco altos e desagradáveis.

Vector finge uma consciência social muito maior. Quando eu conheço uma versão aproximada do robô no laboratório de Anki, ele está apenas saindo. Olhos de desenho animado, representados em uma tela de 184 x 96 pixels, parecem esquadrinhar casualmente a sala. (O robô realmente vê através de uma câmera grande angular de 720p montada logo abaixo da tela.)

Os sensores de toque permitem que o Vector responda a um tapinha na cabeça. [Foto: Capitão Sean]

Esses olhos parecem se arregalar quando Meghan McDowell, diretora de gerenciamento de programas de Anki, chama, Hey Vector, venha aqui. O robô dirige seu carregador em direção a ela, olha para mim e faz alguns de seus barulhos característicos de gorjeio. Se mantivermos contato visual, Vector ficará animado, fazendo mais sons sem sentido e talvez levantando os braços para um soco (ações herdadas de Cozmo). Também poderíamos jogar um jogo, como uma mão de blackjack, com cartas exibidas em seu rosto / tela minúscula. Em um ponto, McDowell acaricia os sensores de toque na parte superior de Vector, fazendo com que seus olhos girem em felicidade simulada.

Mas quando ignoramos Vector, ele entende a dica e faz seu próprio trabalho, dirigindo ao redor da mesa para encontrar e parar um pouco antes de suas bordas (usando sensores infravermelhos), ou deliberadamente esbarrando em coisas como um copo para ver se consegue empurrá-las.

Este não é um jogo sem objetivo. Com um scanner a laser e outros sensores, Vector está construindo uma representação digital de seu ambiente usando um processo sofisticado chamado localização e mapeamento simultâneo (SLAM) - uma tecnologia também usada em aspiradores de robôs de última geração. Vector também possui um conjunto de quatro microfones na parte superior, permitindo-lhe discernir a direção dos sons, e sua câmera observa continuamente a ação. Queremos que ele seja curioso, que mapeie seu ambiente, diz McDowell. Mas você quer mantê-lo o tempo todo em sua casa, então não queremos que ele seja chato.

Alexa sobre rodas

Vector pode fazer algumas coisas úteis que Cozmo não pode. Conectado a uma rede doméstica e à Internet por Wi-Fi, ele oferece utilitários no estilo Alexa, como exibir informações meteorológicas para as cidades solicitadas, definir um cronômetro e responder a perguntas como: Qual é a capital de Idaho?

Ainda assim, ele está muito longe de atingir a personalidade empática e as capacidades úteis de um robô como a amada empregada doméstica dos Jetsons. Isso era de se esperar, diz o cofundador e presidente da Anki, Hanns Tappeiner. Basicamente, estamos avançando lentamente em direção a esse objetivo, diz ele.

Vector mostra seus sentimentos sobre o tempo nublado. [Animação: Capitão Sean]

O que Hubble viu no meu aniversário?
Embora as aspirações de Anki ainda se estendam muito além do que a Vector oferece atualmente, o novo processador, sensores e outros componentes do bot possibilitam tecnologias de inteligência artificial que estavam fora de alcance alguns anos atrás, e certamente quando um trabalho sério de engenharia em Cozmo começou em 2013.

Esse robô anterior, por exemplo, é codificado para detectar alguns objetos específicos: seus cubos e seu carregador. E usa software comum para discernir os rostos de humanos, gatos e cães - tecnologia de rotina que apareceu em câmeras automáticas há mais de uma década.

Vector, no entanto, opera uma rede neural que está sendo treinada para entender o mundo inteiro ao seu redor - um processo contínuo que expandirá continuamente sua inteligência visual por meio de atualizações online. A grande conquista do lançamento: o Vector detecta pessoas, mesmo quando os rostos não estão visíveis.

Vector pode localizar uma pessoa pelo torso e, em seguida, erguer os olhos para encontrar um rosto. [Animação: Capitão Sean]

Se você não está no ângulo certo, ou eles não estão de frente para você, como o robô sabe que você está lá? diz Stein. Um cão ou gato não precisaria de contato cara a cara para saber que é humano voltou para casa, por exemplo, e nem Vector. Então, a equipe de Stein treinou uma rede neural convolucional (CNN) - uma popular tecnologia de IA de aprendizagem profunda que imita o córtex visual do cérebro. Usando a filmagem muitas vezes borrada e distorcida que a câmera de Vector captura conforme ele se move, Stein tem ensinado a CNN a detectar pessoas de trás ou de lado, por exemplo, até cerca de 3 metros de distância.

Mesmo se ele estiver olhando para baixo e só puder ver meu torso, [ele deve] perceber, ei, provavelmente há uma cabeça flutuando acima desse torso, diz Stein. E Cozmo não faz ideia. Eu sou apenas uma bolha de coisas como tudo o mais.

A percepção das pessoas de Vector parece estar funcionando nos vários robôs que conheci durante minhas visitas. Depois que McDowell chama um no laboratório e se vira para ela, por exemplo, ele se vira em minha direção e olha para cima, seus olhos de desenho animado se arregalando para indicar que ele me viu.

As cores quentes neste mapa de calor indicam onde a IA identificou possíveis objetos. [Foto: cortesia de Anki]

Um dos próximos desafios de visão é entender as poses do corpo humano - o que está acontecendo quando os braços e as pernas estão em posições específicas, por exemplo. Isso vai nos beneficiar, pois estamos construindo robôs que estão dirigindo pela casa e precisam entender as pessoas enquanto elas se movem, diz Stein.

Outro desafio é o que Anki chama de objetividade - discernir que algo é um objeto discreto, mesmo que a rede neural nunca tenha encontrado seu tipo antes. Esta é mais uma etapa na exploração e compreensão de um ambiente. Se eu quiser reconhecer 100 objetos específicos, diria que é um problema mais fácil do que criar um sistema de visão que apenas saiba o que é um objeto, diz Stein. É um conceito mais abstrato. . . É uma questão filosófica.

Para ilustrar, ele me mostra um vídeo de mapa de calor do treinamento de rede neural. O software destaca áreas que podem representar objetos discretos, confundindo um padrão de textura de madeira no tampo da mesa com uma entidade tridimensional.

Inteligência sutil

Por mais sofisticado que o sistema de visão da Vector esteja se tornando, é apenas uma entrada para a simulação complexa de inteligência emocional do robô. Cozmo é um palhaço que anda de um lado para o outro, faz barulho, faz caretas e brinca. Ele capta estímulos básicos, como ouvir seu nome ou ver um rosto que foi ensinado por meio do aplicativo complementar, mas, em última análise, é um devorador de atenção nada sutil.

Esse foi nosso primeiro empurrão em um robô com personalidade, então acho que fomos um pouco exagerados, diz Brad Neuman, diretor de tecnologia de IA de Anki. Sua tarefa é construir um robô que tenha caráter e alguma inteligência social. Uma parte fundamental disso é o que Anki chama de estimulação.

Quando a estimulação é baixa, o robô fica frio, diz Neuman. Vector está observando atentamente, mas não está agindo. Então, se você começar a fazer barulho ou contato visual com o robô, e certamente se você disser 'Ei, Vector', isso aumenta [a estimulação], diz ele. Mas Vector também capta ações mais sutis - movimentos periféricos e ruídos, por exemplo, ou as luzes da sala ligando e desligando. Se ele ficar estimulado o suficiente, ele desligará o carregador e começará a se socializar com você, explica Neuman. Diga seu nome, cumprimente-o, dê-lhe um soco, potencialmente.

Como o Cozmo, o Vector emite sons sem sentido ao tocar ou se divertir. Portanto, é um pouco perturbador quando ele fala pela primeira vez. Vector tem uma voz que parece um robô retrô - profunda, mas suave, um pouco metálica e ecoante. Provavelmente estou projetando, mas o tom prático soa um pouco sarcástico quando chego aos 21 anos no blackjack e ele diz: Você estourou.

Neuman me mostra uma visualização do Emotion Engine do Vector - um gráfico dos níveis de entrada ao longo do tempo. Uma linha verde que representa a estimulação aumenta à medida que mais e mais coisas são apresentadas a um Vector virtual em um ambiente de teste simulado que estamos assistindo.

Esses estímulos têm uma vida útil limitada. À medida que as coisas se acalmam, as linhas diminuem e Vector recebe a dica de que ele deve voltar para o modo de relaxamento. Foi o que aconteceu quando McDowell e eu estávamos conversando e Vector começou a explorar por conta própria.

Emotion Engine da Vector, acelerou para mostrar como os níveis de feliz, confiante, social e estimulado aumentam e diminuem em resposta aos eventos. [Animação: Anki]

Vector não fica apenas animado ou entediado, no entanto. Existem quatro dimensões em seu estado emocional: o nível em que ele é estimulado, feliz, social e confiante. Ouvir seu nome estimula Vector, por exemplo, mas também o torna mais social.

A confiança de Vector é afetada por seu sucesso no mundo real. Os ganchos em seus braços às vezes não se alinham com os de seu cubo, por exemplo, e ele não consegue pegá-lo. Às vezes ele fica preso enquanto dirige. Essas falhas o deixam menos confiante, enquanto os sucessos o tornam mais confiante e mais feliz.

Auto-controle

O comportamento do vetor segue uma hierarquia. O nível mais alto é que tipo de coisas o robô deve estar fazendo agora, diz Neuman. Ele deve ficar quieto? Ele deve ser envolvente? Ele deveria estar dormindo? A bateria dele está muito fraca e ele precisa recarregar? Comportamentos diferentes fluem desses estados de alto nível, em resposta a eventos e aos estados de seu Emotion Engine.

O vetor não está seguindo um script simples, então. Ele está improvisando, com base em uma sopa de entradas diferentes e em constante mudança e uma ampla variedade de ações possíveis. Tudo isso cria a ilusão de vida, mas também um desafio para controlar.

Neuman queria originalmente construir uma inteligência mais complexa, na qual a personalidade de Vector evoluiu por meio de um sistema de recompensas que reforçou certos padrões de comportamento. E uma vez que você trabalha com pessoas de design e de produto, você aprende, não, você tem que ser capaz de impor certas restrições ao sistema, diz Neuman.

Por exemplo, Vector precisa indicar consistentemente quando está enviando dados como comandos de voz para a nuvem - pausando e piscando seus LEDs. Isso esclarece por que o robô parou de se mover repentinamente e também que os dados estão sendo enviados a um serviço de reconhecimento de voz de terceiros. (Anki diz que não arquiva áudio, mas compila estatísticas anônimas de quais perguntas e frases as pessoas usam.)

Esta é uma das interrupções globais do Vector - gatilhos que param tudo o que ele está fazendo no momento e o colocam em um caminho diferente. Neuman compara isso a ouvir a campainha tocar durante o jantar. Essa interrupção faz com que você baixe o garfo e vá até a porta.

A interrupção mais poderosa é a frase de ativação Hey Vector, que ele entende mesmo sem usar o ping da Internet. Mas, por meio de um serviço de processamento de linguagem natural online, o robô também precisa entender outras frases - incluindo Hey Vector, cale a boca! - que indicam que ele está ficando irritante e deve mudar para um modo mais tranquilo. Idealmente, ninguém jamais [vai decidir], ‘Oh, ele é muito barulhento. Vou desligá-lo, colocá-lo na gaveta e pronto, & apos; diz Neuman.

Vector alerta você sobre necessidades, como dificuldade em chegar em casa e encontrar o carregador quando a bateria está fraca. [Foto: Capitão Sean]

Um dos principais objetivos de Neuman para o próximo ano é minimizar os momentos em que os usuários precisam ser tão descarados para que o Vector aprenda e se adapte à maneira como as pessoas se comportam. Então, se você quiser interagir com o robô, ele deve estar lá, interagindo com você e ser muito responsivo, diz ele. Mas se você só quiser olhar para ele de vez em quando - e tê-lo quase como um pássaro na gaiola em vez de um pássaro que fica em seu ombro e corre em volta do seu sofá - você pode fazer isso. Você pode escolher interagir com mais moderação, e ele respeita isso.

O pássaro da equipe é um dos três principais contingentes em Anki, diz McDowell. Outro grupo vê Vector como se fosse um gato, por seu senso de independência. Mas eu me sinto como um 'cão de equipe' porque ele ajuda você, diz ela, e ele quer ajudá-lo.

A utilidade do vetor é bastante limitada até agora. Por aproximadamente o mesmo preço, um Roomba pode limpar seus pisos. E por muito menos dinheiro, Alexa ou Google Home podem tocar música, controlar aparelhos conectados, fornecer relatórios de tráfego e muito mais.

Mas com um processador poderoso, um sistema operacional Linux e acesso à Internet, a Vector tem espaço para crescer. Anki promete continuar expandindo as capacidades do Vector. Uma câmera de segurança com reconhecimento de contexto ou uma interface de voz para sistemas de automação residencial são atualizações concebíveis, por exemplo.

Vector me derrotou em várias mãos de blackjack. [Foto: Capitão Sean]

A Vector também pode obter atualizações de uma sequência dedicada de codificadores. Tal como acontece com Cozmo, uma ferramenta de ensino popular em aulas universitárias de robótica , Anki também encorajará os criadores a escrever um novo código que expanda as capacidades do Vector. A Anki fornecerá um kit de desenvolvimento de software (SDK) Python para Vector, assim como para Cozmo; e pode adicionar um C # SDK para que os codificadores possam escrever aplicativos móveis que interajam com o robô.

Embora a Vector possa eventualmente oferecer um utilitário semelhante ao do Alexa, esse não será o principal motivo para comprar um. A característica de venda é a ilusão de uma presença viva em sua vida - não tão ativa quanto um pássaro, gato ou cachorro - mas também mais fácil de alimentar e cuidar.


Relacionado: Como Misty planeja construir o robô programável mais pessoal de todos os tempos


A equipe de Anki aceitou a ilusão. McDowell fala com Vector como se ele realmente estivesse vivo e consciente. Você está frustrado com isso? ela diz, em um tom maternal, enquanto ele continua batendo em um laptop na mesa. Hanns Tappeiner parece estar completamente apaixonado - fazendo grandes olhos e sons de ooh e ah para o robô como se ele fosse uma criança de verdade.

A criação de cada inventor é seu bebê. Mas um carro, um telefone ou uma TV podem ter sucesso comercial sem a necessidade de encorajar sentimentos parentais semelhantes em todos os que os compram. Vector, porém, requer um sentimento de amor dos clientes e aceitação da narrativa de que ele é uma criatura viva.

debate republicano transmissão ao vivo cnn

Uma vez que Vector ainda é um trabalho em andamento, é muito cedo para saber se Anki foi bem-sucedido. Os últimos 10% do desenvolvimento de um produto são onde grande parte da sutileza acontece. Mesmo na forma rude, porém, achei Vector uma companhia agradável - definitivamente mais amigável do que Cozmo. Embora Tappeiner avise que Anki está apenas avançando em direção ao seu objetivo de um verdadeiro companheiro robo, a empresa já deu um salto com a Vector.