Un equipo de investigadores del MIT creó un dispositivo, que se usa como unos audífonos, capaz de leer esa “voz interna de las personas”. De esa manera, pueden hacer búsquedas de información y controlar dispositivos.
AlterEgo es capaz de transcribir palabras que los usuarios verbalizan internamente, pero no dicen en voz alta. Para esto, AlterEgo utiliza electrodos que están adosados a la piel (en la cara y en las mandíbulas).
El sistema consiste en un dispositivo usable (“wearable”) y un aparataje computacional relacionado. En el dispositivo, unos electrodos recogen señales neuromusculares del rostro las cuales son desencadenadas por las “verbalizaciones internas” (esas palabras que tú te dices dentro de tu cabeza). Luego, envía las señales a un sistema de aprendizaje de máquinas (un tema que ha estado de moda ahora último: “machine-learning”), que ha sido adiestrado para correlacionar señales específicas con palabras específicas.
El dispositivo es parte de un esquema computacional silencioso que permite que el usuario haga preguntas y reciba respuestas de problemas complejos sin que nadie se dé cuenta. Una de las aplicaciones que han probado en el MIT permite que el usuario juegue ajedrez y reciba recomendaciones de jugadas.
“La motivación para hacer esto fue construir un dispositivo de aumento de inteligencia (intelligence-augmentation)”, señala Arnav Kapur, el estudiante del MIT Media Lab, que dirigió este proyecto. “Nuestra idea fue: ¿podríamos tener una plataforma informática que sea más interna, que —de alguna manera— fusione a los humanos con las máquinas, y que se sienta como una extensión natural de nuestra propia cognición?”
A comienzos de marzo, los investigadores presentaron el AlterEgo en la conferencia de Interfaces Inteligentes de Usuarios de la ACM (Asociación para Maquinaria Computacional, Association for Computing Machinery) en Tokio. Su video en YouTube establece que la idea es combinar humanos y máquinas de modo que “la computación, la Internet y la Inteligencia Artificial se entretejan en la personalidad humana como un alter ego”.
“Básicamente, no podemos vivir sin nuestros celulares, sin nuestros dispositivos digitales, pero, por el momento, no es fluido el uso de estos dispositivos”, afirma Pattie Maes, una prestigiosa profesora de artes mediales y ciencias del Media Lab y, además, la tutora de la tesis de Kapur.“Si quiero buscar algo pertinente para una conversación que estoy teniendo, debo encontrar mi teléfono en la cartera, escribir la contraseña, abrir una aplicación y buscar la palabra clave. Todo lleva a que deje de prestarle atención a mi entorno, y a las personas con las que estoy, para concentrarme en el teléfono mismo.”
Pattie Maes lleva muchos años investigando cómo hacer que esta interacción sea más fluida. Su grupo de investigación en el Media Lab —Interfaces Fluidas— trabaja en conseguir una interfaz más natural, más espontánea. Ella hizo una gran charla TEDacerca de un proyecto anterior (“el sexto sentido”) en 2009. El tema es el mismo.
Utilizando el prototipo disponible, los investigadores realizaron un estudio de usabilidad con diez personas. Primero, pasaron 15 minutos personalizando una aplicación aritmética a su propia neurofisiología. Después, pasaron otros 90 minutos utilizándolo para ejecutar cálculos. AlterEgo logró un 92% de precisión. El servicio de transcripción de voz de Google —que usa un micrófono tradicional— tiene algo más de 95% de precisión, pero Arnav Kapur piensa que los resultados de AlterEgo pueden mejorar. Actualmente, el equipo se encuentra recogiendo datos para mejorar el reconocimiento y ampliar el número de palabras que AlterEgo puede detectar. Ya se lo puede utilizar para mover y seleccionar contenido mediante una interfaz básica (como la de Netflix), para reconocer números y para jugar ajedrez.
Uno de los objetivos es que, a la larga, AlterEgo se relacione con asistentes inteligentes como Siri (Apple), Alexa (Amazon), Cortana (Microsoft), Assistant (Google), los cuales, a su vez, han sido incorporados en otros dispositivos, como los parlantes Echo, de Amazon.
El trabajo ha sido apreciado por otros expertos. Thad Starner, de Georgia Tech, cree que AlterEgo podría ser muy útil para quienes trabajan en ambientes con mucho ruido (como en las pistas de los aeropuertos); o podría servirle aun piloto de guerra, o a un bombero. O para las personas que tengan dificultades para hablar.
En las redes sociales, muchos han reaccionado con comentarios divertidos: “No creo que quieras escuchar lo que pasa por mi cabeza a veces :) ”. “Esto me podría generar problemas con varias personas :-D”. Uno de los más celebrados decía: “Es seguro que, cuando lo prueben en una mujer, no llegará a un 92% de certeza.”
Alter Ego | MIT Media Lab - YouTube