5 tendencias de diseño de interfaz de usuario de voz
En esencia, el concepto de interacción siempre tuvo que ver con la comunicación. La interacción persona-computadora nunca se ha tratado de interfaces gráficas de usuario, por lo que las interfaces de usuario de voz (VUI) son el futuro del diseño de interfaces de usuario.
Una interfaz es solo un medio que la gente usa para interactuar con un sistema, ya sea una GUI, VUI u otra cosa. Entonces, ¿por qué es tan importante VUI? Dos razones:
En primer lugar, las interfaces conversacionales son tan fascinantes porque la conversación es una forma de comunicación que todos comprenden.
- Es un medio natural de interacción. Las personas asocian la comunicación de voz con otras personas en lugar de con la tecnología.
- Los usuarios no necesitan aprender a interpretar ninguna simbología o terminología nueva (el idioma de la GUI), pueden usar el inglés (o cualquier otro idioma nativo) para operar con un sistema. No significa que los usuarios no tengan que aprender a usar un sistema, pero la curva de aprendizaje se reducirá significativamente.
En segundo lugar, las expectativas de los usuarios están cambiando. De acuerdo a Statista, El 39% de los millennials utiliza la búsqueda por voz. Esta audiencia está lista para ser los primeros en adoptar los sistemas VUI.
Las 5 principales tendencias de VUI
Cuando se trata de diseñar VUI, la interacción de voz representa el mayor desafío de UX para los diseñadores desde el nacimiento del iPhone original. Pero la gran noticia es que los principios más fundamentales del diseño de la interfaz de usuario que usamos al crear productos con GUI todavía se aplican al diseño de VUI. A continuación, puede encontrar algunas tendencias que darán forma al diseño de VUI en las próximas décadas.
1. VUI que genera confianza
La confianza ayuda a construir un puente entre una persona y una máquina. Si no hay confianza, es poco probable que los usuarios interactúen con una interfaz de usuario de voz en particular.
La importancia del resultado válido (VUI debe darle a la persona la comprensión de que recibirá exactamente lo que solicitó). Es posible lograr este objetivo centrándose en las siguientes cosas:
- Mejora de la precisión del reconocimiento de voz (algoritmos de PNL más sofisticados).
- Centrarse en comprender la intención del usuario (una razón para interactuar en primer lugar). Cuando los usuarios interactúan con un sistema, tienen un problema particular que quieren resolver y el objetivo del diseñador es comprender cuál es este problema.
- Proporcionar mensajes de error significativos.
- Elaboración de flujos impulsados por el contexto. Si bien es imposible predecir todos los comandos que los usuarios pueden solicitar al sistema, los diseñadores deben al menos diseñar un flujo de usuarios que esté impulsado por el contexto. El sistema debe anticipar la intención de los usuarios en cada punto de una conversación y proporcionarles información sobre lo que pueden hacer a continuación. Por ejemplo, encontrar un restaurante cerca del usuario. Cuando los usuarios buscan un restaurante, el sistema debe coincidir exactamente con lo que busca el usuario.
La importancia del control del usuario (uno de los 10 heurísticas de usabilidad para el diseño de interfaces de usuario de Jakob Nielsen sigue siendo aplicable al diseño de VUI).
- El sistema debe considerar las limitaciones naturales de un cerebro humano (limitaciones de la memoria a corto plazo). La información proporcionada por el sistema debería ser abrumadora. Cuando las personas escuchan la respuesta del sistema, la mayoría de los usuarios recuerdan solo la última frase. Por lo tanto, es mejor evitar frases largas o proporcionar una docena de opciones diferentes mientras el usuario puede recordar solo un par de ellas a la vez.
- El sistema debe reaccionar a la solicitud de un usuario con la retroalimentación adecuada. Esta retroalimentación debería brindar a los usuarios una comprensión completa de lo que está haciendo el sistema en este momento. Por ejemplo, la retroalimentación visual le permite al usuario saber que el sistema está listo y escuchando; o en POD (Proceso de hacer). Cuando un usuario envía una solicitud al sistema, el sistema muestra un POD. POD no es una animación de carga, no solo indica el hecho de que los usuarios tienen que esperar mientras un sistema está haciendo algo, sino que proporciona información valiosa de lo que hace el sistema. Por ejemplo, un POD para un comando sobre cómo extraer un archivo de Dropbox puede parecer que alguien busca un archivo correcto en el almacenamiento.
2. Interfaz de usuario adaptable
Una interfaz de usuario adaptativa (también conocida como AUI) es una interfaz de usuario (UI) que se adapta a las necesidades del usuario o al contexto. La VUI del futuro se adaptará a los usuarios: el sistema analizará toda la información que tiene sobre los usuarios (incluida la información sobre el estado mental actual y la condición de salud) y su contexto actual para proporcionar respuestas más relevantes a las solicitudes de los usuarios.
Por ejemplo, si un usuario tiene presión arterial alta en este momento y decide programar una reunión en 2 horas, un asistente digital podría sugerir evitarlo o sugerir bajar la presión arterial con ejercicio antes de que comience la reunión.
3. VUI que transmite personalidad
Los diseñadores visuales tienen muchas opciones para introducir la personalidad en las interfaces gráficas de usuario: fuentes, color, ilustración, movimiento, solo por nombrar algunas. Pero, ¿qué pasa con VUI? Los diseñadores pueden transmitir personalidad utilizando el lenguaje mismo, jugando con palabras, voz y tono. Hablando de voz, una voz es parte de la persona y da forma a su identidad. Una vez que asociamos una voz con algo, se convierte en parte de su identidad. Y experimentamos emociones cuando interactuamos con dicha interfaz, al igual que nosotros cuando interactuamos con personas reales. La gente quiere voces comprensibles para los humanos, no una voz que suene humana, ¡sino una voz que hable coherentemente humana!
Mal ejemplo: la voz de Siri de Susan Bennett, la voz que suena casi humana, pero la gente todavía sabe que es una máquina. Realmente no puedes tener un diálogo con Siri. Si bien puedes preguntarle a Siri algo como «¿Cómo está el clima hoy?» No puede hacer preguntas más sofisticadas como, «¿Qué debo ponerme hoy?» Como resultado, no tienes sentimientos profundos por Siri, sabes que es solo un robot.
Buen ejemplo: la voz de Samantha de la película Her – la voz que suena coherentemente humana y la gente puede estar enamorada de ella.
4. De la IA restringida a la inteligencia general
Las interacciones entre humanos y computadoras están cambiando a la conversación, pero los usuarios esperan más. La mayoría de los sistemas de IA disponibles en la actualidad todavía se limitan a Narrow AI: estos sistemas utilizan el aprendizaje automático para resolver un problema claramente definido (y, en la mayoría de los casos, demasiado limitado). Las IA estrechas no tienen conocimiento fuera de sus datos de entrenamiento. Significa que cuando un usuario quiere resolver un problema ligeramente diferente, o el problema en sí mismo evoluciona, el sistema no podrá resolverlo y responderá con algo como «No entiendo». Para que tú, como usuario, te enfrentes a una pared.
En comparación con Narrow AI, General Intelligence no se limita a dominios estrechos. El concepto de aprendizaje es la base de los sistemas GI: la diferencia fundamental entre Narrow AI y General AI es que los sistemas de Inteligencia General aprenden sin estar expresamente programados (las máquinas aprenden por sí mismas). El sistema GI utiliza dos tipos de aprendizaje: aprendizaje reforzado (cuando un sistema usa toda la información disponible para resolver un problema de usuario en particular) y aprendizaje supervisado (cuando un sistema necesita ayuda del usuario para resolver un problema por primera vez). Otra diferencia es que un sistema de IA general puede aprender a utilizar otra IA para fines generales y específicos. Como resultado, los diferentes modelos de Machine Learning se pueden entrenar de forma dependiente y trabajar de forma cooperativa. Un sistema avanzado de NLP GI puede aprender desde el primer intento combinando y procesando información de múltiples fuentes de datos diferentes.
5. Impacto en la sociedad
Amplia aceptación de los sistemas VUI. Mejorar la calidad de los sistemas VUI basados en IA conducirá a una mejor participación de los usuarios. Las relaciones entre humanos y computadoras serán interactivas y colaborativas: las personas y las computadoras trabajarán juntas. Esto impactará a la sociedad; imagínese que en diez años entrará a la casa y hablará y controlará todo tipo de máquinas.
Este futuro será con IA omnipresente: como usuarios, confiaremos en la IA incluso con las decisiones más importantes, como «¿Qué escuela debo elegir para mis hijos?» VUI mejorará la calidad de vida de las personas mayores y las personas con discapacidad.
Conclusión
«La mejor interfaz es la ausencia de interfaz», es una cita famosa de Golden Krishna, el autor del libro. La mejor interfaz es sin interfaz. Él y muchos otros diseñadores creen que la gente no quiere más tiempo con las pantallas, de hecho, quieren menos. Por lo tanto, la tecnología debería dejar de celebrar las soluciones basadas en pantallas. Y sucederá relativamente pronto: las interacciones del futuro no estarán hechas de botones.
Con el aumento de la potencia de procesamiento de las computadoras, tendremos más sistemas que podrán calcular hasta 1000 pasos en 1 segundo. Un usuario y una máquina trabajarán juntos, lo que permitirá la inteligencia general.