Krypton Solid

Directrices para diseñar con audio – Revista Smashing

Directrices para diseñar con audio – Revista Smashing

Como hemos visto, el audio se utiliza como mecanismo de retroalimentación cuando los usuarios interactúan con muchos de sus dispositivos cotidianos, como teléfonos móviles, automóviles, juguetes y robots. Hay muchas sutilezas en el diseño con audio para crear experiencias útiles y no intrusivas. Aquí, exploraremos algunas pautas y principios a tener en cuenta al diseñar con audio.

Si bien no cubriré esto aquí, el audio es una herramienta poderosa para diseñar experiencias para la accesibilidad, y se aplican muchas de las pautas discutidas aquí. Tanto los teléfonos Android como los iPhones ya tienen opciones de accesibilidad que permiten experiencias más ricas con entrada de audio y gestual y salida de audio.

Otras lecturas en SmashingMag:

Primero, ¿quién diseña el audio? Ciertamente, los productores de audio y los diseñadores de juegos que dan vida a los juegos. También está el mundo de los diseñadores de interfaces de usuario de voz: aquellos que diseñan sistemas telefónicos de respuesta de voz interactivos para bancos, aerolíneas, etc. Luego están los diseñadores de dispositivos móviles, juguetes e interacción que tienen algo de esta experiencia o que trabajan en estrecha colaboración con ingenieros y productores de audio para crear la experiencia adecuada para sus dispositivos.

Si el audio puede desempeñar un papel en su diseño, aquí hay algunas consideraciones que debe tener en cuenta una vez que haya determinado que el dispositivo del usuario tiene un altavoz y puede reproducir audio, y está conectado a la red o tiene suficiente memoria para almacenar audio en el dispositivo.

Directrices de diseño de audio

Elija el tipo de audio correcto

El audio puede ser sonidos no verbales, a veces llamados «audífonos», o pueden ser palabras, a veces llamados indicaciones, y es importante elegir el tipo correcto. El significado se puede incrustar en un auricular de tal manera que un sonido corto no intrusivo pueda representar algo mucho más grande. Pensar en sonido que confirma que se ha enviado un mensaje de texto en un iPhone: el sonido representa efectivamente la acción al sugerir movimiento y movimiento lejos del usuario. Otro ejemplo es el sistema de asistencia de estacionamiento en un automóvil; la intensidad y el tono de los sonidos crean una sensación de urgencia para que el conductor sepa su distancia del automóvil más cercano.

Incrustar significado en un solo sonido permite una retroalimentación rápida y eficiente; los sonidos son más cortos que las indicaciones verbales y pueden ser menos intrusivos. La notificación por correo electrónico de AOL «Tienes un nuevo correo”Es un gran ejemplo de lo contrario: una notificación increíblemente molesta que hace que la mayoría de nosotros desee lanzar un martillo contra la computadora. (Pero si el sonido de AOL te ha puesto nostálgico, echa un vistazo a «13 sonidos tecnológicos que ya no escuchas. ”)

Pero solo se puede incrustar cierta información en un sonido. A veces, las palabras son la mejor forma de comunicar una idea. Si ese es el caso de su producto (digamos que está entregando instrucciones, alertas o información dinámica como navegación paso a paso), entonces hay formas de diseñarlos de manera inteligente. También deberá considerar la posibilidad de localizar la experiencia, con todas las implicaciones que ello conlleva. Un juguete parlante vendido en varios países probablemente necesitará retroalimentación de audio en el idioma de cada país, y esto requerirá pensar un poco sobre la escalabilidad de la retroalimentación de audio.

Insertar significado en audífonos de audio

Entonces, ¿cómo se pueden diseñar los sonidos de tal manera que el usuario sepa intuitivamente lo que significan? Existen algunas investigaciones para guiar a los diseñadores de earcon novatos, como el trabajo realizado por Blattner et al en «Earcons e iconos: su estructura y principios de diseño comunes”(PDF). Blattner comenta sobre Mapeos de WW Gaver de earcons en sonidos simbólicos, nómicos y metafóricos:

Las asignaciones simbólicas se basan en las convenciones sociales, como el aplauso por aprobación, las representaciones nómicas son físicas, como un golpe de puerta, y las asignaciones metafóricas son similitudes, como el cabeceo de un objeto que cae.

Blattner continúa diciendo que si se puede encontrar un buen mapeo, entonces el earcon se aprenderá y recordará más fácilmente. Los Earcons que aprovechan las relaciones preexistentes permiten a los usuarios asociar sonidos con significado con un entrenamiento mínimo o nulo.

El diseño de sonido es complejo y los diseñadores de audio querrán considerar el tono, el timbre, el volumen, la duración y la dirección para crear el sonido correcto. Para obtener detalles sobre cómo se deben considerar estos en el diseño de auriculares, consulte «Interfaces auditivas: una plataforma de diseño”(PDF).

Diseño en contexto

Ya sea que esté diseñando audífonos o indicaciones, considere el contexto particular del usuario, tanto física como emocionalmente. Si está diseñando información o instrucciones de audio, tenga en cuenta estos factores:

  • ¿Hay alguna manera de diferenciar entre un usuario novato (es decir, alguien que necesita más cogida de la mano) y un usuario experto? Esto se puede hacer realizando un seguimiento de la cantidad de interacciones que el usuario tiene con el dispositivo y adaptando una experiencia de audio para los usuarios principiantes, mientras se reproducen indicaciones abreviadas para los usuarios expertos.
  • Si el dispositivo tiene una pantalla, ¿sabe si el usuario dependerá de la información visual para completar su tarea? Si es así, el audio puede ser un mecanismo de retroalimentación secundario o puede que no sea necesario en absoluto. El audio se puede adaptar específicamente para estas situaciones reproduciendo menos o diferente audio. Saber dónde está el dispositivo en relación con el usuario podría hacerse con ciertos sensores o acelerómetros o derivarse de cómo se inició la interacción. Por ejemplo, si se inició una interacción con Siri en el iPhone 4S desde un auricular Bluetooth, es probable que el teléfono del usuario no esté disponible para comentarios visuales, por lo que proporcionar comentarios de audio enriquecidos se vuelve esencial.
  • Muchos otros contextos justifican adaptar la experiencia de audio. Con GPS, por ejemplo, puede determinar si el usuario está conduciendo (utilizando su velocidad). A veces, el estado actual del dispositivo es relevante y puede indicar la proximidad del usuario o su nivel de participación: ¿Está escuchando música el usuario? ¿Han interactuado recientemente con el dispositivo? ¿Han robado su tarjeta de crédito? Etc.

Considere los «casos de no uso»

Los diseñadores siempre hablan de casos de uso, pero para los dispositivos que «hablan», también es importante estar al tanto de los casos de no uso, situaciones en las que reproducir audio no tendría sentido. Las alertas o la información que se grita desde un dispositivo sin advertencia o contexto pueden ser alarmantes. El siguiente ejemplo muestra una pasarela móvil que repite su advertencia una y otra vez, incluso cuando no hay nadie cerca.

A menudo, querrá darle al usuario el control sobre si reproducir audio o no, a través de la configuración. Por ejemplo, en un Windows Phone, un usuario puede establecer si un mensaje de texto entrante se lee en voz alta automáticamente solo cuando está conectado a un auricular Bluetooth, cuando está conectado a cualquier auricular, siempre o nunca.

No es solo lo que dices, sino cómo lo dices

Diseñar indicaciones es parte arte y parte ciencia. Existen muchos buenos libros de diseño de interfaces de usuario y reconocimiento de voz con detalles. Veremos un ejemplo aquí y algunos de los problemas con el diseño. Tomado de una versión anterior del reconocimiento de voz en el automóvil de Ford Sync, este segmento de audio instruye al conductor sobre cómo preguntar por un artista musical en particular, pero lo hace muy mal; el ritmo, la voz y la agrupación de palabras no son lo suficientemente claros.

Algunas pautas de diseño:

  • Utilice un lenguaje que los usuarios comprendan. Manténgase alejado de la jerga, la jerga y los términos técnicos que tendrían sentido para la empresa pero no para el usuario final.
  • No sobrecargue al usuario con demasiada información a la vez.
  • Limite el número de opciones de menú de audio. El audio es lineal, sensible al tiempo y transitorio, a diferencia de la Web y otros medios de retroalimentación visual en los que los usuarios pueden tomarse un tiempo para leer, procesar y seleccionar. Las investigaciones han demostrado que es difícil recordar más de cinco opciones de un menú de audio. Los usuarios a menudo escucharán todas las opciones antes de elegir una, por lo que una lista larga limitará su capacidad para recordarlas todas.
  • Al escribir mensajes que requieran que los usuarios tomen una decisión, estructúrelos de modo que la opción del menú esté antes de la acción; por ejemplo, «Para y, presione x», en lugar de «Presione x para y». El usuario podrá identificar más fácilmente la opción que desea y escuchar más atentamente la acción.

Decidir entre indicaciones grabadas y conversión de texto a voz

Otra decisión a tomar es si pregrabar el audio con un actor de voz o usar texto a voz (TTS). El audio pregrabado proporciona la lectura de texto más natural en la mayoría de los casos, pero hay muchas consideraciones que hacer antes de implementarlo. ¿Cuántas cosas se deben registrar? ¿Cambiará el contenido de audio? ¿Cuánto espacio de almacenamiento hay disponible?

A lo largo de los años, TTS ha mejorado drásticamente y, en algunos casos, hace un gran trabajo al leer el audio. Los motores de TTS deben evaluarse en función de la tarea en cuestión: ¿Se necesitan varios idiomas? Varias voces? ¿El tipo de información a leer es especializado? La evaluación de varias implementaciones también es importante: ¿Está conectado el dispositivo, en cuyo caso el motor TTS podría estar basado en la nube, o será necesario incrustar el motor TTS en el dispositivo? Las reacciones al TTS varían; algunos usuarios dicen que TTS perjudica tanto la experiencia que evitan usarlo, mientras que otros apenas lo notan.

A continuación, se muestran dos ejemplos:

Correo electrónico de TTS

Mensajes de grabación

Si puede grabar todas las indicaciones con un actor, elija una voz y personalidad que se adapte a su marca y a la experiencia. Lo mejor es reclutar talentos con una personalidad en mente y hacer que graben un guión representativo para evaluar cómo aparecerían en el dispositivo.

Hay muchas sutilezas a tener en cuenta al grabar mensajes. Los diseñadores de interfaces de usuario de voz dedican tiempo a dirigir a los actores de voz para asegurarse de que las indicaciones obtengan la respuesta hablada correcta de los usuarios. El siguiente mensaje puede significar diferentes cosas dependiendo de cómo se lea: «¿Le gustaría salidas o llegadas? » induciría a los usuarios a decir «salidas» o «llegadas». Los usuarios podrían malinterpretar una lectura ligeramente diferente, «¿Le gustaría salidas o llegadas?», Como si requirieran una respuesta de sí o no.

Las indicaciones se pueden grabar incluso cuando algunas de las indicaciones deben cambiarse dinámicamente, como cuando se lee la hora o un número de teléfono. En estos casos, grabaría avisos más cortos y luego los concatenaría durante la reproducción. Para que estas lecturas suenen naturales en lugar de robóticas, grabe una parte tan grande de la indicación como sea posible.

Resumen

La consideración más importante al diseñar con audio es asegurarse de que mejore la experiencia y no interfiera ni distraiga. Si está considerando diseñar con audio, es de esperar que ahora tenga información útil para comenzar a diseñar una gran experiencia.

Deja un comentario