El especialista en comunicaciones, masvoz, ha analizado las tecnologías de voz que van a estar en el centro de este nuevo cambio:

– Reconocimiento automático del habla (ASR, en sus siglas inglesas). En entornos telefónicos, esta tecnología es la responsable de entender y transcribir cuando el interlocutor dicta un número de DNI o de teléfono a la operadora virtual, lo que permite evitar la marcación vía teclado y crear una interacción más sencilla para el usuario. En un principio, esta tecnología solo era capaz de entender dígitos y letras como números de teléfono. De hecho, en sus comienzos en los años 60, los investigadores lograron que reconociera las cuatro vocales y nueve consonantes, y en los 70 el sistema de ASR más avanzado solo reconocía mil palabras.

Hoy en día, mediante programas más avanzados, los sistemas son capaces de reconocer el lenguaje natural y se utiliza para transcribir llamadas o conversaciones completas y para subtitular o traducir una voz automáticamente.

– Análisis del habla. Se trata de una tecnología que es capaz de analizar las llamadas de voz en tiempo real, muy usada en el ámbito de la atención al cliente o el retail. Es una herramienta que detecta la emoción, el tono e incluso el estrés en la voz. Estos datos de audio se analizan y también sirven para identificar si un usuario está molesto o frustrado. De este modo, la persona que está al otro lado podrá gestionar mejor la petición o necesidad del usuario y considerar cuál es la mejor manera de abordar un problema. Con toda la información obtenida del análisis de estas interacciones, las compañías pueden mejorar su servicio y adaptarse a las necesidades de su público objetivo.

– Voice Engine Optimization (VEO). Los altavoces inteligentes con asistente de voz ya son un elemento más en la decoración de muchos hogares. Según cifras de OC&C, en 2022 el 55% de los hogares tendrá uno o varios de estos dispositivos. Por ello, interactuar con los asistentes virtuales se convertirá en algo cotidiano y las búsquedas mediante voz se incrementarán exponencialmente.

De hecho, ComScore afirma que la mitad de las búsquedas en 2020 se harán por voz. Este nuevo hábito significa un desafío para los expertos en marketing digital, puesto que las estrategias de contenido deberán estar enfocadas a la creación de preguntas y respuestas y todo ello en torno a la creación de palabras clave de conversación para responder en lenguaje natural. Esta estrategia para optimizar las búsquedas por voz es lo que se llama Voice Engine Optimization o VEO, concepto que será primordial para elaborar una estrategia de marketing en el futuro.

– Biometría de voz. Esta tecnología se encuentra todavía en fases iniciales de desarrollo pero su llegada supondrá un gran avance en seguridad y privacidad de datos personales. En lugar de usar la huella dactilar o los rasgos faciales, este es un sistema que crea una huella vocal, única, segura e intransferible como medida de autenticación y firma digital. Para obtener la huella vocal de una persona se realizan una serie de pruebas y registros en los que el sistema tiene en cuenta rasgos físicos como la forma y el tamaño de la boca, además de la pronunciación, frecuencia y velocidad de la voz.

Tendrá múltiples aplicaciones en diversos ámbitos. Por ejemplo, con la biometría de voz será posible votar por teléfono en unas elecciones, autorizar transacciones bancarias, obtener una contraseña olvidada o autenticarse en un Contact Center. De hecho, según un estudio de emarketer, en Estados Unidos estiman que, este año, 21 millones de personas harán al menos una compra a través de un altavoz inteligente. En estas transacciones la seguridad es muy importante y los avances en biometría permitirán que estas compras sean totalmente seguras y los datos estén protegidos.

Fuente: https://www.ituser.es/actualidad/2019/11/la-voz-clave-de-la-proxima-ola-tecnologica-altavoces-inteligentes-biometria-analisis-del-habla