ww

ASR y detección de palabras clave

La tecnología ASR (Automatic Speech Recognition) permite decodificar la voz del cliente y responderle automáticamente a sus requerimientos; de todas formas las llamadas también pueden ser atendidas por un operador si el cliente así lo solicita. Este tipo de desarrollo permite aumentar la eficiencia, ganar en imagen y reducir los costos, ofreciendo soluciones muy novedosas y de amplia utilización en empresas de consumo masivo tales como Telcos, Bancos, Seguros, Tarjetas de Crédito y Call Center, entre otras.

En este sentido, eXpand implementó el primer sistema masivo de reconocimiento automático del habla (ASR), automatizando los servicios de informes de guía de Uruguay.

El reconocimiento de palabras clave es una técnica que permite la identificación de palabras en una grabación o en una conversación que está siendo desarrollada.

Las técnicas de ASR (Automatic Speech Recognition) y KWS (Key Word Spotting) obtienen muy buenos resultados. En el primer caso se realiza una transcripción del audio a texto previo a la búsqueda de la palabra deseada. En el caso de KWS se detectan únicamente las palabras claves sin hacer una transcripción completa del audio.

eXpand ofrece técnicas de KWS (Keyword Spotting) derivadas del servicio de Speech-To-Text (STT), para -de forma automática- detectar palabras o frases del protocolo de calidad que se han mencionado en cada llamada, identificar en qué momento del audio dichas palabras o frases se han mencionado, el grado de certeza de la referida detección y la capacidad de reproducir el audio –desde la misma interfaz- a partir del momento en que una palabra o frase se menciona.

Ejemplo:

El proceso de calidad de una financiera requiere que los operadores de su callcenter indiquen en cada llamada entrante que la misma es monitoreada, que valide al llamante mediante su cédula de identidad y que le informe que puede recibir su estado de cuenta por mail en vez de por correo postal.

Se determina que palabras claves (keywords) identificadoras de estos temas son: “monitoreada”, “grabada”, “cédula de identidad”, “estado de cuenta por mail”. Para automatizar este proceso se asocia a la campaña saliente las keywords de búsqueda antes mencionadas y se activa la grabación de llamadas.

Los operadores atienden las llamadas de forma normal mientras el sistema graba las llamadas. Al finalizar cada grabación, el sistema procesará de forma automática la grabación asociada, haciendo uso del servicio de Speech-To-Text de Watson, y en particular la funcionalidad de Keyword Spotting para buscar las palabras claves antes mencionadas.

Obtenido el resultado, asocia esta información en forma de metadata, indicando para cada llamada qué keywords fueron encontradas, en qué momento del audio y la confianza entregada por Watson.

Estos metadatos son utilizados para establecer métricas, que permiten al cliente medir la calidad de la llamada, pudiendo establecer un score para cada llamada y operador de callcenter. Estos resultados son visualizados y constatables mediante una interfaz web, y en forma de informe semanal para cada operador, entregado al supervisor del callcenter.