• TRC

Voice shopping, ¿revolución o evolución?

Resumen ejecutivo


En los dos últimos años estamos asistiendo a una proliferación masiva de los smart assistants, sobre todo en EEUU, liderados por Amazon Echo o Google Home y con ellos, los rumores de que una nueva forma de comprar o vender (depende de la perspectiva con la que se mire), basada en voz, cambiará las reglas del juego.


Conceptos como conversational commerce y voice shopping están a la orden del día y la evolución de la cifra de ventas en EEUU debida a voz se estima que crecerá por encima de un 65% anual en el periodo 2018-2022, aunque su participación en el total de ventas retail no llegará a superar el 1%.


La voluntad de interactuar con máquinas a través de voz, hecho que sería definitivamente muy conveniente para el ser humano, no es reciente, pero fue Apple con su asistente Siri en 2011 quien puso definitivamente en escena esta tecnología. El éxito de su adopción en el uso cotidiano de la voz como canal de conversión depende de la capacidad para resolver los retos técnicos del entendimiento, la comprensión, la ejecución de acuerdo con expectativas de cada usuario y, finalmente, la seguridad de la información.


Aunque hay distintos proveedores, la tecnología y la plataforma de compra por voz está actualmente dominada por Alexa de Amazon, compañía que juega un doble papel: desarrollador de tecnología y retailer con voluntad de posicionar sus marcas propias.


Independientemente del plazo requerido para para que el voice shopping tenga un peso significativo como canal de conversión, cuando éste se valora en un contexto post-digital (en el que el impacto “técnico” de la permanente evolución de la tecnología en el negocio se da por descontado en el plan de cualquier organización), se llega a la conclusión que la clave de la competitividad pasará por en la definición de la mejor estrategia para conectar-convertir, dando especial importancia, en el caso de retail o DTC, en el rol, en su sentido más amplio, de la marca como motor de diferenciación y competitividad.


Intro


Una cosa está clara en el comercio: la conversación genera conversión. De ahí la importancia de invertir en la relación directa con los clientes en todas las etapas del proceso de compra de la forma más conveniente en el sentido más amplio del concepto, esto es, en el momento adecuado, siendo útil y del modo que requiera menor esfuerzo para el cliente. ¿Y qué hay mejor que tener una charla en el instante preciso para aconsejar, resolver dudas o ayudar a adquirir un bien o servicio?


Esta función de gestionar la relación con el cliente ha sido mayormente llevada a cabo hasta ahora por personas (humanas) que, con mayor o menor habilidad, voluntad y conocimiento, han sido las responsables de fidelizarlo e incrementar la conversión en el punto de venta.


Sin embargo, la irrupción de las tecnologías digitales ha supuesto una completa revolución en el proceso de decisión de compra (el customer journey) de productos y servicios, impactando de lleno en el modelo de relación de las marcas con los clientes, que han ido progresivamente incorporando nuevos canales y fórmulas para interactuar y posicionarse en la mente del consumidor durante todas las etapas del proceso.


Una de las soluciones es el conversational commerce, cuyo principio es la generación de conversaciones personalizadas con el cliente a fin de ayudarlo a tomar la mejor decisión de acuerdo con sus necesidades. Estas conversaciones, que históricamente se daban a pie de pasillo en la tienda, actualmente se pueden dar en cualquier instante a través de chatbots o live chats (ofrecidos y controlados por la marca a través de su web app móvil o redes sociales).

Si bien los asistentes de voz han estado disponibles durante unos cuantos años sobre distintos soportes (Siri se lanzó en 2011), la realidad es que, solamente desde hace un par de años, y, sobre todo, fruto de la rápida penetración en los hogares, principalmente en EEUU, de dispositivos de voz smart assistants como Amazon Echo o Google Home, están siendo el catalizador de, según algunos expertos, la explosión de un nuevo canal de conversión, el voice shopping.


Pero ¿puede considerarse el voice shopping un verdadero game changer o es simplemente la evolución del e-commerce? ¿Cuáles son las claves del éxito de este nuevo canal? ¿Es cierto que esta nueva revolución está tan cerca como indican los expertos?


El conversational commerce (pero a través de texto)


El término conversational commerce lo introdujo Chris Messina (quien fue Developer Experience Lead en Uber, liderando la integración de API’s en plataformas como Messenger o Alexa) en 2015 para y lo definió del siguiente modo:


Conversational commerce is about delivering convenience, personalization, and decision support while people are on the go, with only partial attention to spare


Según la definición, está claro que el conversational commerce hace referencia a cualquier interacción que pueda darse a través de una conversación, ya sea de voz o texto, que contribuya a facilitar nuestro día a día, ya sea ayudando a la toma de decisiones o la realización de tareas necesarias pero de poco valor añadido (p.e. llamar a un taxi o comparar precios).


En 2015, los chatbots, a través no sólo de las webs y apps propias de las marcas, sino, sobre todo, en RRSS, estaban en su pico más alto después de la compra de Whatsapp por Facebook en 2014. Sin entrar a discutir si el efecto de la masiva adopción de chatbots fue positiva para el cliente final o no, lo cierto es que prácticamente la totalidad de estas aplicaciones se basaban en text messaging, no en voz. Las conversaciones de voz estaban en una fase muy incipiente debido a la dificultad, previa a la de interpretar las expresiones, de tener la capacidad de transcribir las palabras en una etapa previa. En 2011 Apple lanzó Siri, con una efectividad discutible; y en 2014 Domino’s Pizza lanzó Dom, su asistente por voz orientado a la transacción, en el que era posible realizar pedidos, siendo probablemente el pionero con esta vocación de transacción.

El reto de la comprensión oral por ahí 2015, mientras no estuviera resuelto perfectamente, iba en contra de la experiencia de cliente, premisa fundamental para el desarrollo del canal online (que, por cierto, crecía por encima del 20% anual).


2015 también fue el año en el que Amazon empezó a dar la opción de compra por voz a sus clientes Prime para categorías determinadas, fruto de la evolución de sus dash buttons. El efecto Amazon, otra vez, impulsa un nuevo modelo de negocio.


De entender a comprender (y resolver): factores clave para la consolidación del Voice shopping


Una parte significativa de consumidores, muchos de ellos habituados a conversational commerce a través de servicios de mensajería, se muestran abiertos a tener interacciones de voz durante todo el proceso de compra, según un estudio publicado por Capgemini. Y es que las personas somos capaces de hablar hasta 150 palabras por minuto, mientras que solo podemos escribir unas 40 por minuto, con lo que la conveniencia de la voz no tiene discusión. Además, varios estudios predicen que, en 3 años, el 50% de todas las búsquedas online se darán por voz.

No obstante, el habla es un fenómeno complejo y dinámico, que transciende a la adecuada pronunciación y a la correcta construcción de frases. Existen, por tanto, una serie de retos, que pueden agruparse en dos categorías: técnicos o de “Entendimiento”, relativos a la capacidad de transcripción; y otros más de “Comprensión”, esto es, de realmente interpretar el significado de la oración.

Esta complejidad del lenguaje, ya sea por voz o mensaje, limitaba extraordinariamente el potencial del conversational commerce dado que, para ciertas categorías, se requiere de un elevado nivel de sintonía (comprensión) con las necesidades reales del consumidor. Analizando el uso de los smart assistants se puede observar que la compra de productos no se encuentra entre el top 5 de usos. De hecho, el elemento común de los principales usos de estos dispositivos es el reconocimiento de comandos muy concretos, podrían considerarse simples, para reducir el error de entendimiento y, sobre todo, de comprensión. Al menos hasta la fecha.

El entendimiento (del inglés), un reto conseguido


Actualmente, el eje “Entendimiento” está prácticamente resuelto, al menos para el inglés, con una fiabilidad en la transcripción superior al 95% (siendo un 30% en 2012), que son niveles similares a los de las personas.

Pero esta tasa de “Entendimiento”, por sí misma, no es garantía de una experiencia satisfactoria. Si tratamos de preguntar a cualquier asistente de voz algo como “encárgame una tonelada de comida basura que hoy quiero morir de colesterol”, ¿cuál será la respuesta?


Las máquinas han sido históricamente muy rígidas (“literales”, en el caso que aplica) y con poca o nula capacidad para “leer entre líneas”, debido a que su programación se basaba en reglas que actuaban sobre tablas, sobre información estructurada. Y el lenguaje humano tiene poco de estructurado: el tono, el contexto y las distintas acepciones, oficiales o no, de las palabras, pueden inducir a errores en el significado de un texto.


Inteligencia Artificial y comprensión


El primer paso para la comprensión del habla en el pasado reciente (las aplicaciones de reconocimiento de voz se remontan a 1962, con IBM y su Shoebox, capaz de reconocer 16 palabras y números del 0 al 9 y realizar algunas operaciones matemáticas) ha sido el uso de analytics para la identificación y clasificación del interlocutor. Así, los sistemas de reconocimiento de voz son capaces de crear un perfil del usuario según variables como género, idioma, edad o acento e incluso identificando el número de interlocutores en una misma conversación. Esta capacidad ha permitido mejorar sensiblemente la experiencia de usuario al asignar al bot la configuración con la que la persona se sienta más cómodo interactuando.

El segundo gran paso es la capacidad para el reconocimiento de las sutilezas del lenguaje. Actualmente, los avances en inteligencia artificial han llevado al desarrollo la disciplina conocida como Procesamiento del Lenguaje Natural (Natural Language Processsing NLP) que, basada en modelos de redes neuronales (neural networks), tratan de simular el funcionamiento del cerebro humano, permiten determinar el contexto, casi integral, de la charla, esto es, tanto la intención como el estado de ánimo del interlocutor. Si a estos avances en reconocimiento del habla le incorporamos una cámara para analizar la fisonomía y la expresión del interlocutor, el nivel de “comprensión” es realmente elevado.

En el mercado se encuentran un gran número de compañías dedicadas al desarrollo del NLP. Entre las más relevantes se encuentran Mobvoi, TaskUs o SoundHound.

Aportando respuestas de valor para el usuario


Existen diversos estudios que comparan las principales aplicaciones de smart assistants y su capacidad para dar respuestas acertadas en un contexto de uso más general (no focalizado en recomendaciones de compra o conversión directa) evaluando sus respuestas a una tipología muy amplia de preguntas (en sintonía con sus múltiples usos más allá de la conversión).

En lo relativo a voice shopping, se presentan dos grandes retos para darle el impulso definitivo:

  • La capacidad para dar las respuestas más apropiadas para cada individuo. De nuevo, personalización. Si se compara la tasa de penetración de diversas categorías online vs voice, se advierte que son las categorías de compra más rutinaria (con menor componente emocional), las que tienen un menor diferencial. Así se observa que Alimentación tiene un diferencial de 8,4% o que Ropa tiene un diferencial de 39,45%.

Para poder ir ganando cuota en categorías más “emocionales” es conveniente que el cliente esté abierto a compartir la mayor información personal posible. Además, para categorías como ropa o belleza, será definitivo complementar la voz y la imagen para explotar todo el potencial.

  • Proporcionar seguridad del canal. Según un estudio publicado por Voicebot, los dos primeros motivos por los que los consumidores son reticentes a la adopción del voice shopping están asociados a seguridad: el primero tiene que ver con la privacidad de la información personal (estos dispositivos registran las conversaciones y, en algunos casos, se han activado solos, compartiendo posteriormente con terceros estos registros); el segundo motivo apunta específicamente en la seguridad de la transacción.

Previsiones de crecimiento del voice shopping y su impacto en los retailers


Aunque la cifra de negocio que mueve actualmente el voice shopping es inferior al 0,05% de toda la venta retail en EEUU (la lectura podría ser que prácticamente nadie compra por voz), existen innumerables síntomas que predicen una progresiva consolidación: la evolución del ecommerce (con un crecimiento anual de +20%); la adopción de smartphones (70%), principal dispositivo que actualmente lo soporta; o la penetración de los smart speakers en los hogares (75% para 2020 en EEUU). De hecho, un estudio de OC&C predice que el desarrollo de las ventas por voz en ese país pasará a ser de más de 40.000 millones de dólares (todavía inferior al 1% pero con un CAGR de 82% para el periodo 2017-20022) en 2022.

Hoy en día, todo indica que Amazon Alexa, a través de sus dispositivos smart assistants Echo domina la etapa de conversión de la compra por voz, debido principalmente a que la compra es una función inherente a Amazon.


Sin embargo, si hablamos de conversational commerce, es decir, de interacciones por voz durante todo el proceso de compra, los smartphones y otras aplicaciones, sobre todo Google Assistant, aparecen en escena como determinantes para el futuro.

Si se considera, como se ha mencionado previamente en este artículo, que se estima que en 2022 el 50% de todas las búsquedas online se darán por voz y que este canal está dominado, al menos actualmente, por Alexa, y conocemos la política de Amazon de desarrollar sus propias marcas, los retailers y, en general, todas las marcas de consumo se encuentran ante un posible escenario en el que la marca haya perdido completamente su relevancia en el momento de la toma de la decisión de compra. Las opciones para mantener su posición competitiva pueden ser varias, distintas y compatibles, entre ellas:

  • Desarrollar una estrategia de marca que conecte con el segmento objetivo de consumidores, creando una comunidad con la que se comparte un planteamiento sobre la vida que sea lo suficientemente grande, activable y rentable

  • Aliarse con los otros proveedores de tecnología como Google o Microsoft que todavía no tienen esta vocación de retailer: “el enemigo de mi enemigo es mi amigo”

  • O bien, apostar por Amazon y asegurar tener el estatus de “Amazon Choice para aparecer entre las primeras opciones sugeridas

Reflexión final


El voice shopping, con las cifras de crecimiento que presenta en la actualidad, definitivamente no se puede considerar una revolución (game changer). Es más conveniente considerar que el voice shopping evolucionará, eso seguro, a un ritmo más o menos rápido pero no fulgurante, a través de:

  • el desarrollo de una tecnología que sea más precisa y, de un modo igual de importante,

  • de su aceptación por parte del consumidor al resolver sus inquietudes sobre la privacidad y seguridad

Con el tiempo, el voice shopping pasará de ser un soporte a la conversión del ecommerce hasta llegar a ser un nuevo canal de conversión. Probablemente, el término conversational commerce, mucho más inclusivo, sea el que mejor describa la transición entre el ecommerce actual y el voice shopping futuro.


Los retailers y las marcas tradicionales tienen que estar preparados para la irrupción de las interacciones por voz en todo el proceso de compra, pero no de un modo táctico, sino haciendo una profunda reflexión sobre la revolución digital y la velocidad del cambio en su conjunto y determinar cuál tiene que ser su modelo de abordaje al consumidor y ajustar sus previsiones de crecimiento e inversiones de forma realista y coherente con su posicionamiento y modelo de negocio.

9 views0 comments

TheRetailChronicler 2019. Proudly created with Wix.com

Subscribe to Our Newsletter