Progettare skills per Amazon Alexa

Come possiamo progettare un’applicazione voice che non faccia scappare i suoi utilizzatori finali? Per progettare skills per Alexa, gli step da seguire sono simili a quelli impiegati per le interfacce grafiche, ma con alcuni interessanti “twist”.

Progettare skills per Amazon Alexa

Quasi un anno è passato dall’arrivo di Alexa in Italia, l’assistente vocale di Amazon, il cervello dietro milioni di device come Amazon Echo, Echo Dot ed Echo Show.

In quest'anno di vita ha risposto a 600 milioni di domande dei nostri connazionali e ha consentito agli utenti di ascoltare - attraverso gli smart speaker Echo - decine di milioni di canzoni, tanto da poter riprodurre musica per 3.500 anni.

In questo primo anno la community degli sviluppatori è passata da 3mila a 26mila membri, e le "Skill" a disposizione degli utenti sono cresciute da 400 a oltre 3mila. Investire risorse nel progettare skills per Alexa è quindi quantomai importante.

Ci troviamo in un momento storico in cui sta prendendo piede un nuovo paradigma di interazione che andrà a rivoluzionare il modo in cui alcune tecnologie vengono fruite: basta guardarsi intorno per vedere quante persone, anche camminando per strada, utilizzino Siri o Google per semplificare alcune azioni abituali che fino a poco fa svolgevano attraverso l’interfaccia touch del proprio cellulare.

Dal creare un promemoria all’ impostare una sveglia, dal ricercare informazioni all’ascoltare una canzone: tutte queste azioni trovano una più naturale forma di interazione nella voce piuttosto che nelle dita. Questo succede perché siamo naturalmente propensi a semplificare la nostra vita, riducendo il nostro carico cognitivo che determinate azioni (soprattutto pratiche\ripetitive) comportano.

Per progettare skill per Alexa, quali parametri considerare?

A complicarsi qui è il lavoro del designer: le interfacce vocali creano una serie di aspettative che alzano il livello di qualità atteso da parte degli utilizzatori. Quando interagiamo con interfacce grafiche e qualcosa non funziona, mediamente pensiamo di aver sbagliato noi, ma quando questo avviene con le interfacce vocali, diamo la colpa al sistema.

Perché succede?

Perché parlare è la forma di comunicazione più naturale ed immediata e ci sentiamo tutti mediamente degli esperti. Se l’applicazione vocale non risponde ai criteri di affidabilità, utilità e facilità d’uso questo può avere effetti molto negativi sul retention rate: voicelabs ci dice infatti che solo il 6% degli utenti saranno attivi la settimana seguente il download di una applicazione voice.

Come possiamo quindi progettare un’applicazione voice che non faccia scappare i suoi utilizzatori finali? Per progettare skills per Alexa, gli step da seguire sono simili a quelli impiegati per le interfacce grafiche, ma con alcuni interessanti “twist”.

1. Definire l’obiettivo

Prima di tutto è necessario comprendere chi sono le persone che utilizzeranno l’applicazione vocale e se effettivamente la voce sia la forma di interazione più adatta a supportare l’esperienza d’uso.

Identificare chi sono le persone che la utilizzeranno ci aiuta a capire anche quale sia la tipologia di linguaggio da preferire (formale, informale, forbito o colloquiale) rispetto al target di interesse.

Ecco che qui arriva il primo twist. Anche il sistema necessita infatti dell’elaborazione di un Persona ad hoc: la nostra applicazione vocale si rivolge a degli adulti o a dei bambini? Sono persone che prediligono un linguaggio forbito o colloquiale? Dovrà utilizzare termini gergali o di settore? La definizione di questo parametro è essenziale per progettare skills per Alexa in maniera ottimale.

2. Comprendere il contesto

In questa fase si inizia a delineare il nostro futuro prodotto e le sue caratteristiche. Comprendere il contesto d’uso è una parte fondamentale e per farlo aiuta molto l’elaborazione di scenari che calino le personas elaborate nella situazione di utilizzo reale. Questo ci aiuta a confermare che l’interazione vocale sia la più adatta per l’esperienza utente che stiamo progettando o magari ci aiuta a capire che ne è solo una parte collaterale.

Non dimentichiamoci che interagiamo con la voce quando questa risulta essere la via più facile ed efficiente per raggiungere l’obiettivo.

3. Prototipare

Dopo aver definito gli scenari possiamo iniziare ad elaborare i dialoghi che definiscono la conversazione tra l’utente e l’applicazione. Qui dobbiamo fare di tutto per rendere l’interazione con l’app naturale come se fosse una conversazione con un amico.

E qui arriva un ulteriore twist. Non dimentichiamoci infatti che la UI di un sito/app é tendenzialmente univoca anche quando contiene contenuti personalizzati, mentre l’interazione vocale deve essere varia e piacevole. Abbiamo infatti un’alta tolleranza per GUI consistenti, ma una bassa tolleranza verso esperienze conversazionali ripetitive.

Quando si tratta di progettare skills per Alexa, pensate a quel conoscente che vi ripete sempre le stesse cose: vi fa piacere parlare con lui o vi genera un senso di fastidio ed impazienza? Lo stesso vale per la vostra skill!

Cosa dobbiamo ricordarci quando iniziamo a definire i dialoghi?

  • Mantenere le interazioni brevi: dobbiamo cercare di risolvere il problema del nostro utente nel minor numero di step possibili. Più passaggi ci vogliono e meno l’esperienza è piacevole (d’altronde quando incontrate il vostro vicino di casa logorroico vi fa forse piacere conversare con lui :D?)
  • Scrivere per come le persone parlano, invece di come leggono e scrivono: ovvero utilizzare frasi o domande complete, anziché una serie di parole chiave.
    Quando ricerchiamo su Google potremmo infatti scrivere "la migliore pizza di Roma".
    È invece più probabile che chiediamo al nostro servizio vocale qualcosa del tipo: "Alexa, puoi trovarmi una buona pizzeria a Roma?"
  • Evitare le frasi ripetitive.
  • Indicare quando l'utente deve fornire informazioni.
  • Non dare per scontato che l'utente sappia cosa fare o cosa accadrà.
  • Fornire sempre opzioni chiare. In generale, non fornire più di tre scelte alla volta.
  • Chiedere informazioni un pezzo alla volta: è facile infatti confondere le persone quando gli vengono date troppe informazioni tutte insieme.

4. User flow

Uno script di base non rappresenta pienamente il modo in cui le persone interagiranno con una skill nella vita reale. Gli utenti possono dire troppo poco, troppo o dire cose che non ci si aspetta.

Il flow conversazionale ci aiuta a delineare qual è la strada più breve per giungere al completamento del task, quali sono le strade alternative e l’albero decisionale. Inoltre, ci sono una serie di decisioni che il sistema deve intraprendere (per esempio se si tratta di nuovi o returning users). È importante fare emergere come la skill può aiutare gli utenti: per programmare skills per Alexa complesse, potrebbe anche essere utile creare della documentazione ad hoc da mettere a disposizione.

5. Test di usabilità

L’interfaccia della VUI è la conversazione, ma tra Regioni e gruppi etnografici ci sono differenze sostanziali. È necessario abbandonare il proprio cantuccio e confrontarsi con gli utilizzatori finali del prodotto per capire quale tono, gergo e sinonimi utilizzare.

A questo fine i test di usabilità sono lo strumento migliore perché oltre ad aiutarci a modificare eventualmente alcune caratteristiche del linguaggio ci aiutano anche a capire dove il flusso della conversazione possa avere bisogno di migliorie e modifiche. Sono anche molto economici, come Donald Norman insegna, effettuandoli con almeno 5 persone infatti riusciamo già ad individuare il 95% delle problematiche più comuni.

Anche qui però abbiamo un interessante twist rispetto ai test effettuati sulle GUI: quando effettuiamo test di usabilità su GUI, spesso chiediamo agli utenti di commentare ad alta voce le loro azioni. Per le VUI, questo di solito non è possibile perché il sistema sta anche ascoltando ciò che dice l'utente. Quindi è meglio osservare le reazioni degli utenti mentre completano le attività, quindi porre domande di follow-up dopo ogni attività.

In conclusione l’introduzione della VUI può essere considerata una nuova frontiera del service design che presenta opportunità uniche e una sfida interessante per noi designer.

PARTECIPA AL MEETUP DEL 6 NOVEMBRE A TORINO: PROGETTARE SKILLS PER AMAZON ALEXA - TIPS&TRICKS!