Rouven Grünig, Sebastian Straus 20.03.2020

Was bei der Auswahl von sprachgesteuerten Diensten wichtig ist

Mit prognostizierten 200 Millionen verkauften Geräten bis Ende 2020 gehört der Smart Speaker Markt zur am schnellsten wachsenden Consumer-Technologie. Ob als Informationsquelle zu Wetter und Nachrichten oder für Kommandos wie beispielsweise «Licht an» – die unterschiedlichsten Anwendungsfälle lassen sich sowohl bei Smart Speakern als auch bei Sprachassistenten mobiler Endgeräte beobachten. Ihre intelligenten Dienste ermöglichen eine natürliche und reibungslose User Experience und verändern diese auf fundamentale Weise.

Viele Unternehmen haben dieses Potenzial erkannt und suchen nach Lösungen wie sie ihre Leistungsangebote sprachgesteuert gestalten können und welche Auswirkungen dies auf ihre zukünftigen Produkte und Dienstleistungen haben wird. Dabei gilt es aber zunächst herauszufinden, ob ein vorgesehener Dienst überhaupt sinnvoll sprachgesteuert gestaltet werden kann. Dabei kommen insbesondere die folgenden Aspekte zum Tragen:

  • Kundennutzen: Ohne Kundennutzen findet der sprachgesteuerte Service keine Verwendung im Alltag
  • Geschäftswert: Ein sprachgesteuerter Service ist nur dann sinnvoll wenn er ein Mehrwert für das Produkt- oder Serviceportfolio des Anbieters bietet
  • Sicherheit: Die Interaktion mittels Sprache ist durch den Nutzer viel weniger direkt steuerbar. Für eine Akzeptanz von Sprachservices ist die Berücksichtigung von Sicherheitsbedenken wesentlich

Bei den beschriebenen Dimensionen handelt es sich um Auszüge aus einer detaillierten Checkliste zur Bewertung der möglichen Sprachunterstützung von Services.

«Die Nachfrage nach Produkten, die sinnvolle Voice Services anbieten nimmt zu.»

Kundennutzen

Der wahrgenommene Mehrwert ist ein bedeutendes Kriterium für die dauerhafte Nutzung einer Dienstleistung. Amazon’s Smart Speaker Alexa besitzt beispielsweise über 10 000 Skills, jedoch wird aufgrund des gering wahrgenommenen User Values nur ein sehr kleiner Teil regelmässig beansprucht.

Die Initiierung eines Services durch den Nutzen ist ein wesentliches Argument für einen intelligenten Sprachdienst. Umgekehrt wirkt die Initialisierung von Interaktionen durch den Sprachdienst potentiell eher aufdringlich.

Weiter bieten sprachgesteuerte Dienste einen Mehrwert, wenn sie die Autonomie des Anwenders erhöhen, wie zum Beispiel beim Öffnen und Schliessen von Türen oder der Steuerung von Heizungen.

Die Reife und Fähigkeit der AI-Engine ist ein weiteres, wesentliches Bewertungskriterium. Ist der Service zu komplex und führt immer wieder zur fehlerhaften Durchführung oder Abbrüchen so werden die potenziellen Nutzer sehr schnell Abstand von dessen Anwendung nehmen.

Geschäftswert

Die wenigsten Use Cases liefern einen direkten Ertrag für den Anbieter sondern wirken vielmehr indirekt durch eine Verbesserung des Angebots- und Serviceportfolios.

So können Voice Services als Differenzierungsmerkmal dienen. Ein Beispiel sind Services für das Online Banking die es ermöglichen per Sprachbefehl zu erfahren welches bspw. die höchste Abbuchung oder die letzte Abbuchung von einem Konto
war. Damit steigt potentiell die Nachfrage nach Produkten die sinnvolle Voice Services verwenden, die Wechseltendenz nimmt ab.

Darüber hinaus können Sprachservices aufgrund ihres spezifischen Einsatzes ganz neue Kontaktpunkte zum Kunden ermöglichen. Neue Use Cases sind die Folge: So können bspw. sogenannte Micro Insurances viel einfacher sprachbasiert initiiert
und abgeschlossen werden.

Die Zunahme der Kundeninteraktionen aufgrund von Sprachassistenz generiert darüber hinaus zusätzliche Daten und Informationen über den Kunden die es ermöglichen diesem stärker auf seine Bedürfnisse ausgerichtete Angebote zu unterbreiten. So verwendet Amazon die generierten Informationen via Alexa auch um Angebotsvorschläge für neue Produkte im klassischen Webshop zu unterbreiten.

Darüber hinaus bieten Sprachservices auch die Möglichkeit die Prozesse von Unternehmen zu optimieren und kundenzentrischer auszurichten. Bspw. können diese individuelle Kundenkommunikationen ermöglichen ohne dass der Bedarf eines grossen Call Centers besteht.

Bei derartigen Überlegungen sollte allerdings darauf geachtet werden, dass die Prozesse aus User Perspektive weiterhin konsistent sind und harmonieren. Bspw. ist es aus Perspektive der User Journey wenig sinnvoll, wenn eine Versicherung ihre Schadensmeldung mittels digitalem Sprachassistenten zulässt, jedoch die Abwicklung noch über ein manuelles Schadensformular geführt wird.

Sicherheit

Die Interaktion mit einem Sprachservice hat die Verarbeitung und Weitergabe von Daten zur Folge. Darunter fallen auch solche, die bei klassischen Eingaben mittels Tastatur oder Touch-Display überhaupt nicht erhoben werden können wie beispielsweise Meta-Informationen die aus der Stimme resultieren.

Hinzu kommt, dass Sprachassistenten insbesondere dann einen Mehrwert bieten wenn diese möglichst überall verfügbar sind. Zusammen mit der Tatsache dass diese – anders als klassische Eingabegeräte – potentiell alles gesprochene hören und verarbeiten können sind grundsätzliche Sicherheitsbedenken von Usern durchaus nachvollziehbar. Umgekehrt kann deren Nichtbeücksichtigung zu massiven Imageschäden führen.

Naheliegenderweise eignen sich Sprachservices dann, wenn keine sensiblen Kundendaten benötigt werden. Betrachtet man allerdings den Anwendernutzen so liegt dieser vielfach dort wo sensible Daten verarbeitet werden. Für den Use Case Kontostand tracken besteht bspw. der Bedarf eine sicheres Authentifizierungs- und Authorisierungsverfahren zu nutzen um auf den Kontoaccount zuzugreifen. Möchte ein Accountmanager die Ergebnisse seiner Kundentermine während der Rückfahrt nachbearbeiten, muss sichergestellt sein dass tatsächlich nur dieser die Erfassung vornehmen und auf das CRM zugreifen kann.

Sicherheit können hier einerseits neuartige Authentifizierungs- und Authorisierungsmechanismen bieten. Die Möglichkeit via biometrischen Daten der Stimme eine Person zu identifizieren existieren schon länger, werden aber zunehmend genauer und ausgereifter. Die höhere Genauigkeit geht allerdings mit einem massiv höheren Datenvolumen einher welches übertragen werden muss – insbesondere bei Use Cases die ausserhalb einer WLAN Verbindung Anwendung finden kann dies zur Herausforderungen führen.

Zudem stellt sich die Frage wo letztlich die Daten verarbeitet werden. So ist es bspw. mittlerweile möglich Authentifizierungsinformationen direkt auf dem lokalen Gerät zu verarbeiten – damit besteht keine Notwendigkeit die Daten zentral auf einer Cloud-Plattform wie Alexa zu verarbeiten. Verarbeitet ein Service selbst vertrauliche Daten so ist zu empfehlen diesen auf einer Plattform anzubieten die garantiert dass die Daten nur in bestimmten Ländern gehostet und verarbeitet werden. Bspw. ermöglicht der Speaker der deutschen Telekom die Nutzung von Alexa als auch des eigenen Sprachassistenten Hallo Magenta. Für letzteren existiert das Sicherheitsversprechen, dass Daten nur innerhalb der europäischen Union verarbeitet werden.

Erstpublikation in der Zeitschrift «Professional Computing»

 

Autoren

Rouven Grünig ist Dozent an der Fernfachhochschule Schweiz (FFHS) im Fachbereich Informationssysteme & Internet-of- Things und beschäftigt sich mit neuen Geschäftsmodellen und disruptiven Technologien. Ausserdem ist er Senior Management Consultant und Projektleiter bei der Unternehmensberatung mm1 und treibt dort die Entwicklung digitaler, plattformgetriebener Geschäftsmodelle entlang agiler Vorgehensmodelle voran.

Sebastian Straus ist Fachbereichsleiter für Informationssysteme und Internet of things und Dozent an der Fernfachhochschule Schweiz (FFHS) sowie Partner bei der Innovations- und Digitalisierungsberatung mm1. Er beschäftigt sich mit der Fragestellung, wie mittels der Integration neuartiger Technologien in komplexen Informationssysteme bestehende Geschäftsmodelle optimiert und neue entwickelt werden können.