Trends bei Conversational AI: Wird die Kommunikation immer menschlicher?

image-39149

In einem scheint die Fachwelt sich einig: Die Nachfrage nach Conversational AI wird steigen, insbesondere im Contact Center. Wie das IT-Beratungsunternehmen Gartner prognostiziert, wird Conversational AI die Arbeitskosten von Contact-Center-Agenten im Jahr 2026 um 80 Milliarden US-Dollar senken. Rund 17 Millionen Contact-Center-Agenten gibt es laut Gartner derzeit weltweit.  

Das Dilemma in vielen Unternehmen: Die Agenten sind knapp und die Arbeitskosten müssen gesenkt werden, da sie bis zu 95 Prozent der Contact-Center-Kosten ausmachen könnten, so Gartner. Conversational AI hingegen mache die Arbeit von Agenten effizienter und effektiver und verbessere gleichzeitig das Kundenerlebnis. Bis 2026, prognostiziert Gartner außerdem, werde jede zehnte Agenteninteraktion automatisiert sein.  

Vor diesem Hintergrund diskutiert die Expertenwelt fleißig, welche (technologischen) Trends in Sachen Conversational AI uns in den nächsten Jahren erwarten werden. Wir haben uns im Folgenden einige uns relevant erscheinende Themen herausgepickt. 

Conversational Design für kundenorientierte Dialoge  

Ein zentraler Trend in vielen Diskussionen - u.a. auch im Rahmen der Shift/CX Trends-Veranstaltung im Dezember 2022 - ist der Ruf nach einer Fokussierung auf das Benutzer- und Kundenerlebnis im Conversational Design. Die ersten Generationen der "Conversational Interfaces" waren vor allem durch ein limitiertes Gesprächsverständnis sowie durch eine sehr technische Dialogführung geprägt. Für den weiteren Erfolg der Conversational-Ansätze braucht es auch bei der Umsetzung dieser Kundenschnittstellen eine klare Kundenorientierung.

Effektives Gesprächsdesign beinhaltet die Berücksichtigung von Empathie, Inklusion und Zugänglichkeit. In diesem Zusammenhang wird auch ein Anstieg des ethischen KI-Designs prognostiziert, das sich nicht nur auf Text und Sprache, sondern auch auf nonverbale Signale bezieht. Hier könnten multidisziplinäre Teams in Unternehmen aus Designern, Datenwissenschaftlern und Geschäftsstrategen, die Daten nutzen, zu besseren Erfahrungen führen. 

Insgesamt gesehen werde sich der Fokus bei Conversational AI mehr auf die Menschen verlagern als auf die Technologie selbst. Mit der Weiterentwicklung von synthetischen Medien, virtuellen Avataren und Sprachmodellen sind könnten menschenähnliche Konversationen ein erreichbares Ziel sein. Vorausgesetzt, der Fokus liegt verstärkt auf Conversational Design und der Erfahrung der Benutzer*innen. 

Ausweitung des Dialogvermögens durch Large Language Models (LLMs)  

Die öffentliche Zugänglichkeit von ChatGPT & Co hat im November 2022 in der öffentlichen Wahrnehmung den Standard für Dialogsysteme auf ein neues Level gesetzt. Mit den großen Sprachmodellen wird hier nun ein wachsendes Sprach- und Dialogvermögen der Lösungsansätze gesehen, die weit über die spezifisch antrainierten Themenfelder hinausgehen und komplexe Gespräche ermöglichen. 

Large Language Models (kurz LLMs) als ein Teilbereich künstlicher Intelligenz werden auf große Mengen von Textdaten trainiert (wie im Fall von ChatGPT auf das komplette Internet), um menschenähnliche Antworten auf Dialoge oder andere Eingaben in natürlicher Sprache zu erzeugen. Um das zu gewährleisten, verwenden LLMs Deep-Learning-Modelle, die mehrschichtige neuronale Netze verwenden, um komplexe Daten zu verarbeiten, zu analysieren und Vorhersagen zu treffen. 

Schon heute zeigen LLMs erstaunliche Fähigkeiten in der Beantwortung von Fragen sowie der Fortführung oder Zusammenfassung von Texten. Ihr Können reicht in vielen Fällen an das eines menschlichen Kommunikationspartners heran.  

Multi-Channel- und Multimodal-Lösungen 

Unternehmen suchen bei Conversational-AI-Technologie immer öfter nach Multi-Channel- und Multimodal-Lösungen. So kann etwa ein Multi-Channel-Chatbot kanalübergreifend mit Nutzer*innen kommunizieren. Kanäle können beispielsweise die Website und der Facebook-Messenger sein. Multi-Channel-Lösungen beziehen sich also auf die Übergabe von einem Kanal zu einem anderen.  

Multimodale Lösungen für Conversational AI nutzen die Gerätefunktionen voll aus. Ein Beispiel: Ein Kunde ruft bei einer Fluggesellschaft an, um seinen Sitzplatz für einen gebuchten Flug zu ändern. Das interaktive Sprachdialogsystem sagt, dass es einen verfügbaren, alternativen Sitzplatz gibt. Würde das System jetzt noch den Sitzplan an das Gerät senden, während das IVR den verfügbaren freien Sitzplatz mitteilt, könnte der Kunde sehen, ob sich der Sitzplatz am Gang, in der Mitte oder am Fenster befindet. So könnte er direkt entscheiden, ob er ihn auswählt oder nicht.  

Experten erkennen bei potenziellen Kunden eine zunehmende Nachfrage nach dieser multimodalen Anwendungsform von Conversational AI. Die meisten Kunden würden zwei oder mehr Kanäle nutzen – oft beginnend mit Sprache, um dann in Kanäle wie WhatsApp oder Webchat zu wechseln. Multimodale Lösungen würden die Übernahme von noch komplexeren Aufgabe durch dialogorientierte KI ermöglichen. Der Trend gehe von einfachen Chatbots im FAQ-Stil zu eher transaktionalen Anwendungsfällen. Prognostiziert wird, dass Nutzer*innen immer häufiger visuelle und immersive Erfahrungen machen wollten.   

Lernpfad Customer Journey Management

Virtuelle Avatare 

Auch virtuelle Avatare können neue Möglichkeiten für den Vertrieb und den Service in Unternehmen eröffnen, indem sie Mitarbeitende entlasten und Kunden ein personalisiertes Serviceerlebnis bieten. Die Vorteile gegenüber textbasierten Chatbots: Bei einem virtuellen Avatar stehen wir einer „Person” von Angesicht zu Angesicht gegenüber. Wir halten Augenkontakt und erkennen Körpersprache und Mikroausdrücke. Virtuelle Avatare könnten ein gewisses Einfühlungsvermögen und Verbundenheit bieten, was sonst nur bei einem Gespräch zwischen echten Menschen möglich ist.  

Schon heute gibt es virtuelle Avatare, die dabei unterstützen, mehr Empathie bei der Kommunikation mit einem Computer zu zeigen. Dafür nutzen sie zum Beispiel Gesichtserkennung und automatische Spracherkennung, um Menschen zu identifizieren und ihre Emotionen zu interpretieren. Diese Technologie ermöglicht das Anpassen des Tonfalls und der Körpersprache entsprechend der jeweiligen Situation.  

Kontextbasierte Personalisierung 

Die Nutzung von Kontext und Personalisierung kann zu einer positiven Customer Experience führen. Je mehr Informationen Unternehmen über (potenzielle) Kunden wissen, desto weniger Fragen müssen sie stellen. Experten prognostizieren diesbezüglich einen Anstieg der Personalisierung in Anwendungsfällen für Contact Center – insbesondere über Kanäle und Geräte hinweg. 

Eine kanalübergreifende Personalisierung wird es Unternehmen ermöglichen, mehr zu automatisieren und eine bessere Kundenzufriedenheit zu erreichen. Die Prognosen stützen sich darauf, dass Nutzerinnen und Nutzer häufiger dazu bereit seien, personenbezogene Daten mit Lösungen für Conversational AI zu teilen. 

Low Code/No Code: Conversational AI selbst entwickeln? 

Diese Frage ist nicht einfach zu beantworten, weil die Anwendungsfälle für Conversational AI viel zu verschieden und je nach Unternehmen individuell sind. Die Alternative der Eigenentwicklung kann für Unternehmen prinzipiell eine Herausforderung darstellen, weil es schwierig werden kann, alle Dinge vorherzusagen, die Benutzer*innen im Dialog mit der KI sagen beziehungsweise wie sie sie sagen könnten.  

Bei der Entwicklung effektiver Lösungen für Conversational AI einschließlich der Auswahl möglicher Anwendungsfälle gibt es mehrere Aspekte zu beachten:  

  • Erstellen eines Modells für Natural Language Understanding (NLU) mit Trainingsphrasen 
  • Design des Gesprächsablaufs 
  • Back-End-Integrationen 
  • Testen, Überwachen und Messen 

Und dies alles in einem kontinuierlichen iterativen Zyklus.  

Ob sich Unternehmen für die Eigenentwicklung von Lösungen für Conversational AI entscheiden oder doch lieber eine fertige Lösung kaufen, hängt auch von den Fähigkeiten des Teams, den verfügbaren Ressourcen und den Time-to-Market-Zielen ab. Bei der Eigenentwicklung jedenfalls kommen Unternehmen nicht um die Themen Low Code” oder No Code” herum. Es wird prognostiziert, dass sich angesichts begrenzter Budgets und der einfachen Bereitstellung viele Unternehmen nach Low-Code-Lösungen umschauen werden. 

Im Raum steht auch eine Konsolidierung auf dem Anbietermarkt von Lösungen für Conversational AI, da die Technologie-Landschaft mit ähnlichen Tools und Plattformen bereits gesättigt sei.