
Beim SHIFT/CX Konferenzwoche 2026 formulierte Lukas Kauderer (Licily) einen Satz, der die klassische VoC-Logik auf den Kopf stellt: Eventuell werden wir weniger befragen müssen, weil wir mehr interpretieren können. Gemeint war: KI macht unstrukturiertes Feedback so gut auswertbar, dass Skalenbefragungen an manchen Stellen redundant werden könnten — nicht weil sie falsch sind, sondern weil das, was dahinterliegt, endlich zugänglich wird.
Das klingt nach Zukunft. Aber die Entwicklung der letzten drei Jahre, dokumentiert in mehreren SHIFT/CX-Konferenzen, zeigt einen klaren Pfad: von manueller Kategorisierung zu vollautomatisierter Analyse, von der Experten-Domäne zum Team-Tool, von der Ergänzung zur strategischen Infrastruktur.
NPS gibt die Zahl, aber nicht das Warum
Wer kennt das nicht: Eine NPS-Befragung ergibt 7,2. Was das bedeutet, bleibt offen. Der Kommentar darunter gibt die Antwort: „Der Onboarding-Prozess war verwirrend, niemand hat mich zurückgerufen.“ Aber Kommentarfelder auszuwerten braucht Zeit, also bleiben sie liegen.
Branchenweit nutzen Unternehmen nur rund 15 Prozent des ihnen tatsächlich vorliegenden Kundenfeedbacks. Das zeigte eine der Auswertungen aus der SCX26-Session zum Thema Customer Feedback & Experience Analytics. Der Rest ist Datenberg ohne Erkenntnisgewinn. Gleichzeitig steigt die Befragungsfrequenz, was das nächste Problem produziert: Feedback Fatigue. Wer zu oft befragt wird, antwortet kürzer, oberflächlicher, oder gar nicht mehr.
Unstrukturiertes Feedback ist alles, was Kunden frei formulieren: offene Kommentarfelder, Chatprotokolle, Social-Media-Beiträge, Support-Mails. Es entsteht ohne Befragungsaufwand, ist vom Formulierungs-Bias der Frage befreit und liefert eine deutlich reichere Informationsbasis. Das Problem war lange: Es ließ sich nicht systematisch auswerten.
Drei Jahre SHIFT/CX-Coverage: Ein klarer Entwicklungspfad
Caplena, ein Schweizer SaaS-Unternehmen spezialisiert auf die Analyse von offenem Feedback seit 2017, war beim SCX24 im März 2024 mit einem Airline-Use-Case dabei: Tausende Kommentare, automatisch nach Themen geclustert, priorisiert nach Häufigkeit und Sentiment. Was zuvor Wochen dauerte, lief in Stunden.
Damals war das noch Spezialisten-Domäne. NLP-Modelle lieferten gute Ergebnisse, verlangten aber technisches Know-how für Setup und Kalibrierung.
Der nächste Schritt, den Caplena im September 2024 vorstellte, waren Conversational Insights: ein Chatbot-Interface über den eigenen Feedbackdaten. Statt starres Dashboard sollte gezielte Fragen stellen: „Welche Themen tauchen in den negativen Bewertungen der letzten 30 Tage am häufigsten auf?“
Ein Jahr später, beim CX Analytics-Event im September 2025, zog Bosch nach. Die Home Comfort Group wertet mit Caplena mehrere hunderttausend Feedbacks pro Jahr automatisch aus. Kombiniert aus aktiven Befragungen (NPS) und passivem Feedback (Social Media, Support-Kanäle). Ausgabe: Dashboards mit operativem Anschluss, PDCA-Zyklus als Steuerungsrahmen.
Beim SCX26 im März 2026 führte Lukas Kauderer (Licily) die methodische Debatte weiter und machte präzise, was viele nur ahnen.
In der Mediathek: Lukas Kauderer (Licily): KI-Textanalyse von morgen: Wie GenAI, Understanding AI und Agenten die Kundenfeedback-Analyse verändern (SHIFT/CX Konferenzwoche 2026)
Was KI-Textanalyse heute leistet und worauf es dabei ankommt
Sentiment Analysis, also die Bestimmung ob eine Aussage positiv, negativ oder neutral ist, funktioniert mittlerweile sehr zuverlässig. Ihr Wert liegt in der Skalierbarkeit: Hunderttausende Einzelaussagen lassen sich in Sekunden emotional einordnen.
Interessanter für die strategische VoC-Arbeit ist Topic Clustering: das automatische Herausarbeiten von Themen aus dem Freitext, ohne dass Kategorien vorab definiert werden müssen. Der kollaborative Prozess, den Caplena beschreibt, ist dabei kein Kompromiss, sondern Stärke: KI macht Themenvorschläge, die Fachkraft korrigiert und kalibriert. Das sichert Relevanz und verhindert, dass rein technische Kategorien entstehen, die in der Praxis niemand nutzt.
In der Mediathek: Pascal de Buon (Caplena): Die Kunst und Wissenschaft von offenem Feedback im KI-Zeitalter (SHIFT/CX Konferenzwoche 2025)
Kauderer machte beim SCX26 einen Unterschied deutlich, der in der Praxis oft untergeht: Generative KI (wie GPT-Modelle) ist gut darin, vorgegebene Themen zu verschlagworten und Texte zusammenzufassen. Bei der eigenständigen Themenfindung aus unbekanntem Material ist sie deutlich schwächer: Die Ergebnisse variieren je nach Modell-Konfiguration und sind schwer zu reproduzieren.
Diskriminative KI-Modelle, die für die spezifische Aufgabe trainiert werden, liefern höhere Präzision und, entscheidend für den Dauerbetrieb, Wiederholbarkeit. Licily erreicht in aktuellen Benchmarks 86 bis 87 Prozent Accuracy beim Vorhersagen von Sternbewertungen aus unstrukturiertem Text. Das zeigt, wie weit die Fähigkeit zur metrischen Ableitung aus freien Äußerungen bereits ist, und warum das Modell-Matching zur eigentlichen Entscheidung wird.
Noch granularer arbeiten Multi-Level Topic Models: Sie bilden Unternehmensstruktur und inhaltliche Themencluster gleichzeitig ab, für granulare Auswertungen ohne manuelle Vorsortierung.
Aktiv und passiv kombinieren: Der eigentliche Hebel
Was das Bosch-Beispiel besonders zeigt: Der eigentliche Gewinn liegt in der Kombination, über die Automatisierung bestehender Befragungen hinaus. Aktives Feedback (NPS, CSAT-Befragungen) liefert strukturierte, vergleichbare Messwerte. Passives Feedback (Social Listening, Support-Transkripte, Chatverläufe) liefert die Tiefe, den Kontext, ohne zusätzlichen Befragungsaufwand.
Wer nur aktives Feedback auswertet, sieht, was er gezielt gefragt hat. Wer passives Feedback hinzuzieht, sieht, was Kunden tatsächlich beschäftigt.
In der Mediathek: Maurice Gonzenbach (Caplena) & Marian Hoffmann (Bosch): Von Daten zu Taten: Wie Bosch mit Feedback die Customer Journey optimiert (CX Analytics Konferenz 2025)
Fazit: Mehr Tiefe, weniger Befragungsaufwand
Was beim SCX26 deutlich wurde: Die Frage ist nicht mehr ob KI-Textanalyse funktioniert, sondern wie Teams sie in ihre Voice of Customer Programme integrieren. Generative und diskriminative Modelle haben unterschiedliche Stärken; wer das nicht unterscheidet, wählt das falsche Werkzeug für die Aufgabe. Multi-Level-Clustering eröffnet Tiefen, die manuelle Auswertung nicht erreicht. Das Ergebnis sind valide Erkenntnisse aus unstrukturiertem Feedback, ohne weitere Befragungsrunden. Das verändert, wie VoC-Teams arbeiten.
Der nächste Schritt heißt Insight-to-Action: Wie werden diese Erkenntnisse zu Entscheidungen? Textanalyse löst das nicht automatisch. Sie liefert den Input. Präziser, reichhaltiger und schneller als je zuvor. Was damit passiert, ist eine Organisations- und Führungsfrage, keine Technologiefrage.
Auch interessant: Was ist Closed-Loop-Feedback? Der Prozess, der Erkenntnisse systematisch in Maßnahmen schließt.
Wir legen großen Wert auf sachliche und unabhängige Beiträge. Um nachvollziehbar zu machen, unter welchen Rahmenbedingungen unsere Inhalte entstehen, geben wir folgende Hinweise:
- Partnerschaften: Vorgestellte Lösungsanbieter können Partner oder Sponsoren unserer Veranstaltungen sein. Dies beeinflusst jedoch nicht die redaktionelle Auswahl oder Bewertung im Beitrag.
- Einsatz von KI-Tools: Bei der Texterstellung und grafischen Aufbereitung unterstützen uns KI-gestützte Werkzeuge. Die inhaltlichen Aussagen beruhen auf eigener Recherche, werden redaktionell geprüft und spiegeln die fachliche Einschätzung des Autors wider.
- Quellenangaben: Externe Studien, Daten und Zitate werden transparent kenntlich gemacht und mit entsprechenden Quellen belegt.
- Aktualität: Alle Inhalte beziehen sich auf den Stand zum Zeitpunkt der Veröffentlichung. Spätere Entwicklungen können einzelne Aussagen überholen.
- Gastbeiträge und Interviews: Beiträge von externen Autorinnen und Autoren – etwa in Form von Interviews oder Gastbeiträgen – sind klar gekennzeichnet und geben die jeweilige persönliche Meinung wieder.








