Allein 100 Millionen Endgeräte mit Amazons Alexa wurden weltweit verkauft und Experten erwarten, dass bereits im nächsten Jahr etwa die Hälfte aller Suchanfragen im Netz per Stimme erfolgt und nicht mehr über eine Tastatur. Grund genug, dass sich t-online.de mit diesem weiten Feld befasst. Nach zwei Jahren intensiver Arbeit am Thema zeigt sich: An vielen Stellen steht die Technologie noch am Anfang. Wer Voice-Produkte mit echtem Mehrwert für die Nutzer anbieten will, muss den Mut zu Experimenten haben, technische Expertise entwickeln und am Ball bleiben.
Bei t-online.de (Ströer Digital Publishing GmbH in Frankfurt und Ströer News Publishing GmbH in Berlin) begann das Voice-Experiment vor knapp zweieinhalb Jahren mit der Einführung von Amazons Echo, besser bekannt unter dem Namen seines Betriebssystems Alexa. Die Frage war, wie redaktionelle Inhalte von t-online.de darüber verfügbar machen können. Im Fokus stand der Alexa-„Skill“, also die Fähigkeit des Amazon-Geräts, auf eine bestimmte Aufforderung zu reagieren. Würden Nutzer Nachrichten akzeptieren, die ihnen von einer (wenn auch sympathischen) synthetischen Stimme vorgelesen werden? Allein aufgrund der enormen Verbreitung von Android stand neben Alexa auch schon früh Google Assistant im Blick.
In der Entwicklung zeigten sich große Unterschiede zwischen Alexa und Google Assistant. Mit dem Ziel, t-online.de News-Skill einen möglichst natürlichen Interaktionsverlauf per Spracheingabe nachzuzeichnen, stieß Ströer bei Amazon beispielsweise schnell an Grenzen: Im Gegensatz zum Google Assistant, der tatsächlich versucht, Suchanfragen im Sinne des Nutzers zu verstehen, muss für Alexa eine Benutzerschnittstelle für die Sprachein- und ausgabe erstellt werden, ein sogenanntes Voice User Interface (VUI). Dort wird unter anderem festgelegt, welche Kommandos Alexa versteht, welche Fragen gestellt werden können und welche Antworten Alexa geben soll. Kommandos, die das Skript nicht vorsieht, kann das System nicht abbilden. Vor allem aber kann es nicht dazulernen.
Noch deutlicher klafften Wunsch und Wirklichkeit dann beim Praxistest im Markt auseinander: Die Nachfrage nach vorgelesenen Nachrichten war deutlich geringer als zunächst angenommen. Nutzer bevorzugen eher einfache Nutzungsszenarien wie „Alexa, erzähl mir einen Witz“. Der t-online.de Skill hört deshalb jetzt unter anderem auf „Alexa, was sind die Nachrichten?“ und liefert dann die Voice-Version des „Tagesanbruch“-Newsletters von t-online.de Chefredakteur Florian Harms.
Ein Podcast-Format für den „Tagesanbruch“ war das zweite großes Voice-Projekt, und es verlief von Anfang an vielversprechend. Für die Wahrnehmung als Medienmarke spielt der „Tagesanbruch“ als inhaltliches Flaggschiff eine zentrale Rolle. Deshlab wurde daher bei der Entwicklung des Formats bewusst auf professionelle Sprecher gesetzt. Der „Tagesanbruch“ punktet darüber hinaus mit seiner journalistischen Form: Hier werden Nachrichten nicht einfach nur vermeldet, sondern erklärt, kommentiert und eingeordnet. Damit wurde ein Nerv getroffen, wie die stetig steigenden Nutzerzahlen zeigen. Pro Woche erzielt der Podcast mehr als 30.000 Abrufe über alle Plattformen. Besonders erfreulich ist, dass wir vor allem auf externen Plattformen wachsen – und das ganz ohne Werbemaßnahmen.
Um über den „Tagesanbruch“ hinaus auch kurzfristig Audiobeiträge wie Interviews oder Kolumnen produzieren zu können, hat die Redaktion inzwischen ein eigenes Tonstudio in den Räumen der Redaktion in Berlin eingerichtet und arbeiten dort mit einem eigenen Voice-Redakteur.
Das Fazit: Hochwertig produzierte, journalistische Inhalte haben eine gute Chance, auf dem Voice-Markt herauszustechen und erfolgreich zu sein.
Auch wenn Voice noch vielfach experimentellen Charakter hat, wird es sich als Zugangsweg zu bestimmten Informationen und Diensten etablieren. Dies wird hauptsächlich von den Fähigkeiten der Endgeräte-Software abhängen, die durch die Fortschritte bei Machine Learning und künstlicher Intelligenz stetig verbessert werden. In jedem Fall steht Voice erst am Anfang der Entwicklung.
Wie gut die Ideen sind, hängt dabei ganz schlicht auch an der Intensität, mit der Konsumenten die Geräte und ihre Möglichkeiten selbst nutzen. Aus diesem Grund hat Alexa einen festen Platz in der Berliner t-online Redaktion – oder vielmehr viele Plätze, denn die Amazon-Geräte finden sich dort überall. Dass Alexa zum redaktionellen „Morgenbriefing“ dank einer Anbindung an das Ströer Data-Warehouse wichtige Kennzahlen vorträgt wie den mobilen Anteil am t-online.de-Traffic, die bestlaufenden Artikel oder die Gesamtzahl der Visits, ist täglich gelebte Routine.