2345361

Roboter-Texte - der bessere Journalismus?

25.04.2018 | 10:03 Uhr |

80 Prozent aller Nachrichten sollen 2022 von Robotern geschrieben werden, prophezeit die als seriös und zurückhaltend bekannte BBC - ein gigantischer Markt entsteht, der die Medien weiter verändern wird und der deswegen viele Versprechen auslöst, die nicht gehalten werden können.

„Generieren Sie mit der Software beliebig viele redaktionelle Texte, vollautomatisch, in Echtzeit, auf höchstem Niveau sowie in jeder Sprache“ – so wirbt ein Berliner Anbieter um Kunden für seine Plug-and-Play-Software, mit der jeder „automated content“ erzeugen kann. Theoretisch ist das wirklich möglich und die farbenfrohe Usability der Anwendung ist zumindest marketinggerecht.

Ein Textgenerierungsanbieter aus Süddeutschland, der seine Lösung schon deutlich länger anbietet, macht zumindest transparent deutlich, dass ohne fachliche Unterstützung ab einer bestimmten Komplexitätsgrenze nichts mehr geht. Plug and Play beim Erstellen von „Roboter-Texten“ erreicht seine Grenze dort, wo mehr passieren soll als beispielsweise für einen Produkttest Winterreifen miteinander zu vergleichen. Und dies nicht für einen redaktionellen Teil, sondern für die Shopping-Seiten. Dann ist das „höchste Niveau“ meist schon erreicht.

Denn die Herausforderung besteht nicht darin, aus fertigen Datenanalysen Texte zu erstellen. Das könnten in den meisten Fällen auch die Plug-and-Play-Tools, bestätigt der Hamburger Computerlinguist Dr. Patrick McCrae, aber: „Die Daten sind das Problem, sowohl in der Anbindung als auch der Analyse. Meistens sind die vermeintlichen Input-Daten noch unstrukturiert, inkonsistent, lückenhaft, rauschig - oder schlichtweg gar nicht verfügbar. Wenn Datenbestände eingebunden werden können, besteht eine zentrale Aufgabe darin, analytisch zu ermitteln, welche der Datenpunkte überhaupt journalistisch interessant und somit berichtenswert sind“.

Gefahr journalistisch falscher Texte

Doch selbst vermeintlich korrekte Daten können noch überraschen. Bei einem Projekt für das „Handelsblatt“ zum Beispiel fiel einer von Experten eingesetzten Software eine Inkonsistenz auf, die für einen Journalisten ohne tiefere Daten-Erfahrung nie sichtbar gewesen wäre: Für einen Börsenindex wurde kurz nach Handelsbeginn vom Datenlieferanten in dessen Datenstrom für mehrere Minuten und mehrere Werte ein und derselbe Kurs wiederholt, was aufgrund des geringen Handelsvolumens in diesem Index kaum merklich war. Aber eben journalistisch falsche Texte zur Folge hatte.

Welcher Journalist hat Erfahrungen mit Python und Pandas Dataframes? Er oder sie müssen mit diesen oder ähnlich elementaren Programmier-Tools nicht selbst coden können, aber ein mehr als oberflächliches Verständnis dafür, was diese Anwendungen können und was sie nicht können, ist sehr hilfreich. Nur so lassen sich erhebliche Reibungsverluste vermeiden, die entstehen, wenn Redaktionen inhaltliche Erwartungen haben, die durch die Technologie nicht eingelöst werden können.

Auch interessant : Künstliche Intelligenz: Wozu sie heute schon imstande ist

Umgekehrt hat ein genialer Entwickler oft keinen journalistischen Blick auf Datenströme oder Data Lakes . Diese Lücke schließen Plug-and-Play-Anbieter natürlich nur zu gerne, zu sehr ansehnlichen Tagessätzen oder üppigen Projekthonoraren. Die Datenanbindung kommt als weitere zusätzliche und lukrative Einnahmequelle fast immer dazu.

Im Februar rief eine renommierte Wochenpublikation an: Man hätte im vergangenen Jahr für eine beträchtliche Summe eine Softwarelizenz erworben, um selbst automated content zu erstellen. Nichts wirklich Spektakuläres, nur Fußball-Berichte und Börse. „Nur“ Fußball und Börse?

Noch viel Nachjustierung erforderlich

Eine renommierte Tageszeitung lässt seit längerem die weniger wichtigen Begegnungen der Bundesliga von einem Robot-Anbieter zusammenfassen, der von seiner eigenen Software behauptet, jeder Kunde könne damit auch anspruchsvolle Texte erstellen lassen. Die Wahrheit: Ohne ständige Nachbesserung durch die eigenen Entwickler ist die Qualität nicht ausreichend, sind die Beiträge zu fehlerhaft. Die Redakteure des Kunden hätten in Eigenregie überhaupt keine Chance, mehr als einen vernünftigen Halbsatz aus den Daten zu generieren.

Ein internationaler Sportnachrichtendienst hat seine „do-it-youself“-Versuche mittlerweile ebenfalls eingestellt.

Die Annahme, Textgenerierung sei in der Komplexität inzwischen auf dem Schwierigkeitsgrad von Excel oder Wordpress angekommen, ist ein Werbeversprechen der Anbieter, aber völlig realitätsfern. Der Hamburger Wissenschaftler McCrae: „Ein Textgenerierungssystem ist kein Content-Management- oder Redaktionssystem. Die zentrale Herausforderung der Textgenerierung ist das Handling der Daten. Dieser Schritt ist und bleibt komplex und kann deutlich effizienter und effektiver von Experten bewerkstelligt werden, die ein tieferes technisches Verständnis mitbringen. Mit dem Ansatz, technisch komplexere Schritte bei technischen Experten zu belassen, lassen sich unserer Erfahrung nach die Setup- und Wartungszyklen in der Textgenerierung erheblich verkürzen“.

Content-Maschinen noch nicht marktreif

Ein spanischer Computerlinguist konnte einem Kunden helfen, der sich todesmutig selbst an die Textgenerierung von Börsen-Nachrichten in vier Sprachen gemacht hatte und nie über den fehlerhaften ersten Absatz eines Artikels hinausgekommen war, auch nach vier Wochen nicht. Das Portal schaltete sein Plug-and-Play-Tool erleichtert ab und bekommt von dem spanischen Team seitdem täglich problemlos rund 120 Börsenmeldungen, in vier Sprachen, ohne Fehler. Für knapp über 3.000 Euro monatlich. Die Lizenzgebühren für das deutsche Tool lagen für den gleichen Umfang ganze 400 Euro niedriger, ohne jeden Support, ohne jede Datenanalyse.

Auch betriebswirtschaftlich macht die selbstfahrende Content-Maschine also für Redaktionen keinen Sinn. Es sei denn, es geht um den tausendfachen Vergleich von Winterreifen für Shopping-Seiten.

Lesen Sie auch : Content-Management-Systeme im Überblick

0 Kommentare zu diesem Artikel

PC-WELT Marktplatz

2345361