Ville Somppi von M-Files über künstliche Intelligenz, Wissensarbeit und strukturierte vs. unstrukturierte Daten
Künstliche Intelligenz (KI) verändert täglich die Wissensarbeit, denn jede neue Innovation entwickelt sich schneller und schneller. Wir haben uns mit Ville Somppi, Vice President of Industry Solutions bei M-Files, darüber unterhalten, was diese Änderungen für die Zukunft von Wissensarbeitern bedeuten, und ob bzw. wie KI Organisationen helfen kann, die Lücke zwischen strukturierten und unstrukturierten Daten zu schließen.
Künstliche Intelligenz und die Zukunft der Arbeit
Einige Führungskräfte sagen voraus, dass KI die Arbeit vollständig abschaffen wird. Welche Auswirkungen wird KI Ihrer Meinung nach auf die Zukunft der Arbeit haben?
KI wird den menschlichen Einfallsreichtum und die Kreativität sogar fördern. Computer tun das, was man von ihnen verlangt. Wenn wir die richtigen Fragen stellen, gibt uns eine KI auch eine Antwort. Im Falle der generativen KI ist der Output wahrscheinlich schon zu 90 Prozent da, vorausgesetzt, der Nutzer hat eine klare Vorstellung davon, was er vorhat. KI wird Wissensarbeitern ganz neue Möglichkeiten für die Automatisierung in ihrem Bereich bieten.
Eine KI weiß nicht einfach von sich aus, was erstellt werden soll – es muss ein Mensch sein, ein intelligenter Akteur, der die KI anweist, etwas zu tun und dann überprüft, ob das Ergebnis wie gewünscht ausfällt. Der zeitaufwändige Teil kreativer Arbeit, also wenn Assets basierend auf Ideen erstellt werden, wird sich beschleunigen. Aber KI wird Wissensarbeiter, die Visionen haben und ihre Kreativität einsetzen, um diese Vision Wirklichkeit werden zu lassen, nicht ersetzen.
Der Weg zu Knowledge Work Automation
Wenn von der Optimierung der Arbeitsleistung geredet wurde, ging es meist um das Datei- und Prozessmanagement, dem ersten Schritt auf dem Weg zur Automatisierung. Ist diese Entwicklung das Ergebnis größerer Bandbreite und Verarbeitungsgeschwindigkeiten, und war das schon immer der Traum, oder hat eine Veränderung stattgefunden?
Das war schon immer der Traum, es war nur ein sehr langsamer Prozess. Die Geschichte der IT ist nur 50 oder 60 Jahre alt. Die ersten Computer waren gerade eben in der Lage, Daten zu speichern. Irgendwann kamen grafische Schnittstellen auf den Markt und Informationen ließen sich auf einem Bildschirm visualisieren statt nur auf dem Papier. Dank der grafischen Benutzeroberfläche musste man kein Informatiker mehr sein, um zu verstehen, was ein Computer tut, aber: wichtige Aufgaben wie die Verwaltung von Dokumenten und das Workflow-Management wurden weiterhin manuell erledigt.
Die Vision war schon immer die Automatisierung von Wissensarbeit und eine Innovation, die jede Arbeit erleichtert und die Produktivität steigert. Und dass man einem Computer einfach in gesprochener oder geschriebener Sprache sagen kann, was er tun soll. Vor Jahrzehnten konnten Computer wirklich coole, leistungsstarke Berechnungen oder Simulationen durchführen, um etwas so Komplexes wie eine Marsmission zu planen. Bald wird man sagen können: „Hey, ChatGPT, kannst du für mich ein Marslandegerät anhand dieses Beispiels entwerfen?“ Anstatt Tausende von Stunden selbst den 3D-Entwurf am PC zu zeichnen, wäre es viel schneller, vom Computer einen brauchbaren Entwurf zu bekommen, den man dann perfektionieren könnte. Es muss nicht alles wörtlich erklärt werden – das ist die Revolution.
Strukturierte vs. unstrukturierte Daten
Viele unserer heutigen Systeme – von der Dateiverwaltung bis zu Geschäftsprozessen – sind auf strukturierte Daten wie Word- oder PowerPoint-Dateien ausgerichtet. Aber Posts auf X (ehemals Twitter) können als Beweismittel vor Gericht zulässig sein, und die zählen als unstrukturiert. Gibt es bei der Wissensarbeit wirklich einen Unterschied zwischen strukturierten und unstrukturierten Daten, oder sind die Grenzen einfach nur verwischt worden?
Traditionell brauchen Computer eine Struktur, um Daten zu verstehen [INTERNER LINK: „Strukturierte und unstrukturierte Daten“]. Nehmen wir an, der Name Ihres Unternehmens besteht nur aus Text. Ein strukturiertes System wie ein Customer Relations Management-Tool (CRM) kann eine ID-Nummer lesen, die zum Namen Ihres Unternehmens gehört, und dann behält es diese ID und weiß immer, das diese Nummer für Ihr Unternehmen steht. Unstrukturierte Daten, die von Menschen verfasst wurden und keine fest definierte Bedeutung haben, werden von einem Computer nicht verstanden – es ist einfach irgendein Text.
Bei den heutigen großen generativen Sprachmodellen (Large Language Model) ist die Struktur weniger wichtig, weil Computer unstrukturierte Daten effizienter verarbeiten können, um die Bedeutung und alle interessanten Datenpunkte zu extrahieren. Angenommen, ein Vertrag gilt für das Jahr 2024. Wenn wir diesen Zeitraum als strukturierte Daten extrahieren, weiß der Computer, wann der Vertrag gilt. Mit generativer KI und deren Inferenzmaschine können Sie fragen, was ein bestimmtes Element in einem unstrukturierten Asset bedeutet, und die KI versteht es, weil sie unstrukturierte Inhalte lesen und interpretieren kann.
Es gibt einen Unterschied zwischen strukturierten und unstrukturierten Daten. Erstere sind dazu bestimmt, von Computern gelesen und verstanden zu werden, während letztere vollkommen variabel sind – Computer hatten es bisher schwer, diese zu verstehen. Heute ist es nicht mehr so wichtig, dass alles strukturiert vorliegt, aber Computer untereinander kommunizieren auch weiterhin mithilfe strukturierter Daten. Der Ausdruck „Viertel nach zwölf“ lässt sich nicht wirklich berechnen, weil ein Computer standardmäßig nur Text sieht. Ein Large Language Model wandelt diesen menschlichen Ausdruck in für den Computer verständliche strukturierte Daten um, sodass normale Berechnungen möglich sind.
Die Bedeutung der Informationsabsicht
Warum sind strukturierte Daten für Computer leichter zu verarbeiten? Und wie verarbeitet M-Files unstrukturierte Daten?
Bei strukturierten Daten ist nicht nur der Wert der Daten bekannt, sondern auch die Bedeutung, die Art und die Informationsabsicht. Eine Datenart ist zum Beispiel ein Firmenname. Jedes System, das diesen Datenpunkt verwendet, weiß, dass sich die Bezeichnung auf den Namen eines Unternehmens und diese Art von Daten bezieht. Strukturierte Daten können einem System helfen, zwischen einem Textfeld und einem Zahlenfeld zu unterscheiden. Und ob es sich bei der Zahl in einem Zahlenfeld um einen Geldbetrag oder eine Postleitzahl handelt. Mithilfe strukturierter Daten wissen Computersysteme, was wir mit einer bestimmten Information meinen.
Wenn Sie einen Vertrag in M-Files hochladen, handelt es sich nur um ein Dokument. Es ist unstrukturiert und wurde von Menschen erstellt, aber es lassen sich interessante Datenpunkte als strukturierte Metadaten extrahieren. Da M-Files Dokumente mit Metadaten wie z. B. der Vertragsgültigkeitsdauer kennzeichnen kann, werden Teile dieser unstrukturierten Daten in strukturierte Daten umgewandelt. So können Computer sie verarbeiten und dann z. B. interne Vorschriften darauf anwenden und alle Arten der Knowledge Work Automation ermöglichen.
Generative KI kann das Budget strapazieren
Hat das Datenformat einen Einfluss auf die Kosten für den Einsatz generativer KI? Ist die Verarbeitung unstrukturierter Daten teurer, und haben neue Sprachmodelle dies geändert?
Der Einsatz von generativer KI könnte kostspielig sein, weil der Computer sehr viel Verarbeitungsarbeit leisten muss, um den Inhalt zu verstehen, das vorhandene interne Datenchaos zu durchforsten und eine bestimmte gültige Vertragslaufzeit zu finden. Wenn Sie das eine Million Mal machen, zahlen Sie wahrscheinlich 50.000 Dollar an den Anbieter der generativen KI, weil die KI so viel harte Arbeit leistet. Im Gegensatz dazu könnten diese Informationen auch einfach aus den Metadaten ausgelesen werden.
Wir können das einfach immer wieder aus einem strukturierten Datenfeld tun, und das zu geringen Kosten, weil es so simple ist. Large Language Models sind einfach nur gigantische mathematische Formeln, die basierend auf einem tiefen neuronalen Netz (Deep Neural Network) arbeiten. Man gibt einen Eingabewert ein und erhält einen Ausgabewert. Aber die Kosten für die Durchführung der mathematischen Operation sind sehr hoch im Vergleich zu den normalen Dingen, die wir schon vor 50 Jahren tun konnten.
Das Gedanken-Kostenelement ist sehr wichtig. Wir können nicht einfach die gesamte alte IT durch künstliche Intelligenz ersetzen und generative KI für alles nutzen, denn das ist etwa eine Milliarde Mal teurer.
Ich habe hier ein Smartphone mit mehr Rechenleistung und mehr Kontrolle über die Informationstechnologie als alle Supercomputer aus den 90ern. Large Language Models und generative KI, die Sprache verstehen, gibt es überhaupt erst, weil wir heute so viel mehr Rechenleistung haben. Aber das macht es nicht billig, sondern nur möglich. Jedes Unternehmen, das diese Technologien einsetzt, muss eine Kosten-Nutzen-Analyse durchführen und sich fragen: Wofür genau sollten wir diese coolen, neuen, teuren Technologien einsetzen, im Gegensatz zu günstigeren, eher mechanischen, traditionellen IT-Technologien?