Business-IT
23.03.2023
KI für die Suche

„Enterprise Search eliminiert den blinden Fleck“

Intrafind Software AG
Franz Kögl, Vorstand der Intrafind Software AG, erklärt, wie mithilfe Künstlicher Intelligenz aus Datengräbern Informationsschätze werden.
Wenn es um Daten geht, sind Unternehmen erschreckend ineffizient: 68 Prozent aller Daten werden nur ein einziges Mal verwendet und dann nie wieder. Und auf die Datenanalyse entfallen unter 20 Prozent der Zeit, in der man sich mit Daten befasst, während über 80 Prozent für die Suche nach geeigneten Daten, deren Aufbereitung und Verwaltung draufgehen.
Informationen in Unternehmen besser erreichbar zu machen, hat sich die Intrafind Software AG auf die Fahnen geschrieben. Wie das gehen soll und welche Innovationen dabei von Künstlicher Intelligenz zu erwarten sind, darüber spricht com! professional mit Vorstand Franz Kögl.
com! professional: Warum können Unternehmen ohne ein modernes Wissensmanagement nicht bestehen?
Franz Kögl: Weil sie die heutige Informationsflut nicht mehr beherrschen können. Wenn das Management bei der Unternehmenssteuerung nicht alle relevanten Informationen berücksichtigt, weil es sie gar nicht alle kennt, kann es keine fundierten Entscheidungen treffen.
Außerdem sind Unternehmen ohne modernes Wissensmanagement gezwungen, das Rad immer wieder neu zu erfinden. Ein Vertriebsmitarbeiter zum Beispiel erstellt eine Präsentation von Grund auf neu, weil er einfach nicht weiß, dass ein Kollege von ihm schon einmal eine Präsentation für einen ganz ähnlichen Vertriebsfall ausgearbeitet hat, die er als Vorlage verwenden könnte.
Unternehmen benötigen deshalb eine technische Infrastruktur für Wissen. Die Basis dafür ist Enterprise Search, also eine unternehmensweite Suche. Enterprise-Search-Systeme binden alle erdenklichen Informationsquellen an, egal ob sie strukturierte oder unstrukturierte Daten enthalten, und machen sie mit einem einzigen Cockpit integriert durchsuchbar. Damit ermöglichen sie zahlreiche Wissensmanagement-Use-Cases. Mitarbeiter können beispielsweise die Informationen, die ihnen in ihrer konkreten Situation weiterhelfen, schnell und vollständig finden.
Moderne Enterprise-Search-Systeme sind aber auch in der Lage, die Güte von Informationen und Dokumenten zu bewerten. Dazu erzeugen sie automatisch Metadaten, die es ihnen ermöglichen, Informationen miteinander zu vernetzen.
  • Im Quadranten für „Insight Engines“ positioniert Gartner Intrafind Software bei den „Challengers“.
    Quelle:
    Gartner
com! professional: Wie funktioniert ein solches Wissensmanagement in der Praxis, wenn ich im Keller 20 Aktenregale stehen habe oder die Dokumente auf 100 Server verteilt sind?
Kögl: Wenn Akten noch in Papierform vorliegen, müssen sie natürlich erst einmal digitalisiert werden. Dafür stehen Unternehmen zahlreiche Scan-Dienstleister zur Verfügung. Wir können unsere Enterprise Search auf vielen Servern verteilen und somit riesige Dokumentenmengen verarbeiten, sie findbar machen und darauf dann auch Wissensmanagementsysteme aufbauen, je nach Anwendungsschwerpunkt. Über sogenannte Konnektoren, die eine Verbindung zwischen Datenquellen und Suchmaschine sind, kann unser System die unterschiedlichsten Datenquellen anbinden und die Informationen samt Meta­daten und Rechten indizieren, also in einen Such­index schreiben.
Dabei handelt es sich um keinen bloßen Volltext-Index, sondern einen angereicherten und linguistisch normalisierten Index. Dieser Index ist eine mächtige zentrale Wissensdatenbank.
com! professional: Welche Anwendungen ergeben sich daraus?
Kögl: Auf diesem Index können die unterschiedlichsten Applikationen aufsetzen. Das kann eine einfache Suchanwendung sein mit Sucheingabefeld, Trefferliste und vielleicht noch einem zusätzlichen Knowledge-Graphen, wie man ihn von Google kennt. Aber auch Spezialanwendungen wie Frage-Antwort-Systeme sind möglich, die den Nutzern in natürlicher Sprache Auskunft auf Fragen erteilen. Eine häufige Anwendung ist auch die intelligente Lesehilfe. Einer unsere Kunden beispielsweise, ein Heizungsbauer, nutzt unsere Software, um in Dokumenten mit Hunderten von Seiten die Textstellen zu finden, an denen Fehlercodes mit ihren Lösungsbeschreibungen stehen. Die Service-Techniker geben den Fehlercode ein und werden dann direkt zur Lösungsbeschreibung geführt. Wir begreifen unsere Maschine auch als intelligente Lesehilfe.
com! professional: Wissen viele Unternehmen nicht, was sie wissen?
Kögl: Das ist tatsächlich so. Oft indizieren nur einzelne Mitarbeiter mit ihrer Windows-Suche die eigenen Dateien auf dem Notebook und auf Fileserver-Verzeichnissen. Das sind vielleicht zehn Mitarbeiter und die restlichen 800 suchen mühsam einzelne Informationen oder müssen ganz darauf verzichten. Dadurch liegt viel Wissen brach. Eine technische Information über ein spezielles Bonding-Verfahren beispielsweise, die fünf Jahre alt ist, kann auch heute noch relevant sein. Nur liegt diese Information vielleicht in einem großen Storage, in dem sich inzwischen 100 Millionen Dokumente angesammelt haben, und ist deshalb einfach nicht mehr auffindbar. Und der Mitarbeiter, der das Dokument erstellt hat, ist möglicherweise schon in Rente gegangen.
In den seltensten Fällen betreiben Unternehmen tatsächlich Enterprise Search. Manche haben zwar bereits eine Enterprise-Search-Lösung an ihre Filesysteme angebunden, aber eine echte unternehmensweite Suche geht weit darüber hinaus. Die Filesysteme sind ein guter Einstieg, aber ihre volle Stärke entfaltet Enterprise Search, wenn mehrere Datenquellen angebunden werden und Künstliche Intelligenz zum Einsatz kommt. Mit KI können wir die Suchen verfeinern und Informationen quellenübergreifend intelligent miteinander vernetzen und so Informationssilos aufbrechen. Daran arbeiten wir mit Unternehmen heute noch genauso wie vor 15 Jahren.
com! professional: Das heißt, da wartet noch ein großen Kundenpotenzial …
Kögl: Ja, uns wird glücklicherweise nicht langweilig.
com! professional: Wie entsteht aus Daten und Informationen Wissen?
Kögl: Nehmen wir zum Beispiel einfach mal ein Datum. Wenn man vor dieses Datum ein Sternchen setzt, dann entsteht eine Information, weil man es in einen Kontext setzen kann, es wird interpretierbar. Dass eine Person an diesem Tag geboren ist, erschließe ich, indem ich die Informationen konsumiere und in meinem Gehirn verarbeite. Das ist der Weg: Daten, Informationen, Wissen. Eine Suche allein erzeugt kein Wissen, sondern die Informationsverarbeitung, also auf Basis von Informationen Entscheidungen zu treffen oder Schlüsse zu ziehen. Das können heute auch schon die ersten Maschinen, nicht mehr nur Menschen.
com! professional: Welche Datenquellen können Sie anzapfen und einbinden?
Kögl: Wir haben Konnektoren für die unterschiedlichsten Datenquellen. Dazu zählen generische Konnektoren, etwa für Datenbanken, mit denen sich verschiedene Datenbanken anbinden lassen. Darüber hinaus haben wir eine breite Palette von nativen Konnektoren für konkrete Datenquellen, mit denen wir die Spezifika dieser Datenquellen nutzen. Beispielsweise für Microsoft Sharepoint, Microsoft Exchange, Confluence, Service Now, SAP oder Filesysteme. Ob die Datenquellen On-Premises vorgehalten werden oder sich in der Cloud befinden, spielt dabei keine Rolle.
Ein wichtiges Spezifikum von Datenquellen sind etwa die Rechte, die mit Informationsobjekten oder Dokumenten verbunden sind. Unsere Konnektoren können auslesen, welchen Active-Directory-Gruppen Mitarbeiter angehören und auf welche Verzeichnisse sie Zugriff haben. Das ermöglicht eine Rechte-geprüfte Suche. Den Nutzern werden in den Trefferlisten nur Dokumente angezeigt, für die sie auch eine Zugriffsberechtigung haben. Das ist sehr wichtig für die Unternehmen, denn die wenigsten Dokumente sind allgemein einsehbar, die allermeisten sind mit Rechten versehen.
com! professional: Hat die DSGVO diese Vorgehensweise erschwert?
Kögl: Überhaupt nicht. Die DSGVO ist für uns sogar ein zusätzliches Geschäftsmodell, denn sie eröffnet einen idealen Dual-Use-Case für Enterprise Search. Zum einen realisieren wir mit unserer Software iFinder Suchprofile für alle Mitarbeiter, mit denen sie im Intranet, in Filesystemen, in technischen Entwicklungsdokumentationen, in Wikis, in Ticketing-Systemen oder in Service-Dokumenten suchen können. Parallel dazu installieren wir ein zweites Suchprofil speziell für die DSGVO-Verantwortlichen, mit denen sie personenbezogene Informationen schnell und zuverlässig finden können.
Enterprise Search eliminiert für DSGVO-Verantwort­liche den blinden Fleck in den unstrukturierten Dokumenten. In ERP- und CRM-Systemen wie SAP oder Salesforce mit ihren strukturierten Daten lassen sich personenbezogene Informationen gut dokumentieren. Aber unstrukturierte Daten wie beispielsweise Lebensläufe auf Fileservern sind für die DSGVO-Beauftragten erst einmal unsichtbar. Die wurden dort vielleicht einfach versehentlich abgelegt oder man hat vergessen, sie nach Inkrafttreten der DSGVO von dort zu entfernen.
Wir liefern mit dem iFinder eine vortrainierte KI aus, die alle personenbezogenen Daten erkennt. Sobald die Daten automatisch indiziert wurden und das System läuft, können DSGVO-Verantwortliche sowohl Auskunftsersuchen sehr schnell beantworten als auch sukzessive die Datenbestände ordnen und anpassen. Ihre Trefferlisten lassen sich nach DSGVO-Relevanz steuern, sodass kritische Fälle ganz oben stehen. Dann können sie gezielt entscheiden, ob sie die Daten löschen, verschlüsseln oder verschieben.
com! professional: Wissen muss auch wiedergefunden werden. Wie funktioniert Cognitive Search?
Kögl: Früher war Enterprise Search eine reine Volltextsuche. Die Systeme haben einfach Begriffe so, wie sie in den Dokumenten standen, in einen invertierten Wortindex geschrieben. Hat jemand ein Wort in die Suche eingegeben, fand er es in den entsprechenden Dokumenten.
Moderne Systeme ermöglichen dagegen eine Cognitive Search, eine Form der semantischen Suche, die die Absicht hinter eine Suche ermittelt, die Relevanz von Informationen beurteilt und eine natürlichsprachliche Suche unterstützt. Dafür setzen die Systeme linguistische Verfahren, Machine Learning und Natural Language Processing ein. Nutzer können komplette Fragen eingeben wie „Wer ist der Erfinder der Espressomaschine?“ statt „Espressomaschine“ und „Erfinder“. Aus dem „Wer“ oder auch dem „Erfinder“ kann das System ableiten, dass nach einer Person gesucht wird. Es ist in der Lage, Eigennamen von Personen in textlicher Nähe zu „Erfinder“ „Erfinderin“ oder „Erfindung“ und auch Synonymen dafür zu finden und dadurch relevante Treffer in den Trefferlisten ganz nach oben zu setzen. Das ist der Kern von Cognitive Search.
com! professional: Wie gut funktioniert Natural Language Processing inzwischen? Wenn ich im Allgäu wohne und mit einem bayerischen Dialekt komme, funktioniert es dann auch?
Kögl: Ich fürchte nicht. Wir haben vor vielen Jahren einmal versucht, einen Bayern-Proxy zu bauen, um eine in Hochdeutsch gestellte Frage ins Bayerische zu übersetzen.  Aber das ist – zumindest heute noch – zu kompliziert. Trotzdem ist NLP inzwischen eine etablierte Technologie, die dabei hilft, Satzstrukturen zu verstehen.
NLP alleine reicht dafür allerdings nicht, es braucht dazu einen kompletten linguistischen und textbezogenen KI-Stack. Das System muss Wortarten erkennen, dazu ist eine gute Linguistik erforderlich, die die Morphologie einer Sprache abbildet. Außerdem muss es Punkte an Satzenden erkennen, denn ein Punkt bedeutet nicht immer ein Satzende. Dr. Schäfer kann das bestätigen. Und es muss Satzstrukturen erkennen: Was sind Hauptsätze, was sind Nebensätze? Dafür kommen auch Deep-Learning-Verfahren zum Einsatz.
com! professional: Guter Übergang zum Thema KI. Was halten Sie von ChatGPT?
Kögl: Ich bin da etwas zwiegespalten. Es ist sehr interessant, dass eine solche Technologie so eine Aufmerksamkeit hervorruft und ein Qualitätslevel erreicht hat, das schon jetzt für viele Anwendungen ausreicht. Und der Anbieter Open AI nutzt jetzt die Interaktionen der Anwender, um seine KI noch besser zu machen. Andere Anbieter werden nachziehen. In Zukunft haben wir dann virtuelle Assistenten, die untereinander Termine ausmachen, und Maschinen, die in Service-Centern Standardfragen komplett selbstständig beantworten.
  • ChatGPT von Open AI hat die KI-Szene aufgeschreckt. Trotz offenkundiger Schwächen leitet diese Technik eine neue KI-Phase ein.
    Quelle:
    Shutterstock / Juicy FOTO
Dieser disruptive Charakter verursacht aber auch ein zwiespältiges Gefühl. In der Vergangenheit gab es immer wieder Hypes und Hersteller schürten falsche Erwartungen, die sich nicht erfüllen ließen, sodass die Hypes wieder in der Versenkung verschwanden. Bei dieser Technologie ist das allerdings nicht zu erwarten, sie ist ein echter Gamechanger. Sie ist bei der Produktion von synthetischem Content so leistungsfähig, dass sie nicht mehr verschwinden wird.
Eines darf man aber auch nicht vergessen: Large Language Models wie ChatGPT sind zwar sehr mächtig, es handelt sich dabei aber nach wie vor um Narrow AI, also eine KI, die nur einen kleinen Teilbereich abdeckt. Von einer Artificial General Intelligence, also einer allgemeinen KI, sind wir immer noch sehr weit entfernt.
com! professional: Inwiefern kann Transfer Learning, bei dem vortrainierte Modelle angereichert werden, den Einsatz von Künstlicher Intelligenz in Unternehmen beschleunigen?
Kögl: Transfer Learning kann den KI-Einsatz erheblich beschleunigen, indem es den Zeitaufwand für das Training von Machine-Learning-Algorithmen drastisch verkürzt.  Ein konkretes Einsatzgebiet von Transfer Learning ist beispielsweise die Klassifizierung von Dokumenten. Unternehmen können ein vortrainiertes allgemeines Sprachmodell verwenden, das bereits in der Lage ist, Sätze oder die Grundformen von Wörtern zu erkennen. Dadurch müssen sie nicht bei null anfangen, sie müssen das Modell lediglich noch mit eigenen Dokumenten für ihr spezielles Fachgebiet feinjustieren.
Auf diese Weise haben wir bei Unternehmen beispielsweise Systeme realisiert, die eingehende E-Mails automatisiert analysieren und inhaltsbezogen zur Beantwortung weiterrouten. Eine allgemeinsprachliche Antwort à la ChatGPT hilft im Unternehmenskontext nicht weiter.
com! professional: Wo steht Deutschland in Sachen KI, wiederholt sich die Zögerlichkeit, die anfangs auch bei der Cloud zu beobachten war?
Kögl: Wir sind gut in der Forschung und Entwicklung, aber leider zu zögerlich bei der wirtschaftlichen Verwertung. Da sind uns die Amerikaner und Chinesen weit voraus. Wir brauchen auch keine KI-Strategiepapiere der Bundesregierung. Ich glaube auch nicht, dass staatliche Förderprogramme daran viel ändern können. Hierzulande gibt es einfach immer zu viele Diskussionen und Bedenken. Uns fehlt einfach das passende Mindset, um beim praktischen Einsatz von KI eine Führungsrolle einzunehmen. Wenn eines Tages eine generelle KI kommt, dann kommt sie aus China oder aus den USA, aber sicherlich nicht aus Deutschland.
com! professional: Das Thema Nachhaltigkeit wird immer wichtiger. Lässt sich auch so etwas wie eine grüne KI bewerkstelligen?
Kögl: Durch die Entwicklung von Algorithmen, die weniger Energie, weniger Speicher und weniger Kommunikationsbandbreite benötigen. Wichtig sind außerdem Small-Data-optimierte Verfahren, bei denen die KI-Modelle mit weniger Trainingsdaten auskommen und dadurch beim Anlernen weniger Prozessorleistung verbrauchen.
Wir haben beispielsweise unsere KI für die Erkennung von Textpassagen so optimiert, dass sie ab der ersten Annotation verwendet werden kann. Ist für ein Unternehmen eine bestimmte Haftungsklausel besonders interessant, kann es diese Klausel in einem Dokument markieren und labeln. Das System sucht dann im Hintergrund automatisch ähnliche Textstellen. Diese kann das Unternehmen dann wiederum bewerten – und schon hat es mit wenigen Trainingsdaten ein robustes Modell für die Erkennung von Haftungsklauseln entwickelt.
com! professional: Small Data, Wide Data – ist Big Data out?
Kögl: Unter Big Data verstehen wir einfach riesige Dokumentenmengen, mit denen ein Enterprise-Search-System umgehen können muss. Das wird immer ein Thema bleiben. Einer unserer Kunden ist beispielsweise die Johns-Hopkins-Universität, die sechs Milliarden Dokumente in ihrem Suchindex hat.  
Small Data ist ein Ansatz, der KI auch für Unternehmen nutzbar macht, die nicht über riesige Mengen an Trainingsdaten verfügen. Ein Anwendungsbeispiel dafür ist wie gesagt unsere Lösung für die Erkennung von Haftungsklauseln.
Wide Data meint dagegen besonders heterogene Daten einschließlich IoT-Daten, Audio- und Videodateien und Computer-Vision-Daten. Auch damit muss Enterprise Search klarkommen. Wir haben einen Kunden, der weltweit Autositze produziert. Unsere Software sammelt dort auch IoT-Daten aus der Produktion und macht sie intelligent durchsuchbar. Dadurch braucht das Unternehmen heute nicht mehr Tage, um Qualitätsreklamationen zu bearbeiten. Es kann durch eine intelligente Suche innerhalb von Sekunden herausfinden, wo ein Sitzbezug hergestellt wurde, von welcher Maschine er genäht wurde und an welchen Stellen diese Maschine wie viele Stiche angebracht hat – und das auch belegen. Es geht bei Wide Data aber nicht nur darum, möglichst viele verschiedene Daten­typen verarbeiten zu können, sondern auch darum, sie zu vernetzen. IoT-Daten beispielsweise enthalten keinen verständlichen Text, es sind aber strukturierte Daten, die sich wunderbar mit unstrukturierten Datenquellen wie Audiofiles und Videos, Social-Media-Kanälen, Patentdatenbanken oder DIN-Normen verbinden lassen.
Indem wir solche Datentypen intelligent vernetzen und zentral zugreifbar und durchsuchbar machen, ermöglichen wir es Unternehmen, ihren breit gefächerten Datenschatz effektiv und gewinnbringend zu nutzen.
com! professional: Zum Schluss noch ein Blick in die Glaskugel: Wo stehen wir in Sachen Künstliche Intelligenz in fünf Jahren?
Kögl: Wir werden menschlich erstellten Content nicht mehr von synthetisch erstelltem Content unterscheiden können. Und da KI-Anwendungen auch zunehmend mit Low-Code-Systemen entwickelt werden können, wird sich Künstliche Intelligenz einfacher einsetzen lassen und dadurch immer weiter verbreiten.  KI wird ein fester Bestandteil unseres Arbeitsalltags sein und viele Berufe massiv verändern. Das wird eine große gesellschaftliche Herausforderung. Für uns als Enterprise-Search-Anbieter wird KI für die Optimierung der Suche noch wichtiger sein als heute. Ersetzen wird sie Suchmaschinen aber nicht.
Zur Person und Firma
Franz Kögl war nach einem Studium der Elektrotechnik und einem Aufbaustudium zum Wirtschaftsingenieur mehrere Jahre für mittelstän­dische IT-Unternehmen tätig. Im Jahr 2000 gründete er zusammen mit Bernhard Messer in München die Intrafind Software AG. Die beiden Firmeninhaber entwickelten das Unternehmen zu einem etablierten internationalen Software-Hersteller für Enterprise Search und AI-basierte Anwendungen.
Intrafind Software AG
Das Software-Unternehmen wurde im Jahr 2000 von Franz Kögl und Bernhard Messer in München gegründet. Intrafind ist spezialisiert auf die unternehmensweite Suche und KI-basierte Vernetzung von Informationen sowie auf intelligente Dokumentenanalyse. Die Produkte aus dem Bereich Enterprise Search ermöglichen es Mitarbeitern in Unternehmen, relevante Informationen schnell zu finden und zu verknüpfen. Mehr als 80 Konnektoren zapfen Datenquellen an, die durchsuchbar gemacht werden sollen, und stellen die Verbindung zur Suchmaschine her. Infrafind beschäftigt mehr als 60 Mitarbeiter und hat täglich etwa drei Millionen Nutzer in Behörden und Unternehmen. https://intrafind.com

mehr zum Thema