+49 40 790 117 97 info@sab-team.com

Menu
Das Wissen im Unternehmen transparent machen

Das Wissen im Unternehmen transparent machen

By In Allgemein On 1. Dezember 2021


Wertvolle Informationen eines Unternehmens befinden sich oft in Dateien der Formate MS-Word oder PDF. Wer darin etwas suchen möchte, ist meist auf den Einsatz eines Dokumentenmanagement-Systems angewiesen. Solche Systeme verschlagworten die enthaltenen Texte in einer Datenbank und machen damit eine Suche nach Stichworten oder Schlagworten möglich, um das entsprechende Dokument zu finden.

Diese Funktionalität bietet auch Azure Cognitive Search. Dies ist ein Cloudsuchdienst von Microsoft, mit dem Dokumente durchsucht werden können und Schlagworte in einem Suchindex gespeichert werden. Damit können Suchfunktionen, leicht in eigene Anwendungen integriert werden.

Der Cloudsuchdienst Azure Cognitive Search arbeitet eigenständig zwischen den Datenspeichern, die die wertvollen Daten enthalten und einer vom Software-Entwickler erstellten Anwendung, die Abfragen an den Suchindex sendet und dessen Antwort verarbeitet, um das gewünschte Dokument zu finden.


Bild-Quelle: Einführung in Azure Cognitive Search – Azure Cognitive Search | Microsoft Docs

Der Nutzen von Azure Cognitive Search besteht darin, dass die Suche in Dokumenten nun von unterschiedlichen Anwendungen genutzt werden kann, da Azure Cognitive Search von Microsoft bereitgestellt wird und nicht fester Bestandteil einer Anwendung, wie einem Dokumentenmanagement-System ist. Ein Software-Entwickler kann diesen Suchdienst von einer SmartPhone-App verwenden oder in einer Windows-Desktop-Anwendung oder in einer Website.

Ein weiterer Vorteil von Azure Cognitive Search besteht darin, dass die Analyse der Dokumente durch Künstliche Intelligenz angereichert werden kann. Diese Anreicherung stellt zusätzliche Informationen im Suchindex bereit, die nicht im Text stehen und daher von den meisten Dokumentenmanagement-Systemen gar nicht bereitgestellt werden können. Zu diesen Anreicherungen gehören beispielsweise
• das Extrahieren von Informationen aus Bildern
• die Erkennung gleicher Gesichter in unterschiedlichen Bildern
• die Erkennung bekannter Orte, Persönlichkeiten und Wahrzeichen
• die Erkennen von Stimmungen im Text, Schlüsselausdrücke und Entitäten aus Text
• die Erkennung unterschiedlicher Landessprachen, die im Text verwendet werden

Natürlich gehört auch die OCR (Optical Character Recognition) dazu. Viele Dokumentenmanagement-Systeme beherrschen sie ebenfalls. Aber mit KI-Anreicherung kann zu einem gescannten Text auch ermittelt werden, ob der Text waagerecht oder senkrecht oder in einem anderen Winkel im Text steht oder an welcher Position der Text im gescannten Bild steht.

Diese Anreicherungen werden ebenfalls im Suchindex gespeichert und sind für Volltextsuchszenarien verfügbar. So kann also nicht nur das Dokument gefunden werden, in dem ein bestimmter Text steht, sondern auch Dokumente, die gesuchte Objekte wie Bäume, Tiere, Fahrzeuge, Werkzeuge usw. in Bildern enthalten. Können Dokumentenmanagement-Systeme Dokumente finden, in denen sich beispielsweise die gesuchten Worte befinden wie „das Haus meines Bruders“, „das Grundstück meiner Schwester“, „die Lagerhalle meiner Tante“, so kann mit KI-Anreicherung allgemein nach Begriffen einer Klasse gesucht werden, die zur Kategorie „Immobilie“ und „Verwandte“ gehören. Der Ausdruck „Die Wohnung meines Sohns“ würde in diesem Fall mit Azure Cognitive Search und KI-Anreicherung gefunden werden, mit einem Dokumentenmanagement-System wahrscheinlich nicht.


Bild-Quelle: https://docs.microsoft.com/de-de/azure/search/cognitive-search-concept-intro

Neben den von Microsoft bereitgestellten KI-Skills zur Anreicherung können auch eigene Skills integriert werden. Falls ein Kunde (noch) nicht über solche Skills verfügt, können benutzerdefinierte „Power-Skills“ auch aus den öffentlich verfügbaren github-Seiten abgerufen und eingesetzt werden. So gibt es dort beispielweise die Möglichkeit Skills zu verwenden, um
• Texte in selbst erstellte Kategorien zu klassifizieren
• Texte in andere Sprachen zu übersetzen
• Zusammenfassungen eines Texts zu erstellen
• Formulare und deren Felder zu interpretieren
• zu Orten die Geo-Koordinaten zu ermitteln. (Dies ermöglicht die Suche weiterer Objekte in der näheren Umgebung oder die Berücksichtigung von Entfernungen)

Der Suchindex kann leicht von einer Anwendung, die von einem Software-Entwickler erstellt wurde, genutzt werden und beispielsweise in einer Web-Anwendung dem Anwender bereitgestellt werden.

Ändern sich jedoch die Inhalte der Dokumente und die damit verbundenen Suchmöglich-keiten häufig oder soll gar keine individuelle Anwendung entwickelt werden, so kann der Inhalt des Suchindex alternativ in einem sogenannten Wissensspeicher (Azure Knowledge Store) bereitgestellt werden.

Der Wissensspeicher ist ein von einer sogenannten Azure Cognitive Search KI-Anreicherungs-Pipeline erstellter Datenbereich mit angereicherten Inhalte für Analysen oder für die Verarbeitung in Nicht-Suchszenarien wie dem Knowledge Mining. Dieser Datenbereich ist natürlich verschlüsselt, sodass er nicht von Unbefugten gelesen werden kann.

Die beiden Ausgaben in Form des Suchindexes und Wissensspeichers werden durch dieselbe Verarbeitungskette erzeugt, jedoch muss zuvor entschieden werden, ob ein Suchindex oder ein Wissensspeicher erstellt werden soll.
Der Wissensspeicher kann mit gängigen Business Intelligence Tools wie PowerBI, Tableau oder QlikView genutzt werden. Diese Anwendungen sind bereits bei vielen Unternehmen im Einsatz


Quelle: https://docs.microsoft.com/de-de/azure/search/knowledge-store-concept-intro?tabs=kstore-portal

In den nächsten Beiträgen zu diesem Thema werden eine Anwendung, die einen Suchindex verwendet, vorgestellt und auch die detaillierte Funktionsweise eines Wissensspeicher erläutert und wie er mit dem kostenlos verfügbaren Tool Power BI von Microsoft genutzt werden kann.

Alle Produktnamen sind geschützte Marken und Markennamen der jeweiligen Hersteller.