Dokumentanalyse

Zunehmender Bedarf an Informationsaustausch 

In den heutigen Unternehmensnetzwerken gibt es einen hohen Bedarf an Informationsaustausch. Dies betrifft insbesondere die Abwicklung von Geschäftsprozessen. So müssen z.B. Angebote, Bestellungen und Rechnungen erstellt und versendet und auf der Gegenseite erfasst und bearbeitet werden. Solche Geschäftsprozesse werden zunehmend durch IT-Werkzeuge unterstützt. Eine wichtige Teilaufgabe ist dabei die Erfassung von Informationen aus Dokumenten, die ein Unternehmen von außen auf dem Postweg oder elektronisch erreichen. Ziel der Dokumentanalyse ist es, die Erfassung und Interpretation von Informationen aus Dokumenten so weit wie möglich zu automatisieren.

Automatische Inhaltsextraktion durch Freiform-Erkennung

Die Erfassung und Verarbeitung papiergebundener Belege kann mit den entwickelten Werkzeugen weitgehend automatisch erfolgen. Dazu werden die eingehenden Belege zunächst gescannt. Für gute Ergebnisse der Texterkennung (OCR) sorgen dabei spezielle Verfahren zur Bildaufbereitung. Nach der OCR-Verarbeitung kommt ein wissensbasiertes Dokumentanalyseverfahren zum Einsatz, mit dessen Hilfe die Informationen interpretiert werden. Bei diesem Verfahren werden die relevanten Informationen automatisch bestimmt (Inhaltsextraktion). Dafür müssen die Belege nicht normiert sein, sondern können eine beliebige Struktur aufweisen (Freiform-Erkennung). Der Aufbau der Belege muss also vorher nicht bekannt sein, trotzdem werden hohe Erkennungsraten erzielt. Die Erkennungsraten werden im praktischen Betrieb durch den Einsatz automatischer Lernverfahren weiter verbessert.

Anwendungsbeispiele

In beliebigen frei formatierten Rechnungen können Absenderinformationen (Firmenname, Strasse, Ort, Telefonnummer, E-Mail-Adresse, Kontoangaben, usw.), verschiedene Datumsangaben (Belegdatum, Lieferdatum, Zahlungstermine), Bestellangaben (Bestellnummer, Bestelldatum), Rechnungsnummer, verschiedene Beträge (Nettosumme, Mehrwertsteuerbeträge, Endbetrag) automatisch bestimmt werden. Analog können zum Beispiel auch Bestellungen, Angebote und Lieferscheine behandelt werden.
Durch die Einbeziehung von Hintergrundwissen können Konsistenzprüfungen durchgeführt werden. Die gefundenen Daten können in einem Workflow- oder Buchhaltungssystem automatisch weiterverarbeitet werden. 
Weitere wichtige Anwendungen sind die automatische Eingangspostverteilung oder automatische Indexierung für die elektronische Archivierung.

Technologie-Transfer

Zur Weiterentwicklung und Vermarktung der Verfahren zur Dokumentanalyse wurde 2002 die FreeFormation GmbH mit Sitz in Trier gegründet, die inzwischen zur Seeburger AG gehört (www.seeburger.de).

back-to-top nach oben