Die manuelle Verarbeitung von Dokumente im Back-Office ist für Unternehmen ein wesentlicher Kostentreiber und kann mit heutigen Technologie automatisiert werden. Die automatische Dokumentenverarbeitung erfordert Datenextraktion, die sich mit der Qualität und Quantität der extrahierten Daten verbessertUmso besser die Datenextraktion ist, desto weiter können komplexe Prozesse automatisiert werden. 

Was ist die Datenextraktion?

Datenextraktion bedeutet das Auslesen von Daten aus Dokumenten und anderen Datenquellen. Wikipedia <a href=”https://en.wikipedia.org/wiki/Data_extraction“>bietet </a> definitiert wie folgt: “Datenextraktion ist der Vorgang, bei dem Daten aus (meist unstrukturierten oder schlecht strukturierten) Datenquellen für die weitere Datenverarbeitung oder Datenspeicherung (Datenmigration) gewonnen werden”. 

Warum ist Datenextraktion so wichtig geworden?

Mit der heutigen Technologie können die meisten Dokumente automatisch verarbeitet werden, sofern die Informationen auf den Dokumenten in strukturierte Daten umgewandelt werden können. Daher ist die Qualität der Datenextraktion Grundvoraussetzung für die Automatisierung von Back-Office-Tätigkeiten mit Einsparpotential über Milliarden €. 

Strukturierte Daten im Back-Office werden typischerweise maschinell verarbeitet. Wenn beispielsweise eine Rechnung in ein gut konfiguriertes Enterprise Resource Planning (ERP)-Tool wie SAP eingegeben wird, können Zahlungen automatisch abgeschlossen und Systemaufzeichnungen automatisch vorbereitet werden.

Eine qualitativ hochwertige Datenextraktion bleibt eine Hürde für die Automatisierung im Back-Office, da die manuelle Datenextraktion nicht umfassend genug ist. Aufgrund der immensen Kosten für die Datenextraktion werden nur bestimmte Daten ausgelesen, wobei nur wenige Datenpunkte der insgesamt vorhandenen Informationen auf den Dokumenten erfasst werden. Die begrenzten Informationen ermöglichen die Automatisierung der wichtigsten Prozesse, wie z.B. die Zahlung im Falle einer Rechnung. Andere wichtige Prozesse, wie z.B. die Validierung der Mehrwertsteuerkonformität oder die Kontenvorhersage, bleiben jedoch manuell, da die hierfür notwendigen Daten nicht aus den Belegen ausgelesen werden. 

Was sind die Alternativen zur automatisierten Datenextraktion?

Manuelle Datenextraktion und vorlagenbasierte Lösungen sind die am weitesten verbreiteten Alternativen.

Vorlagenbasierte Lösungen ermöglichen es Unternehmen, Daten aus Dokumenten in einem bestimmten Format zu erfassen. Aufgrund der vielen unterschiedlichen Dokumentenformate erreicht man mit ihnen jedoch nur geringe Automatisierungsraten. 

Die manuelle Verarbeitung hat ihre Schwächen: Sie ist langsam, teuer, fehleranfällig und demotivierend. 

Wie ist die Qualität von Datenextraktionslösungen?

Die Qualität der automatisierten Datenextraktion nimmt zu und wird zu einer immer beliebteren Alternative zur manuellen oder vorlagenbasierten Datenextraktion. Zum Beispiel in <a href=”https://blog.hypatos.ai/best-ocr/”>unserer Vergleichsstudie</a>, konnte die Hypatos Deep Learning Technologie ~50 Felder pro Rechnung korrekt erfassen. Angesichts dieses unaufhaltsamen Trends müssen Unternehmen die Datenextraktion automatisieren, um sowohl die Vorteile der automatisierten Datenextraktion aus Dokumenten zu nutzen als auch eine stärkere Automatisierung der Dokumentenverarbeitung zu ermöglichen.

Bilderkennung ist ein gutes Beispiel, indem Machine Learning in den letzten Jahren  zu enorme Leistungssteigerungen geführt hat. Obwohl es wenige Vergleichswerte zur Dokumentenerfassung gibt, können wir aufgrund unserer Kundengespräche feststellen, dass sich die Leistung der automatisierten Datenextraktion in den letzten ~5 Jahren erheblich verbessert hat.

Performance of machine learning solutions have improved significantly in the past 5 years
Source: Benchmarks.AI

Wie können Sie die Datenextraktion in Ihrem Unternehmen automatisieren?

Angesichts der verfügbaren leistungsstarken Automatisierungslösungen und deren Vorteile liegt die Notwendigkeit der Datenextraktion mit Machine Learning auf der Hand. Es gibt natürlich auch smarte Wege, um Automatisierungsbereiche zu priorisieren und sicherzustellen, dass Ihr Team fokussiert bleibt. 

Im Idealfall sollten Sie mit der Automatisierung von zahlreich vorhandenen, komplexen Dokumenten für wichtige Prozessschritte beginnen, für die es bereits Standardlösungen gibt. Theoretisch müssen Sie folgende Punkte beachten:

  • Aktuelle Kosten der Datenextraktion: Dies ist zwar schwer abzuschätzen, hängt aber vom Dokumentenvolumen und der Komplexität der Dokumente ab. Diese zwei Größen helfen Ihnen, die Kosten der Datenextraktion zu schätzen.
  • Aktuelle Kosten der Weiterverabeitung: Was macht Ihr Team nach dem Erfassen der Daten? Zusätzliche manuelle Dokumentenverarbeitungsschritte nach der Datenextraktion sind ein guter Indikator für den Aufwand, den Sie für die fortgeschrittene Dokumentenverarbeitung aufbringen. Zum Beispiel im Falle von Rechnungen sind die typischen Prozessschritte, die nach der vollständigen Datenextraktion automatisiert werden können, die Überprüfung der Mehrwertsteuerkonformität und die Vorhersage von Rechnungskonten, die keinen Bestellungen zugeordnet werden können.
  • Verfügbarkeit von Extraktionslösungen: Wenn es sich um ein Dokument wie beispielsweise eine Quittung, Rechnung, Bestellung, Gehaltsabrechnung etc. handelt, die in jedem Unternehmen vorhanden sind, gibt es wahrscheinlich eine standardisierte Lösung für dieses Dokument. Bei Hypatos haben wir Lösungen für die jeweiligen Dokumententypen. Wenn wir keine passende Lösung haben, trainieren wir Modelle, die auf die Wünsche und Bedürfnisse von Kunden angepasst zugeschnitten sind. Zum Beispiel unterstützen wir ein großes Energieunternehmen bei der Verarbeitung von Formularen, die es von seinen Franchiseunternehmen erhält.

Wir haben zahlreichen Fortune 500 und den Big 4 bei der Automatisierung der Datenextraktion geholfen. <a href=”https://hypatos.ai/#contact“>Teilen Sie uns  mit, was Sie brauchen</a>. 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*
*