Der Einsatz der besten Datenextraktionslösungen verbessert die automatisierte Dokumentenverarbeitung in Unternehmen und führt zu schnelleren, effizienteren Prozessen mit weniger manuellen Fehlern und zufriedeneren Mitarbeitern.
Wir haben Hypatos während unserer Kundenprojekte mit Wettbewerbern verglichen. Dabei sind wir auf die Idee gekommen, ein umfassendes Benchmarking zu veröffentlichen, um potenziellen Kunden die Leistungsfähigkeit unserer Lösung zu zeigen. Wir haben unsere Lösung mit der Konkurrenz in Bezug auf die Genauigkeit und Funktionen, wie z.B. Einsatzmöglichkeiten, Integrationsfähigkeit, etc. verglichen.
Was ist der Unterschied zwischen Datenextraktion und OCR?
Zusammengefasst:
- OCR wandelt Dokumente in Text um in Form von unstrukturierten Daten. Diese müssen dann wiederum manuell, d.h. Menschen weiterverarbeitet werden.
- Im Gegensatz dazu liefern Datenextraktionslösungen strukturierte Daten, die maschinell lesbar sind.
Daher ermöglichen Datenextraktionslösungen die automatische Verarbeitung von Dokumenten. Lesen Sie dazu unseren OCR Artikel, in dem wir den Unterschied zwischen OCR und Datenextraktion erklären.
Wie erkennt man die beste Lösung?
Jede KI-Lösung kann im Vergleich mit Wettbewerbern getestet werden, indem ihre Genauigkeit mit manuell gelabelten Daten verglichen wird. Dieser Ansatz bildet die Grundlage der meisten PoC-Projekte bei großen Unternehmen. Diese Unternehmen bitten mehrere führende Anbieter, Vorhersagen auf der Basis ihrer manuell gelabelten Daten zu erstellen. Die Genauigkeit dieser Lösungen ist ein wichtiger Input für die Einkaufsentscheidung der Unternehmen.
Was ist die genaueste Datenextraktionslösung?
Wie Sie unten sehen können, war Hypatos bei weitem die beste Lösung für diese Dokumente, sowohl in Bezug auf
- Anzahl aller extrahierten Einheiten
- Genauigkeit der extrahierten Einheiten
Ein weiterer wichtiger Entscheidungsträger sind Datenfelder. Wenn Unternehmen nicht im Allgemeinen an Ihren Ausgaben interessiert sind, können sie auch nur bestimmte Datenfelder erfassen, die für eine Zahlung notwendig sind, und in SAP aufgenommen werden sollen. Hypatos war erneut die beste Lösung in Bezug auf
- Anzahl aller extrahierten Datenfelder
- Genauigkeit der extrahierten Datenfelder
Für die meisten Kunden sind die folgenden Datenfelder am wichtigsten:
- Rechnungsnummer
- Dokumenttyp
- Rechnungsdatum
- Leistungszeitpunkt
- Nettobetrag
- Mehrwertsteuersatz
- Gesamtbetrag der Mehrwertsteuer
- Gesamt Brutto
- Währung
- Absendername
Stichproben und Benchmark
Bei dem ersten Vergleich haben wir einen relativ kleinen Datensatz von 10 Rechnungen aus Deutschland verwendet. Eine wesentliche Einschränkung der Stichprobengröße war, dass wir Dokumente verwenden mussten, die veröffentlicht werden können. Das liegt daran, dass wir den Datensatz für Dritte wie z.B. potenziellen Kunden oder der Presse teilen wollen, damit die Ergebnisse selbst getestet werden können. Deshalb haben wir ausschließlich Rechnungen verwendet, die wir veröffentlichen können, und haben keine Dokumente unserer Kunden verwendet.
Methodik
Wir konnten Hypatos nur mit den Konkurrenten vergleichen, die ebenfalls eine Testversion zur Verfügung stellen, was aber bei den wichtigsten der Fall war.
Natürlich können Sie diesen Beitrag kommentieren und uns über weitere Anbieter informieren.
<li>Rossum: Kostenlose Testversion verfügbar auf rossum.ai</li>
<li>Textract: Verfügbar in AWS</li>
<li>Sypht: Kostenloses Konto verfügbar auf sypht.com</li>
Gibt es weitere Kriterien, die die Kaufentscheidung eines Unternehmens beeinflussen könnten?
Die Genauigkeit ist nicht der einzige Faktor bei der Entscheidung. Auch Deployment Optionen, die Integrationsfähigkeit und das Potenzial der Weiterverarbeitung von Dokumenten sind wichtige Merkmale, an denen wir Konkurrenten gemessen haben:
Company | Deployment options | Integration options | Advanced processing options |
---|---|---|---|
Hypatos | On-prem Private cloud (AWS/MS Azure) Public cloud | API Integration to document workflow tools such as Kofax | VAT compliance check Account prediction |
Sypht | N/A | ||
Textract | Public cloud Private cloud (AWS) | API | N/A |
Diese Tabelle basiert auf öffentlichen Daten und wir aktualisieren diese gerne jederzeit, wenn die Vergleichsunternehmen uns weitere Details mitteilen. Die Kennzahlen werden im Folgenden erläutert:
Deployment Möglichkeiten
Die meisten Europäischen Fortune 500 Unternehmen bevorzugen on-premise oder private Cloud Lösungen, um die Konformität der Sicherheits- und Datenschutzrichtlinien zu gewährleisten. Die Deployment Möglichkeiten können also ein ausschlaggebender Faktor sein.
Einfache Integration
Alle der Lösungen bieten APIs an, die sich problemlos in die meisten Anwendungen integrieren lassen. Allerdings wird die Integration durch bestehende Integrationen in Unternehmenssoftware noch einfacher.
Automatisierte Weiterverarbeitung
Die Extraktion ist dabei der erste Schritt, denn in fast allen Fällen werden die extrahierten Daten von den Unternehmen manuell nachbearbeitet. Beispielsweise müssen Rechnungen kontiert werden, wenn sie nicht mit einer Bestellung übereinstimmen. In solchen Fällen ist die Unterstützung Ihres Dienstleisters wichtig, um den Prozess weiter zu automatisieren.
Dies ist keine Voraussetzung, sondern Unternehmen können auch mit Softwareunternehmen zusammenarbeiten, um individuelle Lösungen zu entwickeln, die den Automatisierungsgrad erhöhen. In Bereichen wie der Back-Office-Automatisierung haben die meisten Unternehmen derselben Branche jedoch ähnliche Daten und diese verschaffen ihnen keinen Wettbewerbsvorteil. In solchen Fällen sollten Unternehmen danach streben, die beste Lösung zu den besten Konditionen zu erhalten, und nur Unternehmen mit Erfahrungen in diesem Bereich werden dem Anspruch gerecht.
Support
Die meisten Unternehmen haben angegeben, dass sie Support anbieten. Auch wenn wir keine Angaben finden konnten, vermuten wir, dass alle Unternehmen Kundenbetreuung anbieten, insbesondere für Enterprise Kunden.
Lieferantenbilanz
Konkurrenten erwähnen, dass sie Fortune-500-Firmen als Kunden gewinnen konnten. Wir könnten Hypatos hier noch weiter vertiefen, da wir glauben, dass wir das stärkste Netzwerk an Partnern und Kunden haben. Da Amazon jedoch zu Wettbewerbern gehört, ist dies eine schwierige Aufgabe, die AWS-Kunden von den Textract-Kunden nur auf Basis öffentlicher Daten zu trennen. Deshalb tauchen wir vorerst nicht tiefer ein.
Preis
Letztendlich ist auch der Preis ein Faktor für die Entscheidungsfindung. Da jedoch fast keiner der Konkurrenten Preise offenlegt, konnten wir leider keinen Preisvergleich durchführen.
Was sind die Grenzen von Datenextraktionslösungen?
Während Datenfelder wie Absender und Empfänger relativ einfach auszulesen sind, erwiesen sich die Extraktion von Einzelposten und mehrfache Mehrwertsteuersätze als Herausforderung für unsere Wettbewerber.
Extraktion von Einzelposten
Die Datenfelder, die sich in der Nähe des unteren Randes der Rechnungen in Tabellenform befinden, enthalten eine Liste aller Positionen, aus denen sich der Einkauf zusammensetzt. Sie sind schwer zu extrahieren, da diese tabellenähnlichen Strukturen nicht eindeutig wie Tabellen formatiert sind. Einige Extraktionen unserer Mitbewerber sind fehlgeschlagen und die erfolgreichen Ergebnisse von Hypatos für das gleiche Dokument sind unten aufgeführt:
Mehrfache Mehrwertsteuersätze
Mehrere Mehrwertsteuersätze sind möglich, wenn eine Rechnung mehrere Positionen (mehrere Dienstleistungen oder Produkte) mit unterschiedlichen Mehrwertsteuersätzen enthält. Dies ist ein relativ seltener Fall und wurde von den meisten Wettbewerbern nicht richtig verarbeitet:
Wir hoffen, dass Ihnen der Wettbewerbsvergleich bei der Auswahl des besten Anbieters hilft. Wenn Sie Unterstützung bei der Automatisierung von Dokumenten benötigen, <a href=”https://hypatos.ai/#contact“> würden wir Ihnen gerne helfen.