Free Trial

Blog - Deutsch

Erkenntnisse und Ideen von den besten Analytics-Experten.
StephV
Alteryx Alumni (Retired)

Von allen menschlichen Sinnen gilt das Sehen als derjenige, der die meisten Informationen am schnellsten verarbeitet. Mit Computer Vision kann Technologie Informationen ähnlich schnell verarbeiten. Aus diesem Grund haben wir die Alteryx Intelligence Suite mit einem neuen Satz an Computer Vision-Tools ausgestattet, der Ihnen dabei hilft, eine große Anzahl von Dokumenten schnell und automatisch zu verarbeiten. Die neuen Computer Vision-Tools verwenden Machine-Learning-Modelle, mit denen Sie Informationen aus Dokumenten und Bildern gewinnen können.

 

 

StephJ_0-1620834347123.png

 

Lernen Sie die neuen Computer Vision-Tools in der Intelligence Suite kennen!

 

Es wird viel über Machine Learning (ML)-Modelle geredet. Aber denken Sie daran: Ein Modell ist nur so gut wie sein Dataset. Sie können einem Algorithmus beispielsweise keine 500 Bilder eines Hundes zeigen und ihn fragen, wie eine Katze aussieht. Schlechte Bildqualität, schlechte Ausrichtung und wechselnde Formate – all das erschwert das schnelle Gewinnen von Erkenntnissen aus großen und komplexen Datasets, von Finanzberichten bis hin zu Ansprüchen und Forderungen im Gesundheitswesen.

 

Je weniger strukturiert diese Dokumente sind, desto mehr manuelle Eingriffe sind erforderlich, um aussagekräftige Daten zu extrahieren (und zwar exponentiell mehr!). Beispielsweise verbringt ein durchschnittlicher Data Scientist 80 % seiner Zeit mit der Vorbereitung von Daten und lediglich 20 % mit der Erstellung des Modells.

 

Ich habe bemerkt, dass jedes Mal, wenn ich eine Arztpraxis betrete und mir jemand ein Klemmbrett und einen Stift in die Hand gibt, die Namens- und Adressfelder auf dem Formular ein bisschen zu kurz sind, sodass nicht alles reinpasst. Einerseits kann ich nicht immer meinen Namen und meine Adresse abändern, damit sie in die Felder passen. Andererseits aber nehme ich an, dass es für diese Formulare eben einfach eine gewisse Struktur und Größenbeschränkung geben muss.

 

Was ist die Lösung für dieses Dilemma? Flexibilität. Das Alteryx-Team ist der Ansicht, dass Algorithmen flexibel genug sein sollten, um sich an den Menschen anzupassen, und nicht umgekehrt. Folglich sind die Alteryx-Modelle auch an diese Werte angelehnt.

 

 

Mit dem Bildeingabe-Tool nahezu jedes Bild einlesen

 

Mit dem aktualisierten Bildeingabe-Tool können Sie eine Vielzahl von Bildformaten verarbeiten, seien es PDF-Dateien oder andere Standardbildformate wie JPEG, PNG und Bitmap. Ja, das bedeutet, dass das PDF-Eingabe-Tool, das Sie kennen und lieben gelernt haben, ein neues Zuhause hat! Es wechselt vom Text Mining-Toolset zum neuen Computer Vision-Toolset und ist jetzt Teil des neuen Bildeingabe-Tools.

StephJ_1-1620834347128.png

 

Das PDF-Eingabe-Tool erhält mehr Funktionen und ein neues Design! Es ist jetzt das Bildeingabe-Tool.

 

 

Und noch mehr gute Nachrichten: Sie brauchen Ihre bestehenden Workflows nicht zu aktualisieren! Das Bildeingabe-Tool ist rückwärtskompatibel. Wenn Sie ein Upgrade auf die Version 2021.2 der Alteryx Intelligence Suite durchführen, werden Ihre Workflows für das neue Tool aktualisiert und nahtlos ausgeführt.

 

Mit dem Bildverarbeitung-Tool jedes Wort extrahieren

 

Einer der Hauptfaktoren für eine erfolgreiche und präzise optische Zeichenerkennung (Optical Character Recognition, OCR) ist die Bildqualität. Kontrastarme, verschwommene Bilder erschweren die Zeichenerkennung. Je mehr ein Bild dem Originaldokument in Papierform ähnelt, desto einfacher ist es, zu ermitteln, was auf dem Bild dargestellt ist. Die Lösung dafür (und für einige andere Probleme!) liegt in der Verarbeitung des Bildes, bevor es den OCR-Prozess durchläuft.

 

Genau das und vieles mehr macht das neue Bildverarbeitung-Tool. Das Tool erlaubt es Ihnen, die Schritte, die typischerweise zur Verbesserung der Bildqualität notwendig sind, schnell durchzuführen. Mit dem Tool können Sie Bilder ausrichten, mit Schwellenwerten versehen, skalieren und zuschneiden. Sie können auch ihre Helligkeit ausgleichen und sie sogar in Graustufen umwandeln. All diese Schritte sind für die Verbesserung der Texterkennungsqualität von wesentlicher Bedeutung.

 

StephJ_2-1620834347136.png

 

Das neue Bildverarbeitung-Tool bietet Ihnen viele Möglichkeiten, Ihre Bilder für die Analyse vorzubereiten.

 

Besonders praktisch ist, dass die einzelnen Schritte in der Reihenfolge ausgeführt werden, in der Sie sie hinzufügen. Sie können sie jederzeit neu anordnen, indem Sie die Widgets im Konfigurationsfenster an die gewünschte Stelle ziehen. Wir alle haben es schon mal erlebt, dass wir einen Filter zu viel über unsere Instagram-Bilder gelegt haben, stimmt’s? Dafür haben wir jetzt die Lösung für Sie. Als zugrunde liegende Designphilosophie bieten alle Schritte intuitive Optionen, um die Filter nach Bedarf zurückzusetzen und zu entfernen.

 

Die Motivation hinter dem Bildverarbeitung-Tool besteht darin, es Ihnen so einfach wie möglich zu machen, aus einem Bild, das unter nachteiligen Bedingungen aufgenommen wurde (z. B. mit zittrigen Händen oder bei schlechten Lichtverhältnissen) aussagekräftige Daten zu extrahieren.

 

 

 

StephJ_3-1620834347156.png

 

Von unbrauchbar bis lesbar! Dank des neuen Bildverarbeitungs-Tools können die Daten einer Quittung extrahiert werden. Comic Sans war 2003 eindeutig „im Trend“!

 

 

 

Jetzt haben Sie ein vorverarbeitetes Bild, das durch Algorithmen von einem schnellen Schnappschuss auf Ihrem Telefon in eine digital bearbeitbare Datenliste konvertiert werden kann. Sobald Sie diese digital konvertierten Bilder haben, sind die Möglichkeiten für Erkenntnisse endlos.

 

Maximale Flexibilität dank automatischer Tabellenerkennung

 

 Wir wissen, dass die Durchführung von OCR oder auch die Verwendung von OCR in Verbindung mit Machine Learning Herausforderungen mit sich bringt. Deshalb möchten wir sicherstellen, dass Sie maximale Flexibilität bei minimalem manuellem Arbeitsaufwand erhalten. Aus diesem Grund führen wir in dieser Version die Automatische Tabellenerkennung ein.

 

StephJ_4-1620834347176.png

 

Mit der Automatischen Tabellenerkennung im Bildvorlage-Tool können Sie Daten automatisch aus komplizierten PDFs extrahieren.

 

Das Extrahieren von Tabellen aus einem wie oben dargestellten komplexen Dokument ist mühsam, insbesondere wenn es über komplexe Strukturen verfügt, die auf jeder Seite variieren. Wenn Sie bereits mit solchen Dokumenten arbeiten, müssen Sie sich wahrscheinlich stundenlang mit großen und kleinen Änderungen von Tabellenlayouts herumschlagen, während Sie umfangreiche Nacharbeiten durchführen, um konsistente Datenformate zu erhalten.

 

Mit der Einführung der Automatischen Tabellenerkennung sind Sie jetzt in der Lage, Daten aus unstrukturierten Bildern und Dokumenten zu extrahieren. Hier findet, bereinigt und extrahiert das ML-Modell Informationen vollständig, ohne dafür eine Vorlage zu benötigen. Sie brauchen dafür lediglich den Output des Bildeingabe-Tools mit dem optionalen Input-Anker des Bildvorlage-Tools zu verknüpfen.

 

Nun ändert sich die Benutzeroberfläche des Bildvorlage-Tools, um Sie darauf hinzuweisen, dass Sie im automatischen Tabellenerkennungsmodus arbeiten und dieses Tool korrekt für die automatische Tabellenerkennung konfiguriert haben.

Sie können diesen Prozess jetzt automatisieren, um beispielsweise Rechnungen von Rewe und Edeka oder sogar von Ihren lokalen Gesundheitsdienstleistern zu verarbeiten. Die Tools der Alteryx Intelligence Suite sind genau darauf ausgelegt, all dies skalierbar zu erledigen. Und obwohl die Intelligence Suite dies in großem Umfang tut, bietet sie Ihnen die Flexibilität, bestimmte Schwerpunktbereiche auszuwählen, wenn Sie Informationen aus detaillierten Dokumenten wie Finanzberichten extrahieren. Die Intelligence Suite erledigt einen Großteil dieser Arbeit mit OCR und OCR-Erweiterungen mit Machine Learning.

 

 

Jetzt sind Sie an der Reihe!

 

Jetzt können Sie den Add-on Installer für die Alteryx Intelligence Suite herunterladen und diese Tools kostenlos testen. Wenden Sie sich an Ihren Ansprechpartner bei Alteryx, um die Lizenz zu erhalten.

 

 

*Dieser Beitrag "Unlocking Insights from Images using Computer Vision" wurde in Community Blog veröffentlicht und von @sprakasam geschrieben.

 

Beschriftungen