投稿者: プロダクトマネージャー、Sonia Prakasam
人間の五感の中で、視覚は最も多くの情報を最もすばやく処理すると考えられています。この視覚のように、情報をすばやく把握できるテクノロジーがコンピュータービジョンです。Alteryx Intelligence Suite では、コンピュータービジョンのツール群の追加により、大量のドキュメントのすばやい自動処理が可能になりました。コンピュータービジョンのツールでは、機械学習モデルを活用することで、ドキュメントや画像からスムーズに情報を抽出できます。
何かと話題になる機械学習モデルですが、モデルの精度がデータセットの品質に左右される点には注意しなければなりません。アルゴリズムに犬の画像を 500 枚見せた後に、猫の見た目について質問しても、きちんとした答えが出るわけがありません。画像のクオリティの低さ、向きの間違い、バラバラな形式などは、財務諸表から医療保険請求に至るまでの、大規模で複雑なデータセットから迅速にインサイトを得る上で、大きな妨げとなります。
また、構造化されていないドキュメントでは、価値あるデータを引き出すために、手作業で恐ろしいほどの手間をかけなければならないこともしばしばです。一般的に、データサイエンティストは、データ準備に 80% もの時間を費やさねばならず、モデルの構築にはたった 20% 程度の時間しか充てられません。
これは私がよく経験することなのですが、医療機関でクリップボードとペンを渡され、名前や住所などを記入する際に、スペースが小さすぎて収まりきらなかったとします。名前や住所を変えるわけにもいきませんし、このような用紙のサイズに合った構造と制約条件があるはずだと感じるのではないでしょうか。
ここで求められていることは何でしょうか。その答えが、柔軟性です。Alteryx では、アルゴリズムは人間に合わせて柔軟に動作すべきであり、その逆はないと考えています。そして Alteryx のモデルにも、こうした価値観が反映されています。
バージョンアップした画像入力ツールでは、PDF だけでなく、JPEG、PNG、ビットマップなどの標準的な画像形式にも対応し、多様な画像を処理できます。つまり、これまで愛用してきた PDF 入力ツールが、新たな画像形式に対応した、ということです!このツールは、元々はテキストマイニングのツール群に含まれていましたが、今回のバージョンアップでコンピュータービジョンのツール群へと移行し、新しい画像入力ツールの一部として利用できるようになりました。
さらに良いお知らせがあります。画像入力ツールには、下位互換性を備えているため、既存のワークフローのアップデートを行う必要はありません。Alteryx Intelligence Suite の 21.2バージョンにアップグレードすれば、ワークフローのツールが自動的に更新され、シームレスに実行されます。
光学文字認識 (OCR) の成功率と読み取り精度は、画像の品質が決め手となります。コントラストが低く、ぼやけた画像では、文字認識の精度が低下します。もともとの印刷の状態に近ければ近いほど、画像に含まれる語句の認識が容易になります。こうした問題を解決するには、OCR エンジンにかける前に画像を処理する必要があります。
新しい画像処理ツールは、そのニーズを叶えるだけでなく、他の用途にも役立つ万能ツールです。このツールでは、画像の位置合わせ、閾値処理、スケール、トリミングなどの、画質改善の一般的な手順をすばやく実行できます。また、明るさの調整や、グレースケールへの変換も行うこともできます。これらの手順のどれもが、テキスト認識の精度を向上させるために欠かせないものです。
特に便利なのが、手順の実行順序を自在に変えられるという点です。つまり、設定ウィンドウ内でウィジェットをドラッグして並び順を変えるだけで、いつでも手順の順序を変更できます。Instagram の写真についフィルターをかけすぎてしまった、という経験は誰にでもあるのではないでしょうか。そんな時も心配は無用です。すべての手順で、直感的に操作できるオプション機能を使って、リセットや削除を行うことができます。
画像処理ツールを使うことで、手ぶれや暗がりなどの、悪条件で撮影された画像をより容易に取り込み、価値あるデータを引き出すことが可能になります。
画像の前処理を行い、 その画像をアルゴリズムで処理することで、携帯電話で撮った画像を、デジタル編集可能なデータに変換することができます。このように画像をデジタル変換できれば、インサイトの可能性が無限に広がります。
多くのユーザーからいただいたご要望がついに実現しました。OCR の実行と機械学習(ML)との併用にはさまざまな課題があり、これまでどうすれば最小限の手作業で最大限の柔軟性を確保できるか思案を重ねてきました。そして、今回のリリースで自動テーブル検出機能を導入する運びとなりました。
ページごとに構造が異なるなどの、複雑なドキュメントからのテーブルの抽出にはかなりの手間がかかります。このようなドキュメントを扱う場合、テーブルレイアウトの大小の変化に何時間もかけて対処し、データ形式の一貫性を維持するために大規模な再作業を行わなければなりません。
自動テーブル検出機能を導入すれば、このような構造化されていない画像やドキュメントからデータを抽出できるようになります。機械学習モデルで、 情報の検出、クレンジング、抽出が一挙に実行でき、テンプレートを用いる必要は一切ありません。必要な作業は、画像入力ツールの出力を、画像テンプレートツールのオプションの入力アンカーに接続するだけです。
この手順を踏むと、画像テンプレートツールのインターフェースが変わります。これにより、自動テーブル検出モードが実行され、ツールが正しく構成されていることが確認できます
こうしたプロセスを自動化することで、小売店や医療機関などから送られてくるさまざまな形式の請求書の解釈などが格段に容易になります。Alteryx Intelligence Suite のツールは、こうした一連の手順を大規模に処理できるよう精密に設計されています。また、Intelligence Suite は大規模な処理を行うだけでなく、財務諸表などの詳細なドキュメントから情報を抽出する際に、特定の領域に絞り込むことができる柔軟性も持ち合わせています。OCR や機械学習による OCR の拡張機能が備わった Intelligence Suite は、このような作業において欠かせないものとなるでしょう。
Alteryx Intelligence Suite アドオンインストーラーをダウンロードして、これらのツールの無料トライアルをお試しいただけます。ライセンスを取得する場合は、アカウント担当者にお問い合わせください。これらの新しいツールには、使い始める際に役立つサンプルワークフローが用意されています ([ヘルプ] > [サンプルワークフロー] > [モデルごとに学習])。
ここにコメントを追加するには、ご登録いただく必要があります。 ご登録済みの場合は、ログインしてください。 ご登録がまだの場合は、ご登録後にログインしてください。