Parseurをご利用いただくのが初めての方のためにご案内します。Parseurは、添付ファイルの有無を問わず、様々なフォーマットのメールからデータ抽出ができるメールパーサー兼PDFパースツールです。Parseurはビジネスのデータ入力業務を自動化するロボティック・プロセス・オートメーション(RPA)ツールとして活用されています。
Parseurには数多くの独自データ抽出機能が備わっており、手作業によるデータ入力を削減できます。その中でも特に魅力的なのが、無制限テンプレート機能です!
パーステンプレートとは?
他社のメールパーサーでは、抽出したい項目ごとに複雑な抽出ルールを設定する必要がありますが、Parseurではテンプレートを利用してデータ抽出を行うことができます。
パーステンプレートとは、抽出したい情報をハイライトすることで、ドキュメントのどこからどのデータを取り出すかを視覚的に指定できる仕組みです。視覚的にテンプレートを編集できるため、メンテナンスや調整も長期的に簡単に行えます。

Parseurの無制限テンプレート機能
最初のドキュメントをParseurのメールボックスに送信した後、テンプレートを作成します。これは、抽出したい情報をどこから抽出すべきか、Parseurにビジュアルで指示するプロセスです。

テンプレートを保存すると、同じフォーマットや類似レイアウトのドキュメントは、自動的にそのテンプレートによってデータが抽出されます。
でも、もし似ているけれどレイアウトが異なる他社のメールやドキュメントがあったらどうしますか?その際は、新たなテンプレートを追加で作成するだけです!
レイアウトごとに別のメールボックスを作成する必要もなければ、どのテンプレートをどのドキュメントに当てはめるかを指示する複雑なルールも不要です。メールボックスに複数のテンプレートを保存しておけば、Parseurが新しいドキュメントを自動で判別し、最適なテンプレートを選択します。 これにより、異なる形式の書類も即座に処理されます!
この仕組みこそがParseurの「秘密の材料」であり、あらゆる書類レイアウトごとに迅速にテンプレートを用意できる大きな強みです。
Parseurはどのように適切なテンプレートを自動で選択できるのでしょうか?それは機械学習技術によるものです!
機械学習とは?
機械学習(Machine Learning, ML)は、コンピューターが明示的なプログラミングなしにデータを分析し、ビジネスプロセスを自動化するための技術です。機械学習モデルは、ドキュメントの解析やデータ抽出といった多様な分野で活用されています。
Parseurでの機械学習活用
Parseurは機械学習を活用して、常に最適なテンプレートを自動選択します。テンプレートを追加作成するたび、Parseurはその抽出方法を学習し、テンプレートが増えるほどより賢くなります。
たとえばPDFやWordの添付ファイルからデータ抽出したい場合も、必要な情報をハイライトしてフィールドを作成しておけば、次回以降同種のドキュメントが届いても自動処理されます。
このように、Parseurはデータ抽出プロセスを自動化し、高精度なパースデータを得られるのです。Parseurが最適なテンプレートをどのように選んでいるかはこちらをご覧ください。
次世代の自動化:テンプレート不要のパースも
Parseurの無制限テンプレート機能と機械学習を組み合わせることで、テンプレート作成をしなくてもデータ抽出できる新たな選択肢も生まれています。
実際、Parseurには多業種のドキュメントに対応した組み込みテンプレートライブラリーがあり、例えば不動産、フードオーダー、求人情報、Googleアラートなど幅広い用途で利用できます。
Parseurは、受け取ったメールごとに自動で最適なテンプレートを適用し、それぞれに最適な形でデータを抽出します。
テンプレート不要でパースしたい場合は、メールボックス新規作成時に「パースしたいドキュメントの種類」を選択してください。

あとは、Parseurのメールボックスへドキュメントを転送するだけ。Parseurがそのドキュメントへ既に対応済みの場合、データ抽出は自動的に完了します。
また、ユースケース紹介ページもご参照いただき、Parseurが各業界でどのように活用されているかをぜひご覧ください!
最終更新日