OCRの種類や用途・選び方をご紹介
~OCRの処方箋〜
組織内に存在する大切な文献や資料をOCRでテキスト化したいと考えているものの、自社でツールを用いて自前で実施するのか、専門事業者に依頼してデータを納品してもらうのかなど、どのように行うべきか迷っている方もいらっしゃるかもしれません。
OCRを実施する方法は世の中に数多く存在し、それぞれにメリットやデメリットがあります。各方法の特性を理解した上でサービスの選択を行うことができれば、期待していたメリットが得られるでしょう。
そこで今回は、OCRを実施する方法やサービス選びのヒントとして、OCRの種類と用途、比較のポイントをご紹介します。
OCRとは? 種類は「従来型OCR」と「AI-OCR」の2つ
OCRとは、「Optical Character Recognition」の頭文字をとった言葉で、日本語に直訳すると「光学文字認識」となります。紙の書類をスキャナやカメラで撮影して出来上がった画像データから文字情報(テキストデータ)を抽出する技術です。
企業においては、かつての紙資料を効率的かつ迅速にデジタル化できれば……という状況が発生することもあるでしょう。しかも、ただのデジタル化ではなく、テキストデータとして文字検索や引用に対応できる形でデータ化するのが望ましい場合の方が多いと思われます。
単なる画像データでは、記載されているテキストを活用できません。このようなときにOCRが役立ちます。
●OCRの種類
OCRの技術的な種類は大きく従来型OCRとAI-OCRの2つに分かれます。
・従来型OCR
従来型OCRは、画像データから文字情報を読み取る技術であり、2つの機能によって構成されています。1つは、「文字検出」機能であり、書類のどの場所や範囲を読み取るのかを特定するものです。もう1つは、「文字認識」機能であり、文字の判別を行います。これらの機能を、事前設計であらかじめ決められたロジックの範囲内で発揮します。フォーマットが統一されているならば、文字情報を漏れなく正確に認識することが可能です。
・AI-OCR
AI-OCRとは、文字通り、従来型OCRの技術にAI(人工知能)の技術をかけあわせたものです。従来型OCRが持つ「文字検出」と「文字認識」、さらには「レイアウト認識」といったそれぞれの機能を、AIが機械学習を重ねることによって強化し、手書き文字の認識や多様なフォーマットへの対応等が可能になります。
従来型OCRは、全工程を人が設計してルール設定を行ってから文字認識を行います。一方、事前に機械学習を重ねたAI-OCRならば、大量の文書や書類を高速かつ正確に処理することができ、手作業にかかる時間と労力を大幅に削減できると言えるのです。
とはいえ、AI-OCRが万能で、文字認識率が100%というわけではありません。読み込む原稿の形式にもよりますが、現時点では一般的に5%程度は誤認識する可能性があると言われています。仮に1ページ600文字の文書があったとして、AI-OCRでテキストデータ化すると30カ所の誤りが生じる可能性を含んでいるということです。業務で必要とするテキストデータの文字精度はどの程度なのか?一度立ち止まって考えてみるべきでしょう。
※現在、AIの技術はとてつもないスピードで変化を遂げています。ゆえに、本記事に記されていることは、2024-25年での情報としてご認識ください。また、AI-OCRとうたっている各社サービスにおける文字の認識精度は、機械学習の量と質によって異なります。便宜上、ここでは簡易的にひとくくりにして説明していますが、サービス選定の際には各サービスの特性を認識された上でご検討ください。
OCRを実施する方法
OCRを実施する方法として、主に次の種類があります。
●OCRソフトを利用する
OCRソフトをパソコンにインストールして自ら操作して行う方法です。人的リソースが確保できる場合や、操作に問題がない場合、ある程度OCRに関する知見がある場合、機密文書を外部の会社に見せたくない場合などに適しています。
●クラウドAI-OCRサービスを利用する
AI-OCRサービスを利用する方法です。特にオンラインを通してサービスを利用できるクラウドOCRサービスです。すぐに導入開始できるため利便性が高い一方で、サービス提供会社が運営するサーバーに文書をアップロードすることになるため、機密情報を含む文書については留意が必要です。
●オンプレミスのAI-OCRサービスを利用する
オンプレミスのAI-OCRサービスとは、自社内にサーバーを設けて、そのサーバー上でOCRを実行するサービスです。そのため、クラウドサービスと比べてセキュリティの観点から安心できますし、カスタマイズ性に優れているため、後から機能追加・削除を柔軟に行えます。しかしコストやメンテナンスの面では注意が必要です。また、オンプレミスですから学習による精度アップの速度は著しく下がります。
●OCR業務代行業者に委託する
OCR業務を代行業者に委託する方法です。自分たちが手を動かすことがないため人的リソースを最小限に抑えることができますし、OCRのプロが行うため品質面やスピードに期待できます。こちらの希望に対して、柔軟に対応してくれることもあるでしょう。一方、代行業者に情報を提供することになるため機密情報を含む文書については留意が必要です。
OCRの実施方法とサービスの選び方
これまでご紹介してきたように、OCRを実施するには、さまざまな選択肢があります。
その選択肢を比較して最適なものを選ばなければ、期待通りの結果が得られないこともあります。OCRの種類や実施方法、サービスは、それぞれにメリットとデメリットがあるからです。
「とりあえず、最先端技術を用いたサービスを選んでおけば間違いないだろう」と考え、AI-OCRを選択しがちですが、その選択が思わぬ落とし穴につながっていることもあるのです。それを回避するには、自社にとって最適なサービスを選定することが肝心です。そこで、OCRの実施方法やサービスの選び方のポイントをご紹介します。
●目的を明確にする
OCRを行う目的を明確にしましょう。そうすれば、自社にとって最適なサービスを判断しやすくなります。
OCRの目的として、一般的な例を挙げましょう。
・帳票のデータ入力の効率化
・データ化による検索性向上
・データ化による編集・加工性向上
・情報共有の利便性向上
・オフィスの省スペース化
多くの場合、作業効率化や組織内の情報共有のスピードUPを目的としています。またペーパーレス化を推進する一環として、オフィスの省スペース化を目指しているケースもあります。
●読み取り対象の文字タイプや形式に合っているか
OCRに読み取らせたい対象の文字タイプや形式にマッチしているかをよく確認しましょう。
・読み取り対象の文字タイプ
読み取り対象の文字タイプは、活字だけでなく、手書き文字や外国語にも対応しているかなどを確認しましょう。サービスによって差異がありますので、留意が必要です。
・読み取り対象の形式タイプ
読み取り対象の形式についても着目しておきましょう。例えば、レポートや報告書、会議議事録、書物・冊子、帳票類などが挙げられます。
●文字の認識精度は十分か
文字を読み取ったときの認識精度はサービスによって異なります。精度の詳細を問い合わせ、実際の結果を見せてもらったり、トライアルを依頼したりするのも良いでしょう。
従来型OCRとAI-OCRを比べると、確かに機械学習を重ねたAI-OCRの方が文字タイプへの対応が多様で高い精度を保つことができるかもしれませんが、必ずしも万能ではありません。前述の通り文字認識精度には限度があることを知っておきましょう。また、精度や対応力だけでは比較できません。場合によってはAI-OCRを選ぶとランニングコストが割高になったり、実行環境が限定されたりすることもあります。
●帳票の仕分け機能は備わっているか
帳票に対応しているOCRサービスの中には、仕分け機能が備わっているものがあります。仕分け機能とは、フォーマットや文書に含まれるキーワードを自動認識して仕分けてくれる機能です。帳票を読み取り対象とする場合は、この機能が効率化につながるため、ぜひ押さえておきましょう。
●読み取り後の確認・修正作業に対応しているか
精度の高いテキストが必要であれば、単にOCRで読み取るだけでなく、業者側で確認や手直しも行ってくれるかどうかは重要なポイントです。この確認・修正作業が付加されていない場合は、自分で行わなければならないためです。理想的なのは、OCRだけでなく校正作業もセットで行っているサービスです。
●コストパフォーマンスは高いか
精度や帳票仕分け機能の有無、確認・修正作業の有無など、あらゆるサービス内容を踏まえて、価格面はもちろんのこと、コストパフォーマンスの視点も持ちましょう。そうすることで、自社の目的を達成できるOCRサービスに行き着くはずです。
まとめ
OCRの概要から種類、選び方までご紹介しました。いざOCRを利用したいと考えたときに、多くの選択肢があることを知っておくことが大切です。その上で、OCRの種類やサービスの特徴を知り、自社の目的や環境にとって最適なサービスを慎重に検討されることをおすすめします。
TOPPANでは、「高精度OCR全文テキスト化サービス」をご提供しています。
お客さまに代わり、独自のOCR&校正システムによるテキスト化を行います。
旧字、ルビ、割注等のあらゆるスタイルの文字を読み取り、精度99.98%※を実現する独自の校正システムによって、用途にあったテキスト化を実施します。
※制作要件により精度が異なる場合があります。
txt、PDF、HTML、Excel等、多彩なデータ形式に変換できますので、テキスト化後の業務の効率化にも寄与します。
「高精度OCR全文テキスト化サービス」で社内報、周年史、プレスリリースなどをテキスト化し、業務効率をUPした成功事例を下記後編コラムでご紹介します。ぜひ合わせてご覧ください。
2024.11.11