高精度OCRサービスはこのようなお悩みに最適です
紙しかない古い資料のデジタル化➡貴重ドキュメント等を劣化防止のためデジタルデータで保存したい
画像データで保存している資料の全文検索 ➡キーワード検索で簡単に目的該当箇所を探し当てたい
デジタル化した資料からの高精度なテキスト抽出 ➡テキストデータを再利用して新たな媒体をつくりたい
デジタル化した資料の電子デバイス配信 ➡スマホやタブレットでも読みやすいデジタルデータを配信したい
従来の同類サービスとは異なる高精度OCR+新校正手法によるテキスト化
1.あらゆるスタイルの文字を読取可能(旧字、ルビ、割注等)
2.精度99.98%※を実現する校正システム
3.多彩なデータ形式に変換可能(txt、PDF、HTML、Excel等)
※制作要件により精度が異なる場合があります。
高精度OCRサービス 概要
「高精度OCR全文テキスト化サービス」は、TOPPANが培ってきた印刷テクノロジーを基に、
お客さまからお預かりした文書や書類をスキャン・校正しテキスト化します。独自開発のOCRシステムや校正システムを活用することで、高精度・高品質なテキストデータを生成し、多彩なデータ形式に変換します。
旧字などの難易度の高い文字への対応はもちろん、お客さまの活用方法に最適なデータ形式への変換やデジタルアーカイブシステム構築に至るまで、豊富な実績とノウハウを活かしたご提案やご提供が可能です。
高精度OCRサービス 導入事例
昭和産業株式会社様では2016年「昭和産業株式会社80周年記念誌」制作にあたり社内資料の収集~整理までを行われましたが、本誌刊行後に来たる100周年史制作と社内情報活用を見据え、整理した資料のうち歴代社内報約800点のデジタル化とデータベース構築を実施されました。本事業実現にあたり当社の「高精度全文テキスト化サービス」が大きく貢献、高いご評価をいただいています。
総合地球環境学研究所様では歴史上の環境変化を分析するために、歴史史料集から目視により関係史料を抽出して研究に利用していましたが、当社の「高精度全文テキスト化サービス」を活用し、史料原本をExcelデータ化することによって研究※1効率の向上に取り組んでおられます。
※1:内部プロジェクト関係者のみがデータを使用しています。
早稲田大学様では1978~97年に刊行された『早稲田大学百年史』をインターネット上に一般公開しています。本サイト構築にあたり当社の「高精度全文テキスト化サービス」が大きく貢献、高いご評価をいただいています。
《課題》
●キャビネや保管庫から手作業で資料を探す作業負荷が大きい
●資料のテキストを含むデジタルアーカイブ化
《ご提案》
●高精度透明テキスト付PDFへ変換し、横断検索・文章の抽出が容易に
●過去資料のテキストデータ再利用
《課題》
●明治~昭和初期の活字・手書きの貴重文献を大量に所蔵
●問い合わせ対応の業務負荷が高い
●研究員の調査活動が非効率
《ご提案》
●保存目的のためのデジタル化(スキャン)
●利用頻度の高い文献は高精度透明テキスト付PDFへ変換し、横断検索・文章の抽出が容易に
●図書館向けに販売も可能(制作コストの回収)
《課題》
●営業向けの社内教育資料を再活用したい
●20年前に編集されたものなので、時代に合わせて内容を一部改訂したい
●冊子の制作に加えてデジタル配信を行ないたい
《ご提案》
●全文テキスト化+再編集版の制作
●リフロー型電子書籍(EPUB)を同時制作し、社用のスマホ・タブレットへ電子配信
《課題》
●大学の情報発信のためのコンテンツ拡充が必要
●過去の周年史等を順次Webで無料公開予定
《ご提案》
●情報公開とテキストデータ抽出を目的に、透明テキスト付PDFとHTMLを同時制作
他社には真似できないTOPPANの高精度OCRの特徴
- 1
- 独自開発のOCRソフトで「あらゆるスタイルの文字を読み取り可能」
高精度全文テキストデータ化サービスでは、これまで対応が困難だった文字の読み取りも可能です。
旧字、和欧文混在、回転文字、ルビ付き文字、白抜き文字、絵柄の上の文字、表組、手書き文字などあらゆる文字に対応しています。従来では困難だった複雑な誌面や明治~戦前の旧文書、漢文にも実績多数。
高精度全文テキストデータ化サービスでは、これまで対応が困難だった文字の読み取りも可能です。
旧字、和欧文混在、回転文字、ルビ付き文字、白抜き文字、絵柄の上の文字、表組、手書き文字などあらゆる文字に対応しています。従来では困難だった複雑な誌面や明治~戦前の旧文書、漢文にも実績多数。
- 2
- 独自校正システムで認識精度99.98%※を実現! 独自の校正システムにより、テキスト化から校正まで一通り完結できる新技術で対応することにより、精度の高いテキストデータを提供します。基本的にお客さまの校正作業はありません。高精度なテキストデータは将来に渡りお客さまの情報資産となり、今後起こりうるデジタルトランスフォーメーションの核として活用することが可能になります。※制作要件により精度が異なる場合がございます。
独自の校正システムにより、テキスト化から校正まで一通り完結できる新技術で対応することにより、精度の高いテキストデータを提供します。基本的にお客さまの校正作業はありません。高精度なテキストデータは将来に渡りお客さまの情報資産となり、今後起こりうるデジタルトランスフォーメーションの核として活用することが可能になります。※制作要件により精度が異なる場合がございます。
- 3
- 「OCRと手入力の ハイブリッド制作システム」でコスト低減・品質向上を実現! OCR〜校正システムに加え、システム上での手入力もサポートするシステムで、1つの製造ラインでOCRと手入力をカバー。入稿原稿状態に応じて最適な製造方法を摘要し、コスト低減・品質向上を実現します。
OCR〜校正システムに加え、システム上での手入力もサポートするシステムで、1つの製造ラインでOCRと手入力をカバー。入稿原稿状態に応じて最適な製造方法を摘要し、コスト低減・品質向上を実現します。
- 4
- 多彩なデータ形式へ変換「デジタル活用で付加価値化」 テキスト形式(.txt)だけでなく、お客さまの利用目的に最適なデータ形式に変換・加工してご納品します。また、当社OCRシステムは複数データ形式の書出しにも対応していますので、編集用としてテキストデータ、検索用にPDFデータ等、デジタル化で多様な活用が可能になり、文書資産の「付加価値化」を実現します。
テキスト形式(.txt)だけでなく、お客さまの利用目的に最適なデータ形式に変換・加工してご納品します。また、当社OCRシステムは複数データ形式の書出しにも対応していますので、編集用としてテキストデータ、検索用にPDFデータ等、デジタル化で多様な活用が可能になり、文書資産の「付加価値化」を実現します。
付加価値活用 事例
-
1.テキストデータの再利用・活用で新たな価値を創出 ●AI分析の教師データや自動翻訳に用いるデータ部材として ●内外への情報公開やWebサイトコンテンツとして ●紙の貴重書からテキストデータを抽出して復刻本を制作
-
2.働き方改革・業務効率化実現の一助として ●帳票類、報告書等の紙書類入力業務を効率化 ●RPAに必要なテキストデータの作成をシステム化、人手作業減 ●文書管理システム導入で全社的に資料検索業務を改善
-
3.検索可能なデジタルアーカイブとして ●過去の年史や社内報等をアーカイブ化して年史編纂業務に流用 ●カタログやマニュアル等をアーカイブ化して広報・コールセンター等での問合せ業務改善 ●研究資料や貴重文献をアーカイブ化して図書館や資料館での調査・研究を効率化