イベントレポート

【イベントレポート】
生成AI・RAGを企業として
活用していくためのステップとは

2025年2月に開催したWebセミナー「【TOPPAN×PKSHA】生成AI・RAGを企業として活用していくためのステップとは」では、多くの方にお申し込みいただき、誠にありがとうございました。

今回のセミナーでは生成AIを活用したナレッジ・マネジメント・プラットフォームを提供するPKSHA Workplaceと、様々な形式のドキュメントをAIが読み取りやすい形に最適化するソリューションを持つTOPPANエッジの2社が、企業におけるRAGの導入効果及びハードル、そしてハードルをクリアするためのステップを事例をもとに解説しました。

受講された方々からは「AIを業務に活用する手法について分かりやすく説明されていた」「生成AIを利用するうえでの基本的な考えが理解できた」「RAGを導入するうえでデータの構造化が必要なことが理解できた」などのお声をいただき、大変好評いただいた講演内容となりました。

本ページでは開催されたセミナー内容をレポートとして公開いたします。
参加できなかった方、参加された方も振り返りとして、ぜひ皆さまの業務にお役立てください。

佐々木 勇人 氏
株式会社PKSHA Workplace
Partner Allianceグループ リーダー

木村 基仁哉
TOPPANエッジ株式会社
ビジネスイノベーション本部 事業営業部


生成AIを活用した業務効率化のトレンドとは

ChatGPTの登場から約2年が経過した現在、生成AIを利用した業務効率化の検証が進む中で、多くの企業が社内での活用を検討しているのがRetrieval-Augmented Generation(検索拡張生成)という技術です。

このRAGという技術は、ChatGPTのような大規模言語モデルのデータベースに加え、社内のデータから情報を検索し、回答させる技術を指します。この技術により、ユーザーが質問を入力すると、AIが社内データベースや外部情報を検索して適切な情報を取得し、回答が可能となります。これにより業務やユースケースに特化したAIを社内に実装し、属人化の解消や業務効率化の実現が期待できます。

RAG活用における課題とは

しかし、そんなRAG活用も取り組みが進んでいくうえで課題が明らかになってきています。
人が読むことを前提に作成されたドキュメントでは、生成AIが正しく情報を処理することができず、ハルシネーションと呼ばれるような誤回答を起こしてしまうのです。
この課題により、なかなかRAGの本格導入に至らないというケースが見られています。

RAG活用における誤回答例

具体的には生成AIは段落表現や図/表などにおけるテキスト同士の相関関係を適切に理解できない場合が多いです。またAIが検索する社内ドキュメントのフォーマットにバラつきがあることも誤回答につながるとされています。
佐々木さんの講演ではRAGの精度検証の実例についてご紹介いただき、同じアルゴリズムを使用したRAGであっても、読み取るデータにより正答率に大きな差が出る可能性について解説されました。

検証概要 テスト用の質問を一定数用意し、回答に必要なドキュメントをアップ
テスト用の質問をRAGに回答させ、得られた回答をもとに精度の評価
検証部門 情報システム部門、人事・総務部門、開発部門、
財務・経理部門、営業部門、法務部門
検証軸 ①テスト質問に対する回答を「正しい」「一部正しい」「誤答」の3軸で評価
②「正しい」「一部正しい」に該当した回答割合を算出し、精度の評価を行う
▲AIの性能だけでなく、利用するドキュメント側がAIにとって理解しやすいものであることが重要

回答精度向上のための「参照データの構造化」とは

こうした誤回答のリスクを抑える方法として、AIが参照するデータを構造化するという手法があります。データの構造化とは、前述した「人が理解しやすいように作られているマニュアル」をAIが読みやすいAIリーダブルな形式に加工することを指しています。我々人間は書き手の意図を汲み取って、どこに何が書いてあるかをレイアウトから視覚的に判断することができます。しかし生成AIも同様の解釈をして、100%正しい情報を取得できるかというとNOです。
木村さんの講演では構造化の具体的な手法について解説いただいたので、本レポートでもいくつかご紹介します。

構造化例①:テキスト「階層分け/段組みの解除」

下の図のように網掛けやハイライトなどで、項目を識別している資料はよく見かけますが、AIにとっては読み取ることが難しいので、テキスト同士の優先順位が分かるように、データ上の見出しに親・子の情報を持たせることで、文章同士の関係性を明確化していきます。

構造化例②:表「セル結合の解除」

表におけるセル結合もRAGを活用するうえで、よくある悩みの種となり得ます。
セル結合されてしまった表は、生成AIがどのテキストがどのカラムにかかっているのかを理解できず、ハルシネーションを起こしてしまう可能性があるのです。構造化データとしては、右表のようなカラム同士が1対1の関係になるようにセルを分解していき、相互の関係を明確化していきます。

構造化例③:図「要素の分解」

図の理解は生成AIにとって難しいため、分解が必要

その他にも図のようなドキュメントでよく見られる、線や矢印で視覚的に表現された図形やイラストに情報が含まれている場合も、誤回答の大きな要因の一つになります。
そういった場合は、図形内の要素をテキスト情報として抜き出したり、各要素同士の関係性を理解できるように整えていきます。
また一枚の画像データとして図が貼り付けされてしまっている場合は、OCR処理を施したうえでテキスト情報を抜き出すことで、データを構造化していきます。


PKSHAグループとTOPPANエッジが実現する新RAGサービスについて

RAGの回答精度を高め業務に活用するために、文書を構造化することにあわせて、対となる検索アルゴズムもデータに最適な形でチューニングする必要があります。

こういった背景もあり、昨年9月に生成AIの高度な技術力を持つPKSHAグループとTOPPANエッジで生成AIの回答精度向上を実現する新サービス「高品質な対話型マニュアルサービス」を共同開発することをリリースしました。
お客さまからマニュアルなどのデータを受け取り、TOPPANエッジがデータを構造化し、PKSHAグループが構造化データに最適化した検索アルゴリズムを新たに開発し、生成AIの回答を生成させます。こうすることで、お客さまがチャットボットを介して質問したことに対して、適切な回答を行うことができるようになります。

※ニュースリリースの詳細はこちら
PKSHAグループとTOPPANエッジ、生成AIの回答精度向上を実現する新RAGサービスを共同開発

サービスの提供フローイメージ

既に一部の金融機関で規定類やマニュアルを題材に実証実験も実施し、ドキュメントの参照正解率が95%と非常に高い成果を得ることができました。特に図表回りにおける正解率が非常に高くなったことで、図表が多いといわれている日本のドキュメントにおいて構造化が非常に有効だということを実証できました。

ただ、情報の過不足や誤回答が全て無くなったというわけではなく、ハルシネーションは一部残る結果となりました。いくら構造化を実施したからといって、元々の文章が分かりにくい表現になっている場合は、構造化を行っても正しい回答を生成することは難しいです。また専門用語や、略称を生成AIが理解できず、誤回答を発生するといったことが挙げられます。
こうした場合、参照元データの文書内に、あらかじめ説明文などを入れておくなど、元々の文書を作成する段階から、生成AIが理解できるようにする工夫が必要だと分析しています。

まとめ

TOPPANエッジとPKSHAグループは「必要な情報アクセスに多くの時間を要する」というお客さまの課題を、高品質な対話型マニュアルサービスを経て、これからも解決していきたいと考えます。
その先駆けとして、PKSHAグループと共同で、AIヘルプデスクと構造化の価値実証ができるPoVプランの提供を始めています。
約1000ページのドキュメントを対象に、当社の参照データの構造化、PKSHAグループの検索アルゴリズムを用いた際の回答精度の評価が可能です。
RAG未導入の方には、社内問い合わせ削減のため生成AI活用を始められ、既にRAGを活用している企業においても、回答精度に課題を抱えている場合はぜひ一度、構造化とアルゴリズムによる高品質な対話型マニュアルサービスをご体験いただければと思います。
詳細について気になる方はお気軽にお問合せください。


これまでは必要な情報を取得するために、対象のマニュアルを探しに行ったり、有識者にヒアリングを行ったり、多くの時間をかけて検索を行う必要がありました。しかし「対話型マニュアルサービス」を活用することで、必要な情報を瞬時に得ることができます。その結果、日常の業務における負担を軽減し、業務プロセスの効率化を実現することで、最適な従業員体験を提供していき、これからの時代における業務の新しい在り方を目指していきたいと考えています。

※ 本記事の内容、登壇者のプロフィール情報はセミナー開催当時のものです。

2025.04.04

新着記事 LATEST ARTICLE
    人気記事 POPULAR ARTICLE