実証実験の対象は「保証債務台帳」と「支払調書」
――実証実験を行った業務内容について教えてください。
高橋 「保証債務台帳」「支払調書」の2つの業務を対象にしました。まず保証債務台帳ですが、様々な取引先から当社に届く保証契約書や、残高証明書、利息の計算書など、多種多様な内容の書類を1つの表形式の保証債務台帳として転記する作業が発生します。
若山 この作業を四半期に1度行っているのですが、書式はもちろん、言語も統一されていない資料と格闘して情報を抜き出さなければいけないため非常に大変です。例えばタイ語などなじみのない言語で書かれている書類では、それが何の書類なのか一目で判断することができません。
日本語やアルファベット以外の文字は、簡単に入力・検索することもできないので、そういう場合は、その言語が分かる営業担当者のサポートを手掛かりに進めますが、とにかく手間と時間がかかるうえ、その営業担当者の言葉を信じるほかないという状態になってしまいます。
主計部
業務プロセス統括室
次長
主計部
業務プロセス統括室
角谷 この課題を解決するため、書類をスキャンしてPDFファイルに変換して、決められたフォルダーに入れるだけで、OCRと生成AIを活用して台帳用のデータ抽出を自動で行う仕組みを構築しました。
――開発にはどれぐらいの時間がかかりましたか。
角谷 実証実験は2024年の4~5月の2カ月間でしたが、前半の1カ月は書類のインプットから、OCRと生成AIによるデータ抽出や経理判断処理、AI処理結果のアウトプットまでを一気通貫で自動化するフローを開発しました。
そして後半の1カ月は、出力の精度を上げるために「スプリント(短期サイクルの開発プロセス)」を実行しました。週に1回、双方で集まって改善するポイントを話し合い、翌週までに改善を実施して再び確認する作業を繰り返しました。
ディレクター
総合商社担当
シニアマネージャー
税務レポーティング・ストラテジー
「Multi-Agent」で精度が飛躍的に向上
――生成AIの処理の精度について、三菱商事側はどう感じましたか。
若山 実験の前半では、精度は50%と高くなかったため心配にはなりました。書類が複雑で種類も多すぎるため、一連の処理の部分を改善していく手立てを考える必要がありました。
そうした中、PwC税理士法人から「Multi-Agent」という複数のAIが協働する仕組みの構築の提案を頂き、そこから精度が上がっていきました。
角谷 当法人も過去の実装経験から、複雑な書類の読み込みは単純な生成AIの導入だけでは難しいと感じていました。そこで、「Multi-Agent」型の仕組みを導入しようと考えました。
例えば、1人の人間に100の仕事を同時に与えると、それだけでパニックになってしまうのと同じように、AIも1つのAIに多種多様なデータやタスクを与えるとミスが多くなります。そこで、請求書専用AI、契約書専用AIといったように書類タイプごとにAIを複数並べて、それらを協働させるシステムを作りました。言うならば、個々のAIに別々の「人格」を持たせたようなイメージです。今回のプロジェクトでは、5つほどのAIを用意し、それらを統括する「管理職」的なAIも加えて業務プロセスを自動化しています。
――支払調書を処理する実証実験ではどのような違いがあったのでしょうか。
高橋 こちらは、書類の内容を読み取って、税法上の支払調書に該当するのかを生成AIに判断させる検証を行いました。そのため、書類から情報を抜き出しただけの保証債務台帳よりも一段レベルの高い処理だと思います。
当初はAIに税法を読み込ませそれを基に判定させたのですが、これだけではいい結果は得られず、インターネット検索の情報などを追加することで精度を上げることができました。
角谷 現在のAIは、まだ税法を正確に解釈して判断することができないケースが多いです。そこで、より具体的な事例を文章に追加したり、ネット検索で得た支払先企業の事業概要などの情報を加えたり、過去にあった類似取引や判定結果を読み込ませたりと、様々なソースからの情報を集約してAIに投入することで精度向上を実現しました。
チャットボットだけではない、生成AIがもたらす業務変革の可能性
――今回の実証実験の結果をどのように感じていますか。
高橋 満足のいく結果になったと感じています。「Multi-Agent」の効果が大きかったのもそうですが、さらに精度を上げていくスプリントの過程で、インプットするデータを工夫すればいいとか、さらにAIを追加すべきであるなどと、PwC Japanグループから毎週新しい改善の提案があったことが、今回の飛躍的な精度改善につながったのだと思います。今回の実験対象業務が財務経理業務でしたので、そこに対してPwC税理士法人の豊富な知見が役に立ちました。今回の実験で、AIは、AI自体の賢さよりも、使い手の工夫と使い方が肝になるのだということを学びました。
若山 保証債務台帳に抽出できたデータの正解率は、平均97%と非常に高い精度が得られました。また支払調書の判定も最終的に再現率98%まで上げることができました。この結果には非常に満足しています。
坂元 私も実験当初は心配しましたが、2カ月という短期間で急速に精度が上がっていく状況を目の当たりにして、スプリント段階での生成AIのさらなる可能性を実感しました。今回は財務経理のプロジェクトでしたが、他の業務にも展開が可能で、ビジネスを大きく変えることができるポテンシャルを感じました。
西原 今回の実証実験は、汎用的な生成AIを用いた実験だったというのが1つ特徴だと思っています。業務に特化した大量の学習を積み重ねたモデルではなく、いわば普段使いの生成AIで、個別具体的な経理業務において、非常に高い精度が実証され、今後AIの活用余地は広がっていくだろうと強く感じました。この結果を踏まえ、将来的にはAIに任せる部分、人が注力する部分をうまく織り交ぜた形での業務設計をしていきたいと考えています。社員が人にしかできない仕事に注力できる環境を提供できる、生成AIと人がコラボレーションする世界をイメージしながら、今後も業務改革を進めてまいります。
川崎 生成AIというと、 チャットボットのイメージが非常に強いと思います。今回のプロジェクトは、実際の業務プロセスに生成AIを組み込み、さらには人が判断する部分も一部生成AIで代替できることが証明できました。チャットボット以外で生成AIが財務経理業務で応用ができることを具体的に確認できたことは非常に革新的な事例になったと思います。
ただし、実際に業務に適用する際には人によるレビューは必要不可欠です。経理業務は企業の根幹を担う情報を扱うため、機密情報はマスキングするなど、データのセキュリティーにはとくに注意する必要があります。AIをはじめとするテクノロジー技術と財務経理や税務の実務の双方に知見を持つ、私たちPwC税理士法人がお役に立てればと思っています。
生成AIには多くの可能性があると思っていますので、今後も生成AIの有効活用の拡大に向けて、さらなる開発を進めていくとともに、多くのクライアントに体験していただけるよう準備に取り組んでまいります。
生成AI(Generative AI)コンサルティングサービス
生成AI活用による税務業務改革と価値創出支援サービス