税務作業1/3短縮|OpenAI×Thriveが見せた自己進化AIの正体

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • OpenAIとThrive Holdingsが2026年5月27日、自己進化型の税務AIエージェントを発表
  • 30社以上の会計事務所で7,000件の申告書を処理、最大97%の精度を達成
  • 準備時間は約1/3短縮、スループットは約50%向上という具体数字を公表
  • 当初の正答率25%から6週間で86%まで自動成長したCodexの新しい使い方
  • 日本のfreee・TKC・マネーフォワードの動きとの違いと、士業の未来像

「AIが税理士の仕事を奪う」と言われ続けて数年。ついに、自分で間違いを直しながら賢くなる税務AIが実用化されました。OpenAIが2026年5月27日に公開した実例は、単なる試作ではなく7,000件の本物の申告書をさばいた現場の話です。何が変わるのか、3分で整理します。

OpenAIが見せた「自己進化する税務AI」とは

2026年5月27日、突然のリリース

OpenAIは2026年5月27日、自社ブログで税務エージェントの構築事例を公開しました。

パートナーはThrive Holdings。OpenAIが2025年12月に出資した持株会社です。

両社のエンジニアが約6ヶ月かけて開発し、ようやく成果が世に出た形になります。

狙いは、米国の会計事務所が抱える「忙しすぎる確定申告シーズン」を救うこと。一番きつい仕事をAIに任せて、人は最終チェックに集中する。そんな分業を技術的に成立させました。

なぜ「自己進化型」と呼ばれるのか

このAIの特徴は、使えば使うほど自動で賢くなる点にあります。

仕組みはシンプルです。会計士がAIの間違いを修正すると、その修正データが自動で蓄積されます。

蓄積されたデータをOpenAIのCodex(人間のかわりにコードを書くAI)が読み込み、「同じ間違いを繰り返さないように」プログラム自体を書き換えます。

つまり、AIが自分のソースコードを直しながら成長していくのです。ベテラン会計士の手直しが、そのまま全国の事務所のAI性能アップにつながる構造になっています。

7,000件で実証された性能

実証実験はCrete Professional Allianceという会計事務所ネットワークで行われました。

参加事務所は30社以上。処理された申告書は7,000件に達します。

対象はおもに1040フォーム(個人所得税)と1041フォーム(信託・遺産税)。日本でいえば確定申告書Bと相続関連書類のような重い案件です。

数字で見るインパクト:97%精度・1/3短縮の意味

25%から86%へ、6週間の成長カーブ

もっとも衝撃的なのは、AIが学習する速度です。

導入直後、「フィールドの75%以上を正しく埋められた申告書」の割合はわずか25%でした。

ところが6週間後、その数字は86%まで跳ね上がっています。

人間の新入社員が3年かけて到達するレベルに、AIは1ヶ月半で届いた計算になります。最終的な書類精度は最大97%とされ、商用レベルの実用域に入りました。

準備時間1/3カット、処理量1.5倍

会計士の体感としても、変化は明確だったようです。

申告書1件あたりの準備時間が約1/3短縮されたと報告されています。

さらに、同じ人数で処理できる申告書の数は約50%増加。働く時間が減り、扱える件数は1.5倍になった形です。

確定申告期の深夜残業に苦しむ業界にとって、これは小さくない数字です。受け入れられる顧客数の上限が、組織を増やさずに1.5倍になるからです。

狙ったのは「やっかいな案件」

注目すべきは、AIが任されたのが簡単な書類ではないという点です。

対象は中〜高複雑度の申告書。書類が散らかっていたり、K-1(パートナーシップ収入の通知書)が絡んだりする案件です。

つまり、もっとも作業時間を食い、もっとも間違いが出やすい領域をAIが引き受けました。「楽な仕事だけAIに渡した」のではなく、もっとも痛い部分から切り込んだことになります。

仕組みのキモは「評価インフラ」

フィードバックループの3段構造

このAIが自己進化できる理由は、3つのデータが循環していることです。

  • 会計士からの直接フィードバック(「ここは違う」というコメント)
  • 過去の修正履歴の完全なログ(誰がどこをどう直したか)
  • 実際に提出された申告書の本番データ

この3つをCodexが解析し、「特定の修正が頻発しているパターン」を見つけ出します。

見つかったら、関連するコードや判断ルールをCodex自身が書き直す。そのうえで自動テストを走らせ、改善が確認できれば本番に反映されます。

「評価インフラ」が決め手

このループを成立させているのが評価インフラ(テスト用の検証環境)です。

AIが書き換えたコードが本当に良くなったかを、本物の申告データで何百回も検算します。

ベテラン会計士が監修した「正解パターン」と比べて、精度が上がっていなければ修正は採用されません。

OpenAIはこの仕組みを「人間の専門知を本気で取り込めるエージェント設計の鍵」と位置づけました。Codexは単なるコード生成AIではなく、評価環境とセットで初めて自己進化できる道具になる、というのが今回のメッセージです。

競合と何が違うのか

既存のAI会計ソフトとの違い

会計AIといえば、これまで日本ではfreeeやマネーフォワードが先行してきました。

freeeは2026年に「Advisor AI」を発表し、顧問先からの質問にAIが一次回答する仕組みを提供しています。TKCも「AI-TAX」というハイブリッド型サービスを展開中です。

これらは「質問に答える」「仕訳を提案する」までを担います。一方、OpenAIとThriveの新システムは申告書そのものをドラフト生成する段階に入っており、踏み込み方が一段深くなっています。

「使うほど賢くなる」が新しい

もうひとつの違いは、現場のフィードバックがそのままモデル改善に反映される点です。

従来の会計AIは、ベンダーがアップデートしない限り賢くなりませんでした。

新システムは現場の修正データが直接Codexの学習材料になります。事務所側にとっては、自分たちの専門知識を残しながらAIが育つメリットがあります。

知的財産はThrive側が保有

大手AI企業との提携では珍しく、成果物の知的財産権はThrive Holdingsが保有します。

つまり、業務特化型AIの「中身」は、ドメイン側が握る構造です。

これは「OpenAIはエンジン提供、業界のデータと知見はパートナーのもの」という新しい役割分担です。今後ほかの士業や専門領域でも、似た契約が増える可能性があります。

日本市場への影響:税理士の仕事はどう変わる

月20分まで圧縮された日本の現場

日本の会計AI活用も、すでに大きく進んでいます。

業界レポートによれば、AI-OCR(書類の自動データ化)と仕訳の自動推測を組み合わせることで、1クライアントあたりの月次処理コア工程は約20分まで圧縮される段階に入りました。

freee OCR v3エンジンは印刷レシートで94%、手書きで78%の認識精度を達成し、TKCのAI-TAXは法令引用付き回答までこなします。

米国モデルが日本に入ってきたら何が起きるか

では、OpenAIとThriveのような申告書ドラフト生成型のAIが日本市場に入ってきたら何が起きるでしょうか。

もっとも影響を受けるのは中堅・大手の会計事務所です。スタッフ数を増やさずに顧問先を1.5倍に増やせるなら、競争のルールが変わります。

逆に、税法解釈や複雑な相続案件で「人にしかできない判断」を提供する事務所は、AIに作業を任せて高単価業務に集中する道が開けます。「AIに置き換えられる」と「AIで武装する」の差は、ますます広がりそうです。

中小企業ユーザーへのメリット

もうひとつ見落とせないのが、中小企業や個人事業主への波及効果です。

会計事務所の処理コストが下がれば、顧問料の値下げ余地が生まれます。

これまで「税理士は高くて頼めない」と感じていた小規模事業者にとって、専門家アクセスが現実的な選択肢になる可能性があります。

よくある質問(FAQ)

Q1. このAIは日本でも使えますか?

現時点で公開されているのは米国の確定申告(1040・1041フォーム)向けの実証実験です。日本の税法に対応した版は、本記事公開時点では発表されていません。日本での提供時期は今後の発表を待つ必要があります。

Q2. 97%の精度は信頼できる数字ですか?

OpenAIの公式ブログとThrive Holdingsの発表に基づく数字で、Crete Professional Alliance内の30社以上、7,000件の処理を踏まえた実績値です。ただし対象はおもに個人所得税と信託・遺産税で、法人税やすべての書類が同じ精度になるとは限りません。

Q3. 税理士の仕事はなくなりますか?

少なくとも今回のシステムは、税理士のリプレースではなく「下書きをAIが、最終判断を人が」というハイブリッド設計です。複雑な判断や顧客折衝など、人が担う部分は依然多く残ります。むしろAIを使いこなす事務所と、使わない事務所の差が広がる構造に近づきます。

Q4. 個人情報やデータの安全性はどう守られていますか?

申告書には個人情報が大量に含まれるため、Crete Professional Allianceの実証実験では本番データを直接学習に流す前にフィルタリングと匿名化が行われたと報告されています。日本で導入する場合、個人情報保護法や税理士法に基づいたさらなる対応が必要になります。

まとめ

  • OpenAIとThrive Holdingsが2026年5月27日、自己進化型の税務AIエージェントを発表
  • 米国の30社以上、7,000件の申告書を処理し、最大97%の精度を達成
  • 準備時間1/3カット、スループット50%増という具体数字で実用性を示した
  • カギは「会計士の修正がCodexの学習データになる」評価インフラ設計
  • 日本のfreee・TKC・マネーフォワードと並走する形で、士業AIの段階が一段上がった

次のアクションとしては、自分の業務のどこに「数十時間×繰り返し作業」があるかをまず棚卸ししてみてください。そこがAI自己進化ループの最良の入口になります。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です