国産LLM「LLM-jp-4」完全解説|GPT-4o超えの日本語性能とMoEアーキテクチャ

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • 国立情報学研究所(NII)が2026年4月3日、国産LLM「LLM-jp-4」をオープンソースで公開
  • 約12兆トークンの高品質コーパスで学習。インターネット公開データ、政府・国会文書、合成データを使用
  • 日本語MT-Benchで8Bモデルが7.54点、32B-A3Bモデルが7.82点。GPT-4o(7.29点)を上回る
  • 32B-A3BモデルはMoE(Mixture of Experts)アーキテクチャ採用。32Bパラメータのうち3Bのみ活性化で高効率
  • 今後332B-A31Bの超大型MoEモデルも2026年内に公開予定

「日本語AIは海外勢に追いつけない」——そんな常識を、国立情報学研究所(NII)が2026年4月3日に公開したLLM-jp-4が覆しました。

日本語MT-BenchでGPT-4oを上回るスコア(7.82 vs 7.29)を叩き出し、しかも完全オープンソース。

約12兆トークンの高品質コーパスと最新のMoE技術で、国産LLMの実力が世界レベルに達したことを証明するモデルです。

LLM-jp-4とは?

LLM-jp-4は、NIIの大規模言語モデル研究開発センター(LLMC)が開発した国産LLMの第4世代です。

  • 開発元 — 国立情報学研究所(NII)+産学連携コンソーシアム
  • 公開日 — 2026年4月3日
  • ライセンス — オープンソース(商用利用可能)
  • 学習データ — 約12兆トークン。公開インターネットデータ、政府・国会文書、合成データ
  • モデル2種 — LLM-jp-4 8B(Dense)とLLM-jp-4 32B-A3B(MoE)

たとえるなら、LLM-jp-4は「日本語ネイティブのAI頭脳」。海外LLMが英語を母語として日本語を学ぶのに対し、LLM-jp-4は設計段階から日本語に最適化されています。

2つのモデル|8Bと32B-A3B

  • LLM-jp-4 8B — 約86億パラメータのDense(全パラメータ活性化)モデル。シンプルな構成で高速推論
  • LLM-jp-4 32B-A3B — 約320億パラメータのMoE(Mixture of Experts)モデル。入力ごとに3B分の専門家だけを活性化
  • MoEの利点 — 大規模パラメータの知識量と、小型モデル並みの計算コストを両立
  • 推論環境 — 8Bは消費者向けGPUでも動作。32B-A3Bは活性パラメータが3Bのため意外と軽量

たとえるなら、MoEモデルは「320人の専門家チームから毎回3人だけ選ぶ」方式。質問の種類に応じた専門家が回答するので、チーム全体の知識を活かしつつ処理は高速です。

ベンチマーク成績|GPT-4oを超える日本語性能

  • 日本語MT-Bench — LLM-jp-4 8B:7.54点、32B-A3B:7.82点。GPT-4o:7.29点、Qwen3-8B:7.14点
  • 英語ベンチマーク — 一部の英語言語理解タスクでもGPT-4oやQwen3-8Bを上回る
  • 注目点 — 8BというコンパクトサイズでGPT-4o超えを達成したことが業界に衝撃
  • 限界 — すべてのベンチマークで勝っているわけではなく、日本語特化領域で特に強い

12兆トークンのコーパス戦略

  • 公開インターネットデータ — 日本語Web全体から品質フィルタリングしたテキスト
  • 政府・国会文書 — 官公庁の白書、法令、国会議事録など正確で格式高い日本語
  • 合成データ — AIが生成した多様なタスク向け学習データ。品質管理を経て投入
  • データ洗浄 — 有害コンテンツ除去、重複排除、言語品質の自動評価
  • LLM-jp Corpus v4 — 学習用コーパス自体もオープンソースで公開

海外LLMとの比較

  • GPT-4o(OpenAI) — 多言語能力は高いが日本語MT-Benchで7.29点。LLM-jp-4に逆転される
  • Qwen3-8B(Alibaba) — 中国語に強い8Bモデル。日本語MT-Bench 7.14点でLLM-jp-4より低い
  • Gemma 3(Google) — 軽量高性能だが日本語特化ではない
  • LLM-jp-4 32B-A3B — 日本語特化+MoE効率化でコスト対性能が突出

活用シーンと想定ユーザー

  • 行政機関 — 公文書要約、国会答弁分析、住民問い合わせ対応AI
  • 企業 — 社内文書検索、日本語チャットボット、議事録要約
  • 教育 — 日本語教育AI、学生向け質問応答システム
  • 研究 — 日本語NLP研究の基盤モデルとして学術利用
  • スタートアップ — 商用利用可能なOSSとして自社サービスに組み込み

今後のロードマップ

  • LLM-jp-4 32B Dense — 320億パラメータの全パラメータ活性化モデル。2026年内公開予定
  • LLM-jp-4 332B-A31B — 3,320億パラメータのMoE超大型モデル。31B活性化。2026年内目標
  • マルチモーダル対応 — 画像・音声入力への拡張も研究段階
  • 産学連携拡大 — コンソーシアム参加企業との共同開発・実証実験

よくある質問(FAQ)

Q. 商用利用できますか?

はい。

オープンソースライセンスで公開されており、商用利用が可能です。

ライセンス詳細はGitHubリポジトリで確認してください。

Q. 個人のPCで動かせますか?

LLM-jp-4 8Bは消費者向けGPU(VRAM 16GB〜)で推論可能です。32B-A3BもMoE構成のため活性パラメータは3Bと軽量ですが、モデル全体のロードにはVRAM 24GB以上が推奨されます。

Q. GPT-4oより本当に優れていますか?

日本語MT-Benchでは上回っていますが、すべてのタスクで勝っているわけではありません。

特に日本語理解・生成に特化した領域で強みを発揮します。

英語や多言語処理はGPT-4oに一日の長があります。

Q. 学習データに個人情報は含まれていますか?

NIIは個人情報の除去・フィルタリングを実施したとしています。コーパス(LLM-jp Corpus v4)もオープンソースで公開されており、透明性が高い点が特徴です。

まとめ

この記事のポイントを振り返りましょう。

  • LLM-jp-4はNIIが開発した国産オープンソースLLM。12兆トークンで学習
  • 日本語MT-BenchでGPT-4oを上回る7.82点(32B-A3B)を達成
  • MoEアーキテクチャで32Bパラメータの知識を3Bの計算コストで活用
  • 行政・企業・教育・研究に幅広く展開可能。商用利用OK
  • 2026年内に332B超大型モデルの公開も予定

LLM-jp-4は、「日本のAI自給率を引き上げる」重要な一歩です。

海外APIに依存せず、国内データで学習した高性能LLMを自由に使える環境——これが行政、企業、研究のすべてで活用され始めれば、日本のAI競争力は確実に上がります。

まずはGitHubからモデルをダウンロードし、試してみましょう。

参考文献

  • 国立情報学研究所. (2026). LLM-jp-4 8Bモデル・32B-A3Bモデルをオープンソースライセンスで公開. NII プレスリリース
  • gihyo.jp. (2026). NII、約12兆トークンのコーパスで学習した「LLM-jp-4」を公開. gihyo.jp
  • Qiita. (2026). 国産LLM「LLM-jp-4」が日本語MT-BenchでGPT-4oを上回った──技術的背景と実用性を検証. Qiita
  • AI/DX Media. (2026). 国立情報学研究所、国産LLM「LLM-jp-4」をオープンソース公開. AI/DX Media
  • LLM-jp GitHub. GitHub

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です