- 国立情報学研究所(NII)が2026年4月3日、国産LLM「LLM-jp-4」をオープンソースで公開
- 約12兆トークンの高品質コーパスで学習。インターネット公開データ、政府・国会文書、合成データを使用
- 日本語MT-Benchで8Bモデルが7.54点、32B-A3Bモデルが7.82点。GPT-4o(7.29点)を上回る
- 32B-A3BモデルはMoE(Mixture of Experts)アーキテクチャ採用。32Bパラメータのうち3Bのみ活性化で高効率
- 今後332B-A31Bの超大型MoEモデルも2026年内に公開予定
「日本語AIは海外勢に追いつけない」——そんな常識を、国立情報学研究所(NII)が2026年4月3日に公開したLLM-jp-4が覆しました。
日本語MT-BenchでGPT-4oを上回るスコア(7.82 vs 7.29)を叩き出し、しかも完全オープンソース。
約12兆トークンの高品質コーパスと最新のMoE技術で、国産LLMの実力が世界レベルに達したことを証明するモデルです。
LLM-jp-4とは?
LLM-jp-4は、NIIの大規模言語モデル研究開発センター(LLMC)が開発した国産LLMの第4世代です。
- 開発元 — 国立情報学研究所(NII)+産学連携コンソーシアム
- 公開日 — 2026年4月3日
- ライセンス — オープンソース(商用利用可能)
- 学習データ — 約12兆トークン。公開インターネットデータ、政府・国会文書、合成データ
- モデル2種 — LLM-jp-4 8B(Dense)とLLM-jp-4 32B-A3B(MoE)
たとえるなら、LLM-jp-4は「日本語ネイティブのAI頭脳」。海外LLMが英語を母語として日本語を学ぶのに対し、LLM-jp-4は設計段階から日本語に最適化されています。
2つのモデル|8Bと32B-A3B
- LLM-jp-4 8B — 約86億パラメータのDense(全パラメータ活性化)モデル。シンプルな構成で高速推論
- LLM-jp-4 32B-A3B — 約320億パラメータのMoE(Mixture of Experts)モデル。入力ごとに3B分の専門家だけを活性化
- MoEの利点 — 大規模パラメータの知識量と、小型モデル並みの計算コストを両立
- 推論環境 — 8Bは消費者向けGPUでも動作。32B-A3Bは活性パラメータが3Bのため意外と軽量
たとえるなら、MoEモデルは「320人の専門家チームから毎回3人だけ選ぶ」方式。質問の種類に応じた専門家が回答するので、チーム全体の知識を活かしつつ処理は高速です。
ベンチマーク成績|GPT-4oを超える日本語性能
- 日本語MT-Bench — LLM-jp-4 8B:7.54点、32B-A3B:7.82点。GPT-4o:7.29点、Qwen3-8B:7.14点
- 英語ベンチマーク — 一部の英語言語理解タスクでもGPT-4oやQwen3-8Bを上回る
- 注目点 — 8BというコンパクトサイズでGPT-4o超えを達成したことが業界に衝撃
- 限界 — すべてのベンチマークで勝っているわけではなく、日本語特化領域で特に強い
12兆トークンのコーパス戦略
- 公開インターネットデータ — 日本語Web全体から品質フィルタリングしたテキスト
- 政府・国会文書 — 官公庁の白書、法令、国会議事録など正確で格式高い日本語
- 合成データ — AIが生成した多様なタスク向け学習データ。品質管理を経て投入
- データ洗浄 — 有害コンテンツ除去、重複排除、言語品質の自動評価
- LLM-jp Corpus v4 — 学習用コーパス自体もオープンソースで公開
海外LLMとの比較
- GPT-4o(OpenAI) — 多言語能力は高いが日本語MT-Benchで7.29点。LLM-jp-4に逆転される
- Qwen3-8B(Alibaba) — 中国語に強い8Bモデル。日本語MT-Bench 7.14点でLLM-jp-4より低い
- Gemma 3(Google) — 軽量高性能だが日本語特化ではない
- LLM-jp-4 32B-A3B — 日本語特化+MoE効率化でコスト対性能が突出
活用シーンと想定ユーザー
- 行政機関 — 公文書要約、国会答弁分析、住民問い合わせ対応AI
- 企業 — 社内文書検索、日本語チャットボット、議事録要約
- 教育 — 日本語教育AI、学生向け質問応答システム
- 研究 — 日本語NLP研究の基盤モデルとして学術利用
- スタートアップ — 商用利用可能なOSSとして自社サービスに組み込み
今後のロードマップ
- LLM-jp-4 32B Dense — 320億パラメータの全パラメータ活性化モデル。2026年内公開予定
- LLM-jp-4 332B-A31B — 3,320億パラメータのMoE超大型モデル。31B活性化。2026年内目標
- マルチモーダル対応 — 画像・音声入力への拡張も研究段階
- 産学連携拡大 — コンソーシアム参加企業との共同開発・実証実験
よくある質問(FAQ)
Q. 商用利用できますか?
はい。
オープンソースライセンスで公開されており、商用利用が可能です。
ライセンス詳細はGitHubリポジトリで確認してください。
Q. 個人のPCで動かせますか?
LLM-jp-4 8Bは消費者向けGPU(VRAM 16GB〜)で推論可能です。32B-A3BもMoE構成のため活性パラメータは3Bと軽量ですが、モデル全体のロードにはVRAM 24GB以上が推奨されます。
Q. GPT-4oより本当に優れていますか?
日本語MT-Benchでは上回っていますが、すべてのタスクで勝っているわけではありません。
特に日本語理解・生成に特化した領域で強みを発揮します。
英語や多言語処理はGPT-4oに一日の長があります。
Q. 学習データに個人情報は含まれていますか?
NIIは個人情報の除去・フィルタリングを実施したとしています。コーパス(LLM-jp Corpus v4)もオープンソースで公開されており、透明性が高い点が特徴です。
まとめ
この記事のポイントを振り返りましょう。
- LLM-jp-4はNIIが開発した国産オープンソースLLM。12兆トークンで学習
- 日本語MT-BenchでGPT-4oを上回る7.82点(32B-A3B)を達成
- MoEアーキテクチャで32Bパラメータの知識を3Bの計算コストで活用
- 行政・企業・教育・研究に幅広く展開可能。商用利用OK
- 2026年内に332B超大型モデルの公開も予定
LLM-jp-4は、「日本のAI自給率を引き上げる」重要な一歩です。
海外APIに依存せず、国内データで学習した高性能LLMを自由に使える環境——これが行政、企業、研究のすべてで活用され始めれば、日本のAI競争力は確実に上がります。
まずはGitHubからモデルをダウンロードし、試してみましょう。
参考文献
- 国立情報学研究所. (2026). LLM-jp-4 8Bモデル・32B-A3Bモデルをオープンソースライセンスで公開. NII プレスリリース
- gihyo.jp. (2026). NII、約12兆トークンのコーパスで学習した「LLM-jp-4」を公開. gihyo.jp
- Qiita. (2026). 国産LLM「LLM-jp-4」が日本語MT-BenchでGPT-4oを上回った──技術的背景と実用性を検証. Qiita
- AI/DX Media. (2026). 国立情報学研究所、国産LLM「LLM-jp-4」をオープンソース公開. AI/DX Media
- LLM-jp GitHub. GitHub


