国産LLM「LLM-jp-4」完全解説｜GPT-4o超えの日本語性能とMoEアーキテクチャ

公開日: 2026-04-04最終更新: 2026-04-13

監修者伊東雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube

国立情報学研究所（NII）が2026年4月3日、国産LLM「LLM-jp-4」をオープンソースで公開
約12兆トークンの高品質コーパスで学習。インターネット公開データ、政府・国会文書、合成データを使用
日本語MT-Benchで8Bモデルが7.54点、32B-A3Bモデルが7.82点。GPT-4o（7.29点）を上回る
32B-A3BモデルはMoE（Mixture of Experts）アーキテクチャ採用。32Bパラメータのうち3Bのみ活性化で高効率
今後332B-A31Bの超大型MoEモデルも2026年内に公開予定

「日本語AIは海外勢に追いつけない」——そんな常識を、国立情報学研究所（NII）が2026年4月3日に公開したLLM-jp-4が覆しました。

日本語MT-BenchでGPT-4oを上回るスコア（7.82 vs 7.29）を叩き出し、しかも完全オープンソース。

約12兆トークンの高品質コーパスと最新のMoE技術で、国産LLMの実力が世界レベルに達したことを証明するモデルです。

LLM-jp-4とは？

LLM-jp-4は、NIIの大規模言語モデル研究開発センター（LLMC）が開発した国産LLMの第4世代です。

開発元 — 国立情報学研究所（NII）＋産学連携コンソーシアム
公開日 — 2026年4月3日
ライセンス — オープンソース（商用利用可能）
学習データ — 約12兆トークン。公開インターネットデータ、政府・国会文書、合成データ
モデル2種 — LLM-jp-4 8B（Dense）とLLM-jp-4 32B-A3B（MoE）

たとえるなら、LLM-jp-4は「日本語ネイティブのAI頭脳」。海外LLMが英語を母語として日本語を学ぶのに対し、LLM-jp-4は設計段階から日本語に最適化されています。

2つのモデル｜8Bと32B-A3B

LLM-jp-4 8B — 約86億パラメータのDense（全パラメータ活性化）モデル。シンプルな構成で高速推論
LLM-jp-4 32B-A3B — 約320億パラメータのMoE（Mixture of Experts）モデル。入力ごとに3B分の専門家だけを活性化
MoEの利点 — 大規模パラメータの知識量と、小型モデル並みの計算コストを両立
推論環境 — 8Bは消費者向けGPUでも動作。32B-A3Bは活性パラメータが3Bのため意外と軽量

たとえるなら、MoEモデルは「320人の専門家チームから毎回3人だけ選ぶ」方式。質問の種類に応じた専門家が回答するので、チーム全体の知識を活かしつつ処理は高速です。

ベンチマーク成績｜GPT-4oを超える日本語性能

日本語MT-Bench — LLM-jp-4 8B：7.54点、32B-A3B：7.82点。GPT-4o：7.29点、Qwen3-8B：7.14点
英語ベンチマーク — 一部の英語言語理解タスクでもGPT-4oやQwen3-8Bを上回る
注目点 — 8BというコンパクトサイズでGPT-4o超えを達成したことが業界に衝撃
限界 — すべてのベンチマークで勝っているわけではなく、日本語特化領域で特に強い

12兆トークンのコーパス戦略

公開インターネットデータ — 日本語Web全体から品質フィルタリングしたテキスト
政府・国会文書 — 官公庁の白書、法令、国会議事録など正確で格式高い日本語
合成データ — AIが生成した多様なタスク向け学習データ。品質管理を経て投入
データ洗浄 — 有害コンテンツ除去、重複排除、言語品質の自動評価
LLM-jp Corpus v4 — 学習用コーパス自体もオープンソースで公開

海外LLMとの比較

GPT-4o（OpenAI） — 多言語能力は高いが日本語MT-Benchで7.29点。LLM-jp-4に逆転される
Qwen3-8B（Alibaba） — 中国語に強い8Bモデル。日本語MT-Bench 7.14点でLLM-jp-4より低い
Gemma 3（Google） — 軽量高性能だが日本語特化ではない
LLM-jp-4 32B-A3B — 日本語特化＋MoE効率化でコスト対性能が突出

活用シーンと想定ユーザー

行政機関 — 公文書要約、国会答弁分析、住民問い合わせ対応AI
企業 — 社内文書検索、日本語チャットボット、議事録要約
教育 — 日本語教育AI、学生向け質問応答システム
研究 — 日本語NLP研究の基盤モデルとして学術利用
スタートアップ — 商用利用可能なOSSとして自社サービスに組み込み

今後のロードマップ

LLM-jp-4 32B Dense — 320億パラメータの全パラメータ活性化モデル。2026年内公開予定
LLM-jp-4 332B-A31B — 3,320億パラメータのMoE超大型モデル。31B活性化。2026年内目標
マルチモーダル対応 — 画像・音声入力への拡張も研究段階
産学連携拡大 — コンソーシアム参加企業との共同開発・実証実験

よくある質問（FAQ）

Q. 商用利用できますか？

はい。

オープンソースライセンスで公開されており、商用利用が可能です。

ライセンス詳細はGitHubリポジトリで確認してください。

Q. 個人のPCで動かせますか？

LLM-jp-4 8Bは消費者向けGPU（VRAM 16GB〜）で推論可能です。32B-A3BもMoE構成のため活性パラメータは3Bと軽量ですが、モデル全体のロードにはVRAM 24GB以上が推奨されます。

Q. GPT-4oより本当に優れていますか？

日本語MT-Benchでは上回っていますが、すべてのタスクで勝っているわけではありません。

特に日本語理解・生成に特化した領域で強みを発揮します。

英語や多言語処理はGPT-4oに一日の長があります。

Q. 学習データに個人情報は含まれていますか？

NIIは個人情報の除去・フィルタリングを実施したとしています。コーパス（LLM-jp Corpus v4）もオープンソースで公開されており、透明性が高い点が特徴です。

まとめ

この記事のポイントを振り返りましょう。

LLM-jp-4はNIIが開発した国産オープンソースLLM。12兆トークンで学習
日本語MT-BenchでGPT-4oを上回る7.82点（32B-A3B）を達成
MoEアーキテクチャで32Bパラメータの知識を3Bの計算コストで活用
行政・企業・教育・研究に幅広く展開可能。商用利用OK
2026年内に332B超大型モデルの公開も予定

LLM-jp-4は、「日本のAI自給率を引き上げる」重要な一歩です。

海外APIに依存せず、国内データで学習した高性能LLMを自由に使える環境——これが行政、企業、研究のすべてで活用され始めれば、日本のAI競争力は確実に上がります。

まずはGitHubからモデルをダウンロードし、試してみましょう。

参考文献

国立情報学研究所. (2026). LLM-jp-4 8Bモデル・32B-A3Bモデルをオープンソースライセンスで公開. NII プレスリリース
gihyo.jp. (2026). NII、約12兆トークンのコーパスで学習した「LLM-jp-4」を公開. gihyo.jp
Qiita. (2026). 国産LLM「LLM-jp-4」が日本語MT-BenchでGPT-4oを上回った──技術的背景と実用性を検証. Qiita
AI/DX Media. (2026). 国立情報学研究所、国産LLM「LLM-jp-4」をオープンソース公開. AI/DX Media
LLM-jp GitHub. GitHub

こんな時代だから遊んで学びたい

AIを学ぶオンラインサロン「AIフレンズ」では、生成AIを楽しく、どこよりも優しく学べる環境をご用意しております。

毎週開催されるオンラインセッションでは、リアルタイムで学び合える機会を提供しています。さらに、月に一度のオフラインイベントでは、メンバー同士が直接交流し、アイデアや知識を深めることができます。

「AIフレンズ」の仲間とともに、新しい価値を創造し、可能性を広げてみませんか？

一緒に学び、成長しながら、生成AIを使いこなす力を身につけましょう！

今すぐAIフレンズに参加して、未来への第一歩を踏み出そう！！

76 COMMENTS

hackmd.okfn.de 2026-05-31

References:

Online slot machines real money hackmd.okfn.de