Qwen 3.5 Small完全解説｜9Bモデルが120Bを超えた衝撃、RTX 3080で動くGPT-5級AI

公開日: 2026-03-01最終更新: 2026-04-13

監修者伊東雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

「9Bパラメータのモデルが、120Bパラメータのモデルを上回る」——AIの常識を覆す結果が出ました。

AlibabaのQwen（通義千問）チームが発表したQwen 3.5 Smallシリーズは、わずか90億パラメータのモデルで、OpenAIの1,200億パラメータモデル（GPT-OSS-120B）を複数のベンチマークで凌駕しました。

しかも一般的なゲーミングPC（RTX 3080）で動作する。

「大きいモデルが強い」という時代は、終わりつつあります。

Qwen 3.5 Smallシリーズとは

Qwen 3.5 Smallシリーズは、Alibaba Cloudが2026年3月2日に発表した4種類の軽量LLMです。

たとえるなら、Qwen 3.5 Smallシリーズは「軽自動車なのにスポーツカーの速さを出すエンジン」。少ない燃料（計算資源）で、大型車（大規模モデル）に匹敵するパフォーマンスを発揮します。

Qwen3.5-9Bの性能は、AI業界に衝撃を与えました。

GPQA Diamond（大学院レベルの科学問題） — Qwen3.5-9B: 81.7 vs GPT-OSS-120B: 71.5（13倍大きいモデルを10ポイント以上上回る）
HMMT Feb 2025（数学コンペティション） — Qwen3.5-9B: 83.2 vs GPT-OSS-120B: 76.7
MMMU-Pro（マルチモーダル理解） — Qwen3.5-9B: 70.1 vs GPT-OSS-120B: 59.7
vs GPT-5 Nano — MMMU-Proで13ポイント差、MathVisionで17ポイント差、文書理解で30ポイント差で圧勝

9Bパラメータ（90億）が120Bパラメータ（1,200億）を上回るということは、「13分の1のサイズで上位の性能」を実現したことを意味します。これはモデルのアーキテクチャが根本的に進化したことの証明です。

Qwen 3.5 Smallシリーズの驚異的な効率の秘密は、ハイブリッドアーキテクチャにあります。

たとえるなら、「必要な部署だけが対応する大企業」。

全社員（パラメータ）が同時に動くのではなく、タスクに応じて最適な専門チーム（Expert）だけが活性化する。

だから少ない人数でも、大企業並みのアウトプットが出せます。

はい。

Apache 2.0ライセンスで公開されており、商用利用・改変・再配布がすべて自由です。

利用申請やロイヤリティは不要です。

Qwen 3.5は多言語対応で、日本語にも対応しています。中国語と英語が最も得意ですが、日本語のテキスト生成・理解にも実用的な性能を示します。

0.8BモデルはCPUのみでも動作可能ですが、速度は遅くなります。

実用的な速度にはGPU（最低2GB VRAM）の使用を推奨します。

量子化（モデル圧縮）を使えば、さらに低いスペックでも動作可能です。

Hugging Faceやモデルカードからダウンロード可能です。Ollama、vLLM、llama.cppなど主要な推論フレームワークに対応しており、数コマンドで起動できます。

この記事のポイントを振り返りましょう。

「大きなモデルが強い」というAIの常識が、Qwen 3.5 Smallシリーズによって書き換えられました。

ゲーミングPCでGPT-5 mini級の性能が手に入る時代。

これはAIの民主化における決定的な転換点です。

クラウドAPIに月額料金を払わなくても、自分のPCで最先端のAIを動かせる——その未来が、もう目の前にあります。

VentureBeat. (2026). Alibaba’s small, open source Qwen3.5-9B beats OpenAI’s gpt-oss-120B. VentureBeat
Awesome Agents. (2026). Qwen 3.5 Small Series Ships Four Models From 0.8B to 9B. Awesome Agents
Artificial Analysis. (2026). Qwen3.5 small models: Everything you need to know. Artificial Analysis
ComputerTech. (2026). Qwen 3.5 Small Series Review: 120B Performance on 16GB RAM. ComputerTech
Apatero Blog. (2026). Qwen 3.5 Small Models Review: Benchmarks and Real Testing. Apatero Blog