NTTの国産AI「tsuzumi 2」の開発者が、AIコーディングの驚くべき進化について語りました。たった5年間で、AIは「コードの次の行を予測する」段階から「プロジェクト全体を理解して自律的に開発する」レベルへと急成長しています。この記事では、その背景にある技術的な転換点と、日本のAI開発にとっての意味を解説します。
この記事でわかること
- NTT「tsuzumi 2」とは何か、なぜ注目されているのか
- AIコーディングが5年間でどう進化したのか(3つの段階)
- 2021年から2026年への具体的な変化
- データ品質が性能を左右する理由
- 日本のAI開発にとっての意味
NTT「tsuzumi 2」とは?国産LLMの実力
NTTが開発した「tsuzumi 2」は、日本語に特化した大規模言語モデル(LLM、人間のように文章を書けるAI)です。最大の特徴は、たった1つのGPU(AIの計算に使う専用チップ)で動くほど軽量でありながら、世界トップクラスの性能を持つことです。
2025年10月に商用展開を開始し、2026年5月のアップデートでは、図表やグラフを画像として理解する機能が追加されました。つまり、ビジネス文書に含まれる複雑な図も読み取れるようになったのです。
さらに注目すべきは、2026年3月にデジタル庁の「ガバメントAI」で試験導入されたことです。政府が国産AIを選んだ理由は、データの安全性と品質管理を完全にコントロールできる点にあります。海外製AIと違い、学習データの中身を把握できるため、バイアス(偏った判断)のリスクを減らせます。
AIコーディングの5年間——3つの進化段階
NTTの開発者によると、AIコーディングは5年間で3つの大きな段階を経て進化しました。
第1段階:基盤モデルの時代(2020〜2021年)
この時期、GPT-3のような基盤モデルが登場しました。これらは膨大なテキストデータで学習し、文章の続きを予測する基本的な能力を身につけました。コードも「テキストの一種」として扱えるため、簡単なプログラムなら書けるようになりました。
第2段階:人間のフィードバックを取り入れた時代(2023年)
InstructGPTやChatGPTが登場し、AIは「人間が求める答え」を学ぶようになりました。つまり、正しいコードを書くだけでなく、開発者が本当に欲しいコードを書けるようになったのです。たとえば、「このバグを修正して」と頼めば、文脈を理解して適切な修正を提案してくれます。
第3段階:コード特化モデルの時代(2024年以降)
最近のAIは、学習データを厳選することで性能を高めています。たとえば、TODOコメント(「あとで修正する」というメモ)や問題のあるコードを除外すると、性能が大幅に向上しました。HumanEval(コードの正確さを測るテスト)のスコアは、フィルタリング前の30%から65%へとジャンプしたのです。
2021年から2026年への変化——何が起きたのか
2021年にGitHub Copilot(開発者を支援するAIツール)が登場したとき、できることは限られていました。コードの次の行を予測して補完する、いわば「気の利く助手」のような存在でした。
しかし2026年現在、AIコーディングツールは劇的に進化しています。たとえば、2025年に正式リリースされた「Agent Mode」では、複数のファイルを同時に編集し、ターミナルでテストを実行し、エラーが出たら自分で修正する、という一連の作業を自律的にこなします。
さらに「Coding Agent」という機能では、GitHubのIssue(課題リスト)をAIに割り当てるだけで、自動的にコードを書いてプルリクエスト(変更案)を作ってくれます。つまり、開発者は「何を作るか」を指示するだけで、AIが実装を担当する時代になったのです。
現在、GitHub Copilotは世界中で1,500万人以上の開発者が利用しており、Cursor、Claude Code、国産の「JAPAN AI Code」など、選択肢も多様化しています。
データ品質が鍵——量より質への転換
NTTの開発者が強調したのは、「データの量よりも質が重要」という点です。
初期のAIは、とにかく大量のコードを学習させれば性能が上がると考えられていました。たとえば、GitHubに公開されているPythonコードだけで159GB、最新のデータセット「The Stack v2」は32.1TBにも達します。619の言語をカバーする膨大な量です。
しかし、量を増やすだけでは限界がありました。というのも、ネット上のコードには「未完成のコード」「バグのあるコード」「古い書き方のコード」が混ざっているからです。これらをそのまま学習させると、AIも同じ間違いを繰り返してしまいます。
そこで最近のモデルは、データを厳選するアプローチに切り替えました。OpenCoderというモデルは、TODOコメントや問題のあるコードを除外することで、HumanEvalのスコアを30%から65%へと倍増させました。この9%以上の改善は、初期のLLMと比べて画期的な進歩です。
つまり、AIコーディングの進化は「どれだけ学習したか」ではなく「何を学習したか」で決まる時代になったのです。
日本市場への影響——国産AIの可能性
NTTの「tsuzumi 2」が示すのは、日本独自のAI開発が現実的になってきたという事実です。
これまで、AIといえばOpenAIやGoogleなど海外企業の製品が主流でした。しかし、企業や政府が扱うデータには、外部に出せない機密情報が含まれます。海外のクラウド型AIにデータを送ることは、セキュリティ上のリスクになるのです。
tsuzumi 2のような国産モデルなら、データを国内に保ったまま利用できます。さらに、学習データを完全に管理できるため、日本語特有の表現や文化的なニュアンスを正確に理解させることも可能です。
実際、デジタル庁が「ガバメントAI」でtsuzumi 2を選んだのは、こうした安全性と品質管理の利点を評価したからです。政府の文書処理に使うAIには、情報漏洩のリスクを最小限に抑える必要があります。
また、電力業界でもtsuzumi 2を活用した業務特化型LLMの構築が2026年1月から始まっています。これは、専門分野ごとにカスタマイズしたAIを国内で開発できることを意味します。
まとめ
- NTTの「tsuzumi 2」は、1つのGPUで動く軽量な国産LLMで、政府のガバメントAIに選定された
- AIコーディングは5年間で3段階進化:基盤モデル → 人間フィードバック → データ品質重視
- 2021年は「次の行を予測」、2026年は「プロジェクト全体を自律開発」できるレベルに
- データ品質の改善で、HumanEvalスコアが30%から65%へと倍増
- 国産AIは、セキュリティと日本語精度の面で大きな利点を持つ
- 政府や電力業界など、機密性の高い分野での活用が始まっている
AIコーディングの進化は、開発者の働き方を根本から変えつつあります。そして、NTTの取り組みは、日本が独自のAI技術で世界と競えることを証明しています。今後、国産AIがどこまで実用化されるか、注目が集まります。

