- 富士通が2026年6月24日、AIを動かす新技術「PHOTON」を発表したこと
- 従来主流の「Transformer」と比べ、GPU1枚あたり最大475倍も効率が上がること
- 「意味のかたまりで処理する」「複数の問いをまとめて解く」2つの工夫が秘密だということ
- MambaなどほかのTransformer代替技術との違い
- 電力不足に悩む日本のAI業界にとって、なぜ大きな朗報なのか
「AIの電気代が高すぎる」という話を聞いたことはありませんか?
いま生成AI(文章や画像を作るAI)の多くは、動かすために大量のGPU(AI計算に使う高性能チップ)と電力を必要とします。そのコストが世界中で問題になっています。
そんな中、富士通が「AIの効率を最大475倍にする」という驚きの新技術を発表しました。この記事では、その仕組みと私たちへの影響を、やさしく解説します。
富士通「PHOTON」とは?何がすごいのか
PHOTON(フォトン)は、富士通が2026年6月24日に発表した、AIを動かすための新しい「設計図」です。
正式名称は「Parallel Hierarchical Operation for TOp-down Networks」の略です。日本語にすると「上から下へ情報を整理して並行処理するネットワーク」という意味になります。
いちばんのポイントは性能です。いまのAIで主流の「Transformer(トランスフォーマー)」という方式と比べて、GPU1枚あたりの処理量が最大475倍に達するといいます。
これは1.2B(12億)パラメータという小型サイズのAIで、複数の問いを同時に処理したときの数字です。つまり「たくさんの仕事を一度にさばく場面」で、けた違いに効率がよくなるのです。
なぜ475倍も速くなる?2つの新技術
PHOTONが速い理由は、大きく2つの工夫にあります。順番に見ていきましょう。
①文章を「意味のかたまり」で処理する
従来のTransformerは、文章を「単語(トークン)」という細かい単位に分けて、1つずつ処理します。文章が長くなるほど計算量が一気に増えてしまいます。
一方PHOTONは、文章を「意味のかたまり」として大きくとらえ、階層的に処理します。階層的とは、まず全体をざっくり、次に細かく、と段階的に見ていくやり方です。
これは本を読むときに、一語ずつ追うのではなく、段落ごとに意味をつかむ感覚に近いです。計算の手間がぐっと減ります。
②複数の問いを「まとめて」解く
2つ目は「マルチクエリー統合技術」です。クエリーとは「AIへの問いかけ」のことです。
PHOTONは、同じ問題に対して少しずつ違う問いや答えの候補をいくつも作り、その中から多数決や最良のものを選びます。
このとき重要なのが「KVキャッシュ」という、AIが計算結果を一時的にためておくメモリの使い方です。Transformerはここが大きくふくらみ、メモリ不足の原因になっていました。
PHOTONはこのKVキャッシュを小さく抑えるため、同じGPUメモリで複数の答えを同時に生成できます。富士通の実験では、わずか9個の問いをまとめるだけで、従来のTransformerと同じ性能に届いたといいます。
そもそもTransformerの何が問題だったの?
Transformerは2017年に登場し、ChatGPTをはじめ今のAIブームを支えてきた立役者です。とても優秀な方式です。
ただ弱点もあります。長い文章を扱ったり、たくさんの人が同時に使ったりすると、メモリへのアクセスが急増します。その結果、処理速度が落ちてしまうのです。
速度を保つには、もっとGPUを増やすしかありません。GPUは1枚で数百万円することもあり、電気代も膨らみます。「AIは賢いけれど、お金と電気を食いすぎる」という悩みが、業界全体に広がっていました。
PHOTONは、この「コストの壁」を真正面から崩そうとする技術なのです。
他のTransformer代替技術との違い
実は「脱Transformer」を目指す研究は、PHOTONだけではありません。代表格が「Mamba(マンバ)」という方式です。
Mambaは「状態空間モデル(SSM)」という仕組みを使います。必要な情報だけを残し、いらない情報を忘れることで、長い文章を効率よく処理します。推論(AIが答えを出す処理)はTransformerの約5倍速いといわれます。
では何が違うのでしょうか。整理すると次のようになります。
- Mamba・SSM:長い文章を「軽く速く」読むのが得意。1人の長い対話に強い
- 富士通PHOTON:たくさんの問いを「同時に大量に」さばくのが得意。多人数・マルチエージェント向き
- 従来のTransformer:万能で実績豊富だが、規模が大きくなるとコストが急増
つまりPHOTONは、AIエージェント(自分で考えて動くAI)が複数同時に働くような、これからの使い方に強いのが特徴です。得意分野がはっきり分かれているのです。
日本市場・私たちへの影響
この発表は、日本にとって特別な意味を持ちます。理由は2つあります。
1つ目は「日本発の基盤技術」だという点です。AIの土台となる仕組みは、これまでアメリカ企業が中心でした。そこへ富士通が独自方式で挑むことは、日本の技術力の証になります。
2つ目は電力問題への効果です。国際エネルギー機関(IEA)によると、世界のデータセンターの電力消費は2026年に約1,000TWhに達する見込みです。これは日本全体の年間消費電力に匹敵します。
AIを動かす電力の確保は、日本でも大きな課題です。PHOTONのように「少ないGPUで多くの仕事をこなす」技術は、電気代と二酸化炭素の両方を減らせます。
身近な例で考えてみましょう。企業がAIチャットを社員1万人に配ると、いまは膨大なサーバー費用がかかります。PHOTONが実用化されれば、同じ予算でより多くの人がAIを使えるようになります。中小企業にもAIが広がるきっかけになりそうです。
たとえば、ある通販会社のカスタマーサポートを思い浮かべてください。セール期間中は問い合わせが一気に何千件も集中します。いまのAIだと、さばききれずに待ち時間が長くなりがちです。
PHOTONなら、多数の質問を同時に処理するのが得意です。少ないGPUのまま、多くのお客さまへ素早く返事ができるようになります。
学校や自治体のような予算が限られる現場でも、低コストでAIを導入しやすくなります。AIが一部の大企業だけのものではなくなる、という点が大切です。
富士通はこの成果を、2026年7月2日に米サンディエゴで開かれる自然言語処理のトップ国際会議「ACL 2026」で発表する予定です。
よくある質問(FAQ)
Q1. PHOTONはもう使えるのですか?
いまは研究成果の段階です。学会で発表される予定で、すぐに製品として使えるわけではありません。実用化の時期はこれから明らかになる見込みです。
Q2. 475倍速くなると、AIの賢さも上がりますか?
475倍はおもに「効率」の話です。賢さそのものより、同じ性能を「より少ない電力とGPU」で出せる点が大きな価値です。
Q3. Transformerはもう使われなくなるのですか?
すぐにはなくなりません。Transformerは実績が豊富で、多くのAIで使われています。当面は用途ごとに使い分ける時代が続くと考えられます。
Q4. 個人ユーザーにもメリットはありますか?
あります。AIの運用コストが下がれば、サービスの料金が安くなったり、無料で使える範囲が広がったりする可能性があります。
まとめ
今回のポイントを振り返ります。
- 富士通が2026年6月24日、新AI技術「PHOTON」を発表した
- 主流のTransformerと比べ、GPU1枚あたり最大475倍の効率を実現
- 「意味のかたまりで処理」「複数の問いをまとめて解く」2つが秘密
- Mambaなど他の代替技術とは得意分野が異なる
- 電力不足に悩む日本のAI業界にとって大きな希望になる
AIの進化は「賢さ」から「効率」の競争へと移りつつあります。まずは7月2日のACL 2026での発表に注目してみましょう。
参考文献
- 「Transformerの最大475倍」 富士通、GPUを効率的に使うLLMアーキテクチャ「PHOTON」開発 – ITmedia AI+
- Transformerと比較し、GPU当たり最大475倍の出力トークン数を持つ新アーキテクチャを開発 – 富士通
- 富士通がAI効率を475倍にするTransformer代替アーキテクチャ「PHOTON」を開発 – GIGAZINE
- 状態空間モデル(SSM)とは?AIの長文コストを突破するトランスフォーマーとの合体を解説 – DeskrexAIリサーチ
- AIのボトルネックは電力——日本のデータセンター電力需要と電源確保を一次資料で総整理【2026年版】 – Zenn

