Anthropic×Vercept買収完全解説|UI認識精度92%の技術がClaudeのPC操作を人間レベルに引き上げる

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • AnthropicがUI認識AI企業Verceptを買収。ClaudeのPC操作(Computer Use)能力を大幅強化
  • VerceptのUI認識精度はScreenSpotベンチマークで92%。OpenAI同等モデルの18.3%を大幅に凌駕
  • Claude Sonnet 4.6のComputer Use性能がOSWorldで72.5%に到達。人間レベルに接近
  • Verceptの製品「Vy」(クラウドMac操作エージェント)は終了。チーム全員がAnthropicに移籍
  • Vercept創業チームはAi2出身の視覚AI研究者。5,000万ドル調達の注目スタートアップだった

「AIにPCを操作させる」——この夢のような機能が、急速に現実になりつつあります。Anthropicが2026年2月25日に発表したVercept買収は、ClaudeのComputer Use(PC操作)能力を次のレベルに引き上げる戦略的な一手です。VerceptはUI認識ベンチマークで92%の精度を達成した技術を持ち、OpenAIの同等モデル(18.3%)を5倍以上上回る性能を誇ります。この技術がClaudeに統合されることで、何が変わるのでしょうか。

Verceptとは何か

Verceptは、シアトルを拠点とする視覚AIスタートアップです。

  • 創業者 — Kiana Ehsani(CEO)、Luca Weihs、Ross Girshick(元Meta AI Research)
  • 出自 — Allen Institute for AI(Ai2)出身。エンボディードAI(身体性を持つAI)と視覚ベースのインタラクション研究が専門
  • 資金調達 — 総額5,000万ドル(約75億円)
  • 製品 — 「Vy」:クラウド上のMacBookを遠隔操作するAIエージェント
  • 技術的強み — 独自の画面理解モデル。ScreenSpot v1ベンチマークで精度92%

たとえるなら、Verceptは「AIに目を与える」専門企業。人間がPC画面を見て「ここにボタンがある」「ここにテキストフィールドがある」と認識するように、AIが画面の構造を「見て理解する」技術を開発していました。

UI認識精度92%の衝撃|OpenAIの5倍

Verceptの技術力を最も端的に示すのが、ScreenSpot v1ベンチマークの結果です。

  • Vercept92%の精度。画面上のUI要素を正確に認識し、自然言語の指示を画面上のアクションに変換
  • OpenAIの同等モデル18.3%。同じベンチマークで大きく劣る
  • — Verceptは約5倍の精度でUI要素を認識

「ScreenSpotベンチマーク」は、AIが画面上のボタン、メニュー、テキストフィールドなどの位置と機能を正しく認識できるかを測定するテストです。92%の精度は、人間のPC操作者に匹敵するレベルの画面理解力を意味します。

Claude Computer Use|15%から72.5%への進化

AnthropicのComputer Use(ClaudeによるPC操作機能)は、すでに急速に進化しています。

  • 2024年末(初リリース時) — OSWorldベンチマークで15%未満
  • 2026年現在(Sonnet 4.6) — OSWorldベンチマークで72.5%
  • 進化率 — 約1年半で5倍以上の性能向上

OSWorldは、AIがスプレッドシートの操作やブラウザタブ間の作業など、実際のPC操作をどれだけ正確に実行できるかを測定するベンチマークです。72.5%は人間レベルに接近する性能であり、Verceptの技術統合によってさらなる向上が期待されます。

買収の戦略的意味|Meta との人材獲得競争

この買収には、技術だけでなく人材獲得の側面もあります。

  • Meta の動き — Verceptの共同創業者の1人がMeta(旧Facebook)に引き抜かれた
  • Anthropicの対応 — 残りのチーム全員を買収という形で確保。エンボディードAIの研究者を一括獲得
  • Vy の終了 — Verceptの製品「Vy」は2026年3月25日に終了。チーム全員がClaude Computer Useの開発に専念

AI業界では「人材獲得のための買収(acqui-hire)」が常態化しています。特にComputer Use分野は、Google(Project Mariner)、OpenAI(Operator)、Anthropicが三つ巴の競争を展開しており、視覚AI研究者の争奪戦が激化しています。

競合との比較|Computer Use 3大プレイヤー

  • Anthropic Claude Computer Use — OSWorld 72.5%で最高スコア。Vercept統合でさらなる進化。デスクトップ操作に強み
  • OpenAI Operator — GPTベースのブラウザ自動化。ChatGPT Pro/Maxユーザー向け。ブラウザタスクに特化
  • Google Project Mariner — Geminiベース。Chromeブラウザとの深い統合。Google Workspaceとの連携に強み

Anthropicの差別化は「デスクトップ全体の操作」。ブラウザだけでなく、ローカルアプリケーション(スプレッドシート、メールクライアント、IDE等)も含めた総合的なPC操作を目指しています。Verceptの画面理解技術は、この目標を実現するための重要なピースです。

よくある質問(FAQ)

Q. VerceptのVyは使えなくなりますか?

はい。Verceptの製品「Vy」は買収に伴い2026年3月25日にサービス終了しました。Vyの機能はClaudeのComputer Useに統合される形で発展していきます。

Q. Claude Computer Useは今すぐ使えますか?

Claude Computer UseはClaude CodeClaude Desktopで利用可能です。2026年4月にはWindowsデスクトップの制御機能(Claude Cowork/Dispatch)も発表されています。API経由での利用も可能です。

Q. セキュリティは大丈夫ですか?

Computer Useでは、Claudeがユーザーの承認なしにアクションを実行しない設計が基本です。ただし、PC操作の自動化にはリスクも伴うため、Anthropicは段階的に機能を拡大しながら安全性を検証しています。

Q. これで何ができるようになりますか?

複雑なスプレッドシート操作、Webフォームの記入、ブラウザタブをまたいだ作業、ローカルアプリの操作など、人間がキーボードとマウスで行う操作の多くをClaudeが代行できるようになります。Verceptの技術統合で、特にUI要素の認識精度が向上し、より複雑な操作が可能になると期待されます。

まとめ

この記事のポイントを振り返りましょう。

  • AnthropicがUI認識AI企業Verceptを買収。ClaudeのComputer Use能力を強化
  • VerceptのUI認識精度は92%。OpenAI同等モデル(18.3%)の5倍以上
  • Claude Sonnet 4.6のOSWorldスコアは72.5%。2024年末の15%未満から劇的に進化
  • Verceptチーム全員がAnthropicに移籍。Meta との人材獲得競争も背景に
  • Computer Use市場はAnthropic、OpenAI、Googleの三つ巴の競争。Verceptの技術がAnthropicの切り札に

「AIがPCを操作する」と聞くと、SF映画のような話に聞こえます。しかしOSWorldで72.5%を達成し、Verceptの92%精度UI認識を統合したClaudeは、「ほぼ人間と同じようにPCを使えるAI」に着実に近づいています。キーボードとマウスの向こう側に、もう一人の「デジタルな同僚」が座る日は、そう遠くありません。

参考文献

  • Anthropic. (2026). Anthropic acquires Vercept to advance Claude’s computer use capabilities. Anthropic
  • TechCrunch. (2026). Anthropic acquires computer-use AI startup Vercept after Meta poached one of its founders. TechCrunch
  • GeekWire. (2026). Anthropic acquires Vercept in early exit for one of Seattle’s standout AI startups. GeekWire
  • AI Base. (2026). Give Claude Eyes! Anthropic Acquires Vercept: High-Precision UI Recognition. AI Base
  • WinBuzzer. (2026). Claude Cowork and Claude Code Can Now Control Your Windows Desktop. WinBuzzer

3 COMMENTS

gachoic1 へ返信する コメントをキャンセル

メールアドレスが公開されることはありません。 が付いている欄は必須項目です