WindowsをAIが自動操作|Codex新機能とは

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • OpenAIのCodexが2026年5月29日からWindows11の画面を自分で操作できるようになりました
  • AIが人間の代わりにアプリをクリックし、文字を入力し、ボタンを押してくれます
  • Windows版は「前面のみ」で動き、Mac版のように裏で並行作業はできません
  • 安全のためPowerShellのサンドボックス(隔離された安全な実行場所)で動きます
  • 日本でも利用OK。月額20ドル(約3,000円)のChatGPT Plusから使えます

「パソコンの面倒な作業を、誰かが全部やってくれたらいいのに」と思ったことはありませんか。その願いに一歩近づくニュースが出ました。OpenAIのAI「Codex(コーデックス)」が、ついにWindowsパソコンを自分で操作できるようになったのです。この記事を読むと、何ができるのか、安全なのか、日本でどう使えるのかが分かります。

Codexが「Windowsを自分で操作」できるようになった

OpenAIは2026年5月29日、新しい機能を発表しました。

AIのCodexが、Windows11のパソコン画面を自分で見て、操作できるようになったのです。

この機能は「コンピューター使用(Computer Use)」と呼ばれます。

Codexはもともと、プログラムを書くのが得意なAIです。エンジニアが文章で指示を出すと、コードを書いてくれます。

今回の新機能では、それがさらに進化しました。画面に映ったアプリを見て、マウスを動かし、キーボードを打つ。つまり、人間がパソコンを使うのと同じことができるのです。

実はこの機能、もともとは2026年4月にMac(マック)だけで始まりました。そこから約1か月後、ようやくWindowsにもやってきたわけです。

世界のパソコンの多くはWindowsです。だから今回の対応で、使える人が一気に増えました。

何ができる?具体的な活用シーン3つ

言葉だけだとイメージしにくいですよね。具体的な場面を3つ紹介します。

1. APIのない古いアプリも動かせる

ある会社の事務担当者が、20年前から使っている社内ソフトを思い浮かべてください。

このソフトは古く、外部のプログラムから操作する「窓口(API)」がありません。だから自動化をあきらめていました。

ところがCodexは違います。画面を目で見て、人間と同じようにボタンを押せます。API(プログラム同士をつなぐ窓口)がないアプリでも操作できるのです。

2. ソフトのテストやバグ探し

アプリを作る会社では、完成前に何度も動作テストをします。

「このボタンを押して、次にこの画面が出るか」を、人が手作業で何百回も確認します。とても根気のいる仕事です。

Codexなら、この単純な確認作業を任せられます。クリックして、画面を見て、おかしな動き(バグ)がないかチェックしてくれます。

3. 複数のアプリをまたぐ作業

たとえば、メールに届いた注文内容を、別の管理ソフトに打ち込む作業。

メールを開き、内容を読み、コピーして、ソフトに貼り付ける。この一連の流れも、Codexがまとめて代わりにやってくれます。

WindowsとMacで何が違う?「前面のみ」の制約

ここで大事な注意点があります。

同じ「コンピューター使用」でも、WindowsとMacでは動き方が違うのです。

Mac版では、Codexが裏側で静かに作業できます。あなたが別の作業をしている間に、AIが裏で複数の仕事を並行して進められるのです。

一方でWindows版は「前面のみ」です。

つまりCodexが動いている間、AIがあなたのマウスとキーボードを実際に乗っ取ります。その間、あなたは同じパソコンで他の作業ができません。

AIが作業している様子を、画面でそのまま見守る形になります。少し不便に感じるかもしれませんね。

ちなみにOpenAIは、これをWindows版の最初の段階だと説明しています。今後の改善に期待したいところです。

安全性は大丈夫?PowerShellサンドボックスの仕組み

「AIが勝手にパソコンを操作するなんて、こわくない?」と心配になりますよね。

その不安にこたえる仕組みがあります。

Windows版のCodexは、PowerShell(ウィンドウズ標準の操作ツール)の「サンドボックス」の中で動きます

サンドボックスとは、隔離された安全な砂場のようなものです。AIができることの範囲をあらかじめ制限しておく仕組みです。

具体的には、限定された権限(制限付きトークン)と、ファイルへのアクセス制限を使います。これにより、AIが触ってはいけない場所には手を出せないようになっています。

しかも、わざわざLinuxのような別の仕組みを入れる必要がありません。Windowsの中だけで完結するので、導入のハードルも下がりました。

Claude・Geminiとどう違う?3社のAI操作を比較

実は、パソコンを操作するAIはCodexだけではありません。ライバルも開発を進めています。3社の特徴を整理しましょう。

OpenAIのCodexは、エンジニア向けに強いのが特徴です。プログラム開発やソフトのテストを得意とします。

AnthropicのClaude(クロード)は、画面のスクリーンショットを見て操作する方式です。特定のOSに縛られず、仮想環境やリモート画面でも動く柔軟さが売りです。

GoogleのGemini(ジェミニ)は、ブラウザの操作が得意です。Webページの構造(DOM)を読み取って動くため、ネット上の作業に強みがあります。

つまり、同じ「AIがパソコンを操作する」でも、得意分野が分かれているのです。開発ならCodex、幅広い環境ならClaude、Web作業ならGemini、という住み分けが見えてきます。

日本で使える?料金と始め方

うれしいことに、この機能は日本でも使えます

使えないのはEUの一部地域とイギリス、スイスだけです。日本は対象に含まれています。

料金は、ChatGPTの有料プランに含まれています。

  • Plus(プラス): 月額20ドル(約3,000円)
  • Pro(プロ): 月額100ドルまたは200ドル(約15,000〜30,000円)
  • Business / Enterprise: 法人向けプラン

一番安いPlusプランからでも使い始められます。なお2026年4月2日から、使った量に応じた「トークン課金」に変わっています。たくさん使うと、その分の上限に注意が必要です。

始め方はかんたんです。Microsoft Store(マイクロソフトのアプリ配布所)からCodexアプリを入れるだけ。「winget install Codex -s msstore」というコマンドでも入れられます。あとはChatGPTアカウントでサインインすれば準備完了です。

よくある質問(FAQ)

Q1. プログラミングの知識がない人でも使えますか?

コンピューター使用の機能そのものは、画面を操作するだけなので難しくありません。ただしCodexは開発者向けのツールなので、初心者には少しハードルが高い面もあります。まずは簡単な作業から試すのがおすすめです。

Q2. 作業中に他の仕事はできますか?

Windows版は「前面のみ」なので、Codexが動いている間は同じパソコンで他の作業ができません。AIにマウスとキーボードを預ける形になります。

Q3. AIが勝手に変な操作をしないか心配です。

PowerShellのサンドボックスで動くため、できることの範囲は制限されています。とはいえ大事な作業の前には、AIの動きを画面で確認することをおすすめします。

Q4. Mac版とどちらが便利ですか?

裏で並行作業ができるぶん、現時点ではMac版のほうが自由度は高いです。ただWindowsは世界で最も使われているOSなので、対応した意味はとても大きいです。

まとめ

今回のポイントを振り返ります。

  • 2026年5月29日、CodexがWindows11の画面を自分で操作できるようになった
  • AIがアプリを見て、クリックし、入力する。APIのない古いソフトも動かせる
  • Windows版は「前面のみ」で、Mac版のような裏での並行作業はできない
  • PowerShellのサンドボックスで動くので、安全面にも配慮されている
  • 日本でも月額20ドル(約3,000円)のChatGPT Plusから利用できる

まずはMicrosoft StoreでCodexアプリを入れて、かんたんな作業から試してみてはいかがでしょうか。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です