- OpenAIが「Bidi 1」という新しい音声AIをこっそりテスト中です
- 話しながら同時に聞ける「フルデュプレックス(同時通話)」が最大の特徴です
- あなたが話している途中でも、AIが自然にあいづちを打てます
- 「High・Medium・Instant」の3段階で、賢さと速さを選べます
- 現行の音声モードと入れ替えではなく、別の選択肢として追加される見込みです
AIと電話みたいに自然に会話できたら、と思ったことはありませんか。今のAI音声は、こちらが話し終わるのを待ってから返事をします。でもOpenAIが今テストしている新しい音声AI「Bidi 1」は違います。話しながら同時に聞ける、まるで人間どうしの会話に近い体験になりそうです。この記事では、Bidi 1が何を変えるのかをやさしく解説します。
Bidi 1とは何か
Bidi 1は、OpenAIが開発中の新しい音声AIモデルです。
ChatGPT(チャットGPT、文章で会話できるAI)の音声機能に組み込まれる予定です。
まだ正式発表はありません。アプリのコードやUI(画面表示)の中に痕跡が見つかり、一部のユーザーがテストで使えるようになって判明しました。
「Bidi」は「bidirectional(バイダイレクショナル)」の略です。日本語にすると「双方向」という意味になります。
テック系メディアのTestingCatalogが2026年6月にこの動きを報じ、話題になりました。OpenAIによれば、開発は2026年の初めから進められていたようです。
「双方向」がなぜすごいのか
今までの音声AIは「順番待ち」だった
今のChatGPTの音声会話を思い出してみてください。
あなたが話す。AIが聞く。あなたが黙る。それからAIが話し始める。この繰り返しです。
これは「ターン制」と呼ばれる仕組みです。トランシーバーのように、片方が話している間はもう片方は待つしかありません。
Bidi 1は「同時に話して聞ける」
Bidi 1が採用するのは「フルデュプレックス(同時通話)」という技術です。
これは電話と同じ仕組みです。自分が話しながら、相手の声も同時に聞けます。
AIが話している最中でも、あなたが割り込めます。そしてAIは「うん」「なるほど」と短くあいづちを打ちながら、会話を続けられます。
つまり、人間どうしの自然なおしゃべりにぐっと近づくのです。
Bidi 1でできること
報道によると、Bidi 1には次のような特徴があります。
- 割り込みに強い:話の途中で口をはさんでも、AIが止まらず自然に対応します
- 短いあいづち:相手の話をさえぎらずに「うん」と返せます
- 文脈を長く覚える:会話の前半で話した内容を忘れにくくなります
- 途中で方向転換できる:作業の切り替えにすばやく反応します
わかりやすい例があります。AIに「1から10まで数えて」と頼みます。
数えている途中で「やっぱり逆から数えて」と割り込みます。
するとBidi 1は止まらずに、すぐ逆順へ切り替えるそうです。今の音声モードでは、こうした素早い切り替えは苦手でした。
3つの賢さレベルから選べる
Bidi 1には、賢さのレベルが3段階あると見られています。
- High(ハイ):いちばん深く考えるモード。複雑な相談向き
- Medium(ミディアム):賢さと速さのバランス型
- Instant(インスタント):とにかく速く返すモード。テンポ重視
これは文章版のChatGPTにある仕組みと同じ考え方です。
じっくり考えてほしいときは「High」。さくさく雑談したいときは「Instant」。用途に合わせて、賢さと速さを自分で選べるわけです。
現行の音声モードはどうなる?
「今の音声モードがなくなるの?」と心配する人もいるかもしれません。
結論から言うと、入れ替えではなさそうです。
報道では、Bidi 1は現行の「Advanced Voice Mode(アドバンスト・ボイス・モード)」と並んで選べる別オプションになる見込みです。
つまり、画面のトグル(切り替えスイッチ)で「新しいBidi」か「今までの音声」かを選ぶ形になりそうです。いきなり全員が移されるわけではありません。
なお、Bidi 1はChatGPTだけでなく、開発支援ツールの「Codex(コーデックス)」にも将来入る可能性があると報じられています。
競合サービスとの違い
音声AIで競い合う相手といえば、GoogleのGemini Live(ジェミニ・ライブ)です。
Gemini Liveは、Googleアカウントがあれば無料で使えます。GmailやカレンダーなどGoogleのサービスと連携しやすいのが強みです。
一方でChatGPTの音声は、感情表現が豊かで、声のトーンが自然だと評価されています。
下の表に、ざっくりした違いをまとめました。
- ChatGPT(Bidi 1):感情表現が豊か。同時通話で割り込みに強い。賢さを3段階で選べる
- Gemini Live:無料で使える。Google製サービスとの連携が得意
もう1つ注目したいデータがあります。
2026年6月、ChatGPTの会話AI市場でのシェアが、初めて50%を下回ったと報じられました。Bidi 1のような体験の進化は、競争が激しくなる中での反撃カードとも言えそうです。
日本のユーザーへの影響
日本に住む私たちにとって、Bidi 1はどう関係するのでしょうか。
まず、ChatGPTの音声機能は日本語にも対応しています。Bidi 1が正式公開されれば、日本語での自然な会話も期待できます。
身近な活用シーンを考えてみましょう。
たとえば、英語の勉強をしている社会人。通勤電車を降りた後の徒歩中に、AIと英会話の練習をします。言いよどんでもAIが自然にあいづちを打ってくれれば、本物の会話に近い練習ができます。
あるいは、料理をしながらレシピを聞く主婦の方。手が離せない場面でも、「次は?」と割り込んで聞けば、AIがすぐ次の手順を教えてくれます。
さらに、目が不自由な方の生活支援にも役立ちます。画面を見なくても、自然な会話だけで情報を引き出せるからです。
ただし注意点もあります。Bidi 1はまだテスト段階です。日本での正式提供時期や、無料プランで使えるかどうかは未定です。
よくある質問(FAQ)
Q1. Bidi 1はもう使えますか?
いいえ。2026年6月時点ではテスト段階です。一部のユーザーに限定的に配信されているだけで、正式公開はされていません。
Q2. 「フルデュプレックス」とは何ですか?
話しながら同時に聞ける仕組みのことです。電話と同じで、自分の声と相手の声が同時に行き交います。今のAI音声は片方ずつの「ターン制」でした。
Q3. 今の音声モードは消えてしまいますか?
その予定はなさそうです。Bidi 1は新しい選択肢として追加され、今までのモードと切り替えて使える見込みです。
Q4. 日本語でも使えますか?
ChatGPTの音声機能はすでに日本語対応しています。Bidi 1も正式公開されれば日本語で使える可能性が高いですが、提供時期は未定です。
Q5. 無料で使えますか?
未定です。現行のAdvanced Voice ModeはChatGPTの有料プランが中心でした。Bidi 1の料金体系もまだ発表されていません。
まとめ
Bidi 1のポイントを振り返ります。
- OpenAIが開発中の新しい音声AI「Bidi 1」をテスト中です
- 「話しながら同時に聞ける」フルデュプレックスが最大の特徴です
- 割り込みに強く、あいづちを打ち、文脈を長く覚えます
- 「High・Medium・Instant」の3段階で賢さと速さを選べます
- 現行モードとの入れ替えではなく、別オプションとして追加される見込みです
- 日本語対応や提供時期はまだ未定で、正式発表が待たれます
まずはOpenAIの公式発表を待ちつつ、自分の使い方に合う賢さレベルはどれか、想像してみてはいかがでしょうか。
参考文献
- OpenAI prepares major ChatGPT voice upgrade with GPT-Bidi-1 – TestingCatalog
- ChatGPT leak reveals new Bidi 1 voice model – Android Authority
- OpenAI prepares ChatGPT voice upgrade with Bidi 1 model – Crypto Briefing
- OpenAI’s GPT-Bidi-1: New Bidirectional Audio Model – Open Magazine
- Voice Function in AI Chatbots: Comparison – Data Studios

