ChatGPTが話しながら聞く|新音声AI「Bidi 1」

伊東雄歩
監修者 伊東 雄歩

株式会社ウォーカー CEO。東北大学卒。MENSA会員、JDLA認定講師、健全AI教育協会理事。生成AI×教育・学習科学を専門とし、2億円超のシステム開発プロジェクトを統括。

taolis.net X note Voicy YouTube
  • OpenAIが「Bidi 1」という新しい音声AIをこっそりテスト中です
  • 話しながら同時に聞ける「フルデュプレックス(同時通話)」が最大の特徴です
  • あなたが話している途中でも、AIが自然にあいづちを打てます
  • 「High・Medium・Instant」の3段階で、賢さと速さを選べます
  • 現行の音声モードと入れ替えではなく、別の選択肢として追加される見込みです

AIと電話みたいに自然に会話できたら、と思ったことはありませんか。今のAI音声は、こちらが話し終わるのを待ってから返事をします。でもOpenAIが今テストしている新しい音声AI「Bidi 1」は違います。話しながら同時に聞ける、まるで人間どうしの会話に近い体験になりそうです。この記事では、Bidi 1が何を変えるのかをやさしく解説します。

Bidi 1とは何か

Bidi 1は、OpenAIが開発中の新しい音声AIモデルです。

ChatGPT(チャットGPT、文章で会話できるAI)の音声機能に組み込まれる予定です。

まだ正式発表はありません。アプリのコードやUI(画面表示)の中に痕跡が見つかり、一部のユーザーがテストで使えるようになって判明しました。

「Bidi」は「bidirectional(バイダイレクショナル)」の略です。日本語にすると「双方向」という意味になります。

テック系メディアのTestingCatalogが2026年6月にこの動きを報じ、話題になりました。OpenAIによれば、開発は2026年の初めから進められていたようです。

「双方向」がなぜすごいのか

今までの音声AIは「順番待ち」だった

今のChatGPTの音声会話を思い出してみてください。

あなたが話す。AIが聞く。あなたが黙る。それからAIが話し始める。この繰り返しです。

これは「ターン制」と呼ばれる仕組みです。トランシーバーのように、片方が話している間はもう片方は待つしかありません。

Bidi 1は「同時に話して聞ける」

Bidi 1が採用するのは「フルデュプレックス(同時通話)」という技術です。

これは電話と同じ仕組みです。自分が話しながら、相手の声も同時に聞けます。

AIが話している最中でも、あなたが割り込めます。そしてAIは「うん」「なるほど」と短くあいづちを打ちながら、会話を続けられます。

つまり、人間どうしの自然なおしゃべりにぐっと近づくのです。

Bidi 1でできること

報道によると、Bidi 1には次のような特徴があります。

  • 割り込みに強い:話の途中で口をはさんでも、AIが止まらず自然に対応します
  • 短いあいづち:相手の話をさえぎらずに「うん」と返せます
  • 文脈を長く覚える:会話の前半で話した内容を忘れにくくなります
  • 途中で方向転換できる:作業の切り替えにすばやく反応します

わかりやすい例があります。AIに「1から10まで数えて」と頼みます。

数えている途中で「やっぱり逆から数えて」と割り込みます。

するとBidi 1は止まらずに、すぐ逆順へ切り替えるそうです。今の音声モードでは、こうした素早い切り替えは苦手でした。

3つの賢さレベルから選べる

Bidi 1には、賢さのレベルが3段階あると見られています。

  • High(ハイ):いちばん深く考えるモード。複雑な相談向き
  • Medium(ミディアム):賢さと速さのバランス型
  • Instant(インスタント):とにかく速く返すモード。テンポ重視

これは文章版のChatGPTにある仕組みと同じ考え方です。

じっくり考えてほしいときは「High」。さくさく雑談したいときは「Instant」。用途に合わせて、賢さと速さを自分で選べるわけです。

現行の音声モードはどうなる?

「今の音声モードがなくなるの?」と心配する人もいるかもしれません。

結論から言うと、入れ替えではなさそうです。

報道では、Bidi 1は現行の「Advanced Voice Mode(アドバンスト・ボイス・モード)」と並んで選べる別オプションになる見込みです。

つまり、画面のトグル(切り替えスイッチ)で「新しいBidi」か「今までの音声」かを選ぶ形になりそうです。いきなり全員が移されるわけではありません。

なお、Bidi 1はChatGPTだけでなく、開発支援ツールの「Codex(コーデックス)」にも将来入る可能性があると報じられています。

競合サービスとの違い

音声AIで競い合う相手といえば、GoogleのGemini Live(ジェミニ・ライブ)です。

Gemini Liveは、Googleアカウントがあれば無料で使えます。GmailやカレンダーなどGoogleのサービスと連携しやすいのが強みです。

一方でChatGPTの音声は、感情表現が豊かで、声のトーンが自然だと評価されています。

下の表に、ざっくりした違いをまとめました。

  • ChatGPT(Bidi 1):感情表現が豊か。同時通話で割り込みに強い。賢さを3段階で選べる
  • Gemini Live:無料で使える。Google製サービスとの連携が得意

もう1つ注目したいデータがあります。

2026年6月、ChatGPTの会話AI市場でのシェアが、初めて50%を下回ったと報じられました。Bidi 1のような体験の進化は、競争が激しくなる中での反撃カードとも言えそうです。

日本のユーザーへの影響

日本に住む私たちにとって、Bidi 1はどう関係するのでしょうか。

まず、ChatGPTの音声機能は日本語にも対応しています。Bidi 1が正式公開されれば、日本語での自然な会話も期待できます。

身近な活用シーンを考えてみましょう。

たとえば、英語の勉強をしている社会人。通勤電車を降りた後の徒歩中に、AIと英会話の練習をします。言いよどんでもAIが自然にあいづちを打ってくれれば、本物の会話に近い練習ができます。

あるいは、料理をしながらレシピを聞く主婦の方。手が離せない場面でも、「次は?」と割り込んで聞けば、AIがすぐ次の手順を教えてくれます。

さらに、目が不自由な方の生活支援にも役立ちます。画面を見なくても、自然な会話だけで情報を引き出せるからです。

ただし注意点もあります。Bidi 1はまだテスト段階です。日本での正式提供時期や、無料プランで使えるかどうかは未定です。

よくある質問(FAQ)

Q1. Bidi 1はもう使えますか?

いいえ。2026年6月時点ではテスト段階です。一部のユーザーに限定的に配信されているだけで、正式公開はされていません。

Q2. 「フルデュプレックス」とは何ですか?

話しながら同時に聞ける仕組みのことです。電話と同じで、自分の声と相手の声が同時に行き交います。今のAI音声は片方ずつの「ターン制」でした。

Q3. 今の音声モードは消えてしまいますか?

その予定はなさそうです。Bidi 1は新しい選択肢として追加され、今までのモードと切り替えて使える見込みです。

Q4. 日本語でも使えますか?

ChatGPTの音声機能はすでに日本語対応しています。Bidi 1も正式公開されれば日本語で使える可能性が高いですが、提供時期は未定です。

Q5. 無料で使えますか?

未定です。現行のAdvanced Voice ModeはChatGPTの有料プランが中心でした。Bidi 1の料金体系もまだ発表されていません。

まとめ

Bidi 1のポイントを振り返ります。

  • OpenAIが開発中の新しい音声AI「Bidi 1」をテスト中です
  • 「話しながら同時に聞ける」フルデュプレックスが最大の特徴です
  • 割り込みに強く、あいづちを打ち、文脈を長く覚えます
  • 「High・Medium・Instant」の3段階で賢さと速さを選べます
  • 現行モードとの入れ替えではなく、別オプションとして追加される見込みです
  • 日本語対応や提供時期はまだ未定で、正式発表が待たれます

まずはOpenAIの公式発表を待ちつつ、自分の使い方に合う賢さレベルはどれか、想像してみてはいかがでしょうか。

参考文献

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です