xAIが、フラッグシップ音声モデルの「Grok Voice Think Fast 1.0」を発表しました。ユーザーとの対話を音声でやりとりできるモデルで、カスタマーサポートや電話営業などに役立つと紹介されています。
Grok Voice Think Fast 1.0 | xAI
https://x.ai/news/grok-voice-think-fast-1
Introducing Grok Voice Think Fast 1.0
A state-of-the-art voice model built for complex, multi-step workflows with snappy responses and high accuracy.
It takes the top spot on the Tau Voice Bench and handles real-world messiness like noise, accents, and interruptions better than…
— xAI (@xai) April 23, 2026
Grok Voice Think Fast 1.0は最高レベルの知能や応答遅延の低下など複数の長所を備えたモデルで、複雑で複数回にわたる音声でのやりとりでも自然な対応が可能だとのこと。
実際の音声は以下のサイトで確認できます。文字を入力すれば音声による対話が始まります。
xAI Console — Grok API & Developer Tools
https://console.x.ai/playground/voice/agent#session
実際にやってみました。日本語でもほぼ正確なアクセントで発話していますが、出力する文字と音声が合っていない箇所(1885年、と書かれたところ)があります。
xAIの音声会話エージェントAI「Grok Voice Think Fast 1.0」の声とは? – YouTube

Grok Voice Think Fast 1.0はノイズ、アクセント、割り込みなど現実的な条件下で音声エージェントを評価するベンチマークテスト「τ-voice Bench」でトップの座を獲得しています。
xAIは「このモデルは、電話音声、背景ノイズ、強いアクセント、頻繁な割り込みといった最も厳しい実世界の条件で徹底的に検証されています。25以上の言語をネイティブにサポートしており、グローバル展開に最適です」と述べました。
また、話者の発音を聞き取る能力も高く、たとえ早口や言い直しがあった場合でも、住所、電話番号、氏名、アカウント番号などをシームレスに収集できるとのことです。バックグラウンドで推論も実行できるため、応答の速度に影響を与えることなく、難しいクエリやワークフローをリアルタイムで処理できます。
Grok Voice Think Fast 1.0はすでにStarlinkのカスタマーサポートとセールスを支えていて、製品購入まで至った問い合わせの5件に1件はAIとの会話で、カスタマーサポートの70%はAIにより解決されたとのことです。
この記事のタイトルとURLをコピーする
この記事は役に立ちましたか?
もし参考になりましたら、下記のボタンで教えてください。


