Claude Code 音声入力(/voice)を日本語で使う方法¶
対象 / ポイント
対象: Claude Code の音声入力を日本語で使いたい開発者
ポイント:
/config→ Language → Japanese に変更するだけで日本語音声入力が有効になる- スペースキー長押し(push-to-talk)で発話し、離すと認識が始まる
- 技術用語は英語で発音すると認識精度が上がる
Claude Code の /voice で日本語を話しても、文字起こしが出ない・意味不明なテキストになることがある。この問題は /config の1箇所を変えるだけで解決する。
デフォルトでは日本語が認識されない¶
Claude Code の /voice コマンドは 2026年3月にリリースされた機能だ1。スペースキーを押しながら話しかけると、音声がテキストに変換されてプロンプトに入力される。
問題は言語設定にある。 デフォルトの認識言語が英語に設定されているため、日本語で話しても正しく文字起こしされない。「認証ミドルウェアをリファクタリングして」と話しても、英語として解釈されて意味不明な文字列が返ってきたり、「No speech detected」と表示されることもある。
この問題は Claude Code の設定を1つ変えるだけで解消できる。
解決法:/config で Language を Japanese に設定する¶
設定手順は3ステップで完了する。
ステップ1:/config を開く¶
Claude Code のプロンプトで /config と入力してEnterを押す。
> /config
ステップ2:Language を選択する¶
設定メニューが表示される。↓キー(下矢印)で Language の項目までカーソルを移動する。
ここでEnterを押さないこと。Enterを押すとconfigメニューが閉じてしまう。Spaceキーを押して Language の設定画面に入る。
ステップ3:Japanese と入力して確定する¶
テキスト入力欄が表示されたら、Japanese または 日本語 と入力してEnterを押す。これで音声認識の対象言語が日本語に切り替わる。
設定は永続化される
一度設定すれば、次回以降の /voice でも日本語認識が維持される。再設定は不要だ。
使い方:push-to-talk で音声入力する¶
言語設定が完了したら、実際に音声入力を試してみよう。
基本操作¶
/voiceと入力 して音声モードを有効にする- スペースキーを長押し する
- 画面に 「listening...」 と表示されるまで1〜2秒待つ2
- 日本語で話しかける(例:「このファイルのエラーハンドリングを改善して」)
- スペースキーを離す と音声認識が実行される
認識されたテキストがプロンプトに挿入され、Claude が応答を開始する。
音声モードの終了¶
音声モードを終了するには、再度 /voice と入力するか、Ctrl+C で中断する。
毎回 /voice の実行が必要
現時点では claude --voice のようなCLIフラグは存在しない。セッションごとに /voice コマンドを手動で実行する必要がある。
認識精度を上げる5つのコツ¶
日本語音声入力は動作するが、英語と比較すると認識精度に差がある。以下のコツで精度を改善できる。
- 技術用語は英語で発音する — 「リファクタリング」より「refactoring」の方が正確に認識される。関数名やファイル名も英語発音が有利だ
- 短い指示に区切る — 長文を一度に話すより、1〜2文ずつ区切って入力した方が認識率が高い
- listening表示を確認してから話す — スペースキーを押してすぐ話し始めると冒頭が途切れる。「listening...」が出てから発話する
- 静かな環境で使う — push-to-talk なのでノイズの影響は小さいが、静かな環境の方が精度は上がる
- 日本語と英語を混ぜて使う — 「
auth.pyの validate 関数を修正して」のように、コード要素は英語、指示は日本語で話すと自然に認識される
制限事項と今後の展望¶
現時点での主な制限をまとめる。
| 制限 | 詳細 |
|---|---|
| デフォルト音声モード起動不可 | claude --voice 等のCLIフラグは未実装 |
| 言語の自動検出が不安定 | /config での明示的な言語設定が必要 |
| 技術用語の認識精度 | 英語と比較して日本語の専門用語認識は劣る |
GitHub Issue #31724 では voiceLanguage 設定の追加が要望されている3。21件以上の賛同があり、日本語以外にもウクライナ語、フランス語、トルコ語、ドイツ語など多言語のユーザーが同じ課題を報告している。
ISO 639-1言語コードでの指定(例:"voiceLanguage": ["ja", "en"])や自動検出の改善が提案されており、実装されれば /config を経由せずに設定ファイルで言語を指定できるようになる見込みだ。
代替手段:VoiceMode MCPサーバー¶
ネイティブの /voice とは別に、コミュニティ製の VoiceMode MCP サーバーという選択肢もある4。常時音声モードが必要な場合に有効だ。
特徴¶
- ローカルで動作する Whisper(STT)と Kokoro(TTS)を使用し、APIキー不要
- 双方向の音声会話が可能(こちらが話す → Claude が音声で応答)
- スマートな無音検出で、話し終わると自動的に録音が停止する
インストール¶
# VoiceMode のインストール
curl -LsSf https://astral.sh/uv/install.sh | sh
uvx voice-mode-install
# Claude Code に MCP サーバーとして追加
claude mcp add --scope user voicemode -- uvx --refresh voice-mode
ネイティブ /voice との違いは、MCPサーバーとして常駐するため 毎回 /voice を実行する必要がない点だ。ただし、Whisper と Kokoro のローカル実行にはそれなりのマシンリソースが必要になる。
ネイティブ /voice で十分なケースが多い
日本語で指示を出すだけなら、/config の言語設定変更で事足りる。VoiceMode MCP は双方向音声会話やハンズフリー開発を追求する場合の選択肢だ。
音声入力は「設定1つ」で使える¶
Claude Code の日本語音声入力は、多くの開発者が見落としている /config の言語設定を変更するだけで有効になる。セットアップに1分もかからない。
キーボードから手を離して「このテストを修正して」と話しかけるだけでコードが直る体験は、一度試すと手放せなくなる。特にコードレビューや設計の壁打ちでは、考えながら話す方がタイピングより速い場面が多い。
voiceLanguage 設定の正式実装が進めば、日本語を含む多言語での音声入力はさらに使いやすくなるだろう。