音声入力×Claude Code 実践ガイド:ハンズフリー開発環境の構築【2026年最新版】¶
対象:
Claude Code で音声入力プログラミングを始めたい開発者。OS標準の音声入力からプログラミング特化ツールまで、用途に応じた選択肢と構築手順を扱う。
この記事のポイント¶
- 2026年3月、Claude Code にネイティブ Voice Mode が追加され、外部ツールなしで音声駆動開発が可能になった
- 外部音声入力ツール(Wispr Flow・Aqua Voice 等)は認識精度やオフライン処理で依然として優位性がある
- パーミッション設定とサンドボックスを正しく構成すれば、音声入力の誤認識リスクを実用レベルまで低減できる
はじめに¶
音声入力プログラミング革命で紹介した概念を、実際に動く環境として構築する方法を解説する。
2026年3月、Claude Code にネイティブ Voice Mode が追加された1。/voice コマンドでトグル起動し、スペースバーを押しながら話すだけで指示が送信される。外部の音声入力ツールを組み合わせる従来の方法に加え、追加セットアップなしで音声駆動開発を開始できるようになった。
本記事では、ネイティブ Voice Mode を第一選択肢として紹介しつつ、より高精度な認識やオフライン処理が必要な場合に使える外部ツールも網羅する。
実装できる具体的な開発フロー¶
音声入力×Claude Code で実現できるフローは以下の通り。
- 音声→Claude Code 直接入力: ネイティブ Voice Mode でスペースバーを押しながら話すだけで指示が送信される
- 音声→テキスト→Claude Code: 外部ツールが変換したテキストをターミナルに入力し、Claude Code がプロンプトとして処理する
- ハンズフリーコード生成: キーボードに触れず、音声でコードの生成・編集・レビューを依頼
- 音声でデバッグ指示: エラーの状況を音声で説明し、Claude Code に修正を依頼
Step-by-Step 実装ガイド¶
Phase 1: 基盤環境の構築¶
1.1 Claude Code のインストール¶
Claude Code のインストールにはネイティブインストーラの使用が推奨されている。自動更新にも対応している。
curl -fsSL https://claude.ai/install.sh | bash
irm https://claude.ai/install.ps1 | iex
brew install --cask claude-code
Homebrew は自動更新されない
定期的に brew upgrade claude-code を実行すること。
winget install Anthropic.ClaudeCode
WinGet は自動更新されない
定期的に winget upgrade Anthropic.ClaudeCode を実行すること。
インストール後の確認と初回起動:
# インストール確認
claude --version
# 初回起動(認証設定が行われる)
cd your-project
claude
Claude Code の基本
Claude Code のコマンドは claude。ターミナルで claude と入力すると対話モードが開始され、テキストで指示を送ることでコードの生成・編集・実行などが行える。詳細は Claude Code完全ガイド を参照。
1.2 Claude Code ネイティブ Voice Mode(推奨)¶
2026年3月3日から段階的にロールアウトが開始されたネイティブ機能1。外部ツールのインストールや設定は一切不要で、Claude Code 単体で音声入力が完結する。
有効化:
# Claude Code の対話セッション内で実行
/voice
基本操作:
- スペースバー長押しで録音開始 → 離すと送信(プッシュ・トゥ・トーク方式)
- キーバインドは
voice:pushToTalkで変更可能(keybindings.jsonで設定) - 有効化状態は
/voiceコマンドでトグル切り替え
対象プラン: Pro / Max / Team / Enterprise(追加料金なし)
利用可能状況(2026年3月時点): 全ユーザーの約5%に先行提供中。数週間で全ユーザーへ展開予定。ウェルカムスクリーンに通知が表示されたユーザーから利用可能になる。
ネイティブ Voice Mode の利点
外部ツール不要のため、セットアップの手間がゼロ。Claude Code のコンテキスト(開いているファイル、直前の操作)と音声入力が同一セッション内で統合されるため、指示の一貫性が高い。
現時点での制約
音声認識エンジンの詳細(精度ベンチマーク、対応言語の全リスト等)は公式に公開されていない。プログラミング用語の認識精度について外部ツールとの比較データもまだ存在しない。高い認識精度やオフライン処理が必要な場合は、次節の外部ツールを検討する。
1.3 外部音声入力ツールの選択と設定¶
ネイティブ Voice Mode が利用できない場合や、より高い認識精度・オフライン動作が必要な場合は、外部の音声入力ツールを使う。いずれも音声をテキストに変換してアクティブなアプリケーション(ターミナル等)に入力するという役割を担う。
Wispr Flow(macOS / Windows / iOS / Android)¶
Wispr Flow はAI駆動の音声ディクテーションツール。$81M の資金調達を完了しており、OpenAI Codex のネイティブ音声エンジンとしても採用されている2。
特徴:
- コンテキスト認識: 入力先アプリ(Slack / メール / ターミナル等)に応じてトーン・フォーマットを自動調整
- 97.2%のベンチマーク精度(Apple Dictation 85-90%、Google Docs Voice Typing 89-92%との比較)3
- 100以上の言語に対応(日本語含む)
- macOS / Windows / iOS / Android 対応(Android は2026年2月リリース4)
- HIPAA対応(全プラン)、SOC 2 Type II(Enterprise)
料金: Free(週2,000語まで)/ Flow Pro 月額$12-15(無制限)5
セットアップ:
- wisprflow.ai からダウンロード・インストール
- ホットキー設定(macOS:
Fn長押し、Windows:Ctrl+Win長押し) - 長押し→話す→離すで入力完了(1-2秒でテキスト出力)
プライバシーに関する注意
Wispr Flow はクラウド処理専用でオフラインモードがない。コンテキスト認識のためにアクティブウィンドウのスクリーンショットをクラウドに送信する仕様のため、機密コードを扱う環境では注意が必要。
Aqua Voice(macOS / Windows・プログラミング特化)¶
Aqua Voice はプログラミング向けに特化した音声入力ツール。Y Combinator 支援のスタートアップが開発しており、独自の音声認識モデル「Avalon」を搭載している。
特徴:
- 画面のコンテキストを読み取り、プログラミング用語の認識精度を向上(97.3%のベンチマーク精度)6
- 低遅延動作(テキスト挿入まで約1秒、最速450ms程度)
- カスタム辞書でプロジェクト固有の用語を800語まで登録可能(Pro プラン)
- 49言語対応(日本語含む)
- macOS / Windows 対応、システム全体で動作
- ローカルファースト: 音声データはデバイス上で処理(公式説明)
料金: Free(1,000語まで試用・辞書5件まで)/ Pro 月額8(年額96)。学生は .edu メール登録で年間プラン70%割引。
セットアップ:
- aquavoice.com からダウンロード・インストール
- アプリを起動し、マイクのアクセス許可を付与
- ショートカットキーの設定(デフォルトのキーバインドまたはカスタム設定)
- カスタム辞書にプロジェクト固有の用語を登録
Superwhisper(macOS / Windows / iOS)¶
Superwhisper は音声入力・文字起こし・スマート整形を統合した音声入力ツール。ローカル(オフライン)モデルとクラウドモデルを設定で切り替えられる。
特徴:
- 音声→文字起こし→用途に合わせた整形(Voice / Message / Email 等のプリセットモード)
- ローカル(オフライン)/ クラウドの AI モデルを選択可能(設定で切替)
- 100以上の言語に対応
- カスタム語彙の登録が可能
- Claude Code、Cursor 等の AI コーディングツールとの併用を公式に想定
- macOS / Windows / iOS 対応
料金: Free(小規模モデル無制限)/ Pro 月額8.49(年額84.99)/ Lifetime $2497
セットアップ:
- superwhisper.com または App Store からインストール
- アクセシビリティとマイクの権限を付与
- AI モデルを選択(オフライン重視ならローカルモデル、精度重視ならクラウドモデル)
- カスタムモードでプログラミング用の設定を作成
オフラインモデルの動作環境
ローカル(オフライン)モデルは Apple Silicon Mac で最も快適に動作する。Intel Mac・Windows でも利用可能だがパフォーマンスが低下する場合がある。
VS Code Speech(クロスプラットフォーム)¶
VS Code Speech は Microsoft 公式の音声入力拡張機能。VS Code 内で音声入力を利用できる。音声処理はすべてローカルで行われ、外部サービスへの送信はない。
特徴:
- VS Code 内で完結(チャットパネルやエディタで音声入力)
- オフライン処理(プライバシー面で安心)
- 26言語対応(日本語含む)
- GitHub Copilot Chat との連携
- "Hey Code" キーワードによる常時リッスンモード
- Windows / macOS / Linux 対応
- 無料
主なキーボードショートカット:
| 機能 | macOS | Windows / Linux |
|---|---|---|
| エディタ内音声入力 | ⌥⌘V | Ctrl+Alt+V |
| チャット音声入力 | ⌘I | Ctrl+I |
セットアップ:
# VS Code 拡張機能のインストール
code --install-extension ms-vscode.vscode-speech
VS Code の設定で音声言語を日本語に変更できる:
{
"accessibility.voice.speechLanguage": "ja-JP"
}
"Hey Code" による音声起動を有効にするには:
{
"accessibility.voice.keywordActivation": "chatInContext"
}
Talon Voice(クロスプラットフォーム・上級者向け)¶
Talon は音声で PC 全体を操作できる高機能ツール。コマンドベースの音声操作に特化しており、手の障害や RSI で入力が困難な開発者にも広く使われている。
特徴:
- 音声でのカーソル操作・テキスト入力・コマンド実行すべてに対応
- VS Code の Cursorless 拡張と組み合わせると、音声でコードを構造的に編集可能
- スクリプトによる高度なカスタマイズ(Python ベース)
- Windows / macOS / Linux 対応
- 無料の公開版あり(有料ベータ版は Patreon で提供)
セットアップ:
- talonvoice.com からダウンロード・インストール
- コミュニティスクリプトを導入:
# Talon のユーザーディレクトリにコミュニティスクリプトを clone
git clone https://github.com/talonhub/community ~/.talon/user/community
Talon Voice の学習コスト
Talon は非常に強力だが、独自のコマンド体系を覚える必要があり、習熟には数週間かかる。まずは他のツールで音声入力に慣れてから移行するのが効果的。
その他の選択肢¶
買い切り型やオフライン特化のツールも選択肢に入る。
- Voibe(macOS): Developer Mode 搭載。年額$44.10 / Lifetime $99。100%オフライン。
- VoiceInk(macOS): 買い切り$39。100%オフライン。
- BetterDictation(macOS): 買い切り24 / Pro 年額24。オフライン対応。
- OS標準の音声入力: macOS は
Fnキー2回押し、Windows はWin + H、Linux は GNOME 音声入力または nerd-dictation 等。
1.4 ツール選択の目安¶
| ツール | OS | プログラミング特化 | オフライン | コスト |
|---|---|---|---|---|
| Claude Code Voice | 全OS | 不明(検証中) | 不可 | 無料(サブスクに含む) |
| Wispr Flow | macOS / Win / iOS / Android | あり(コンテキスト認識) | 不可 | 月額$12-15(Free枠あり) |
| Aqua Voice | macOS / Windows | あり(Avalon モデル) | 不可 | 月額$8(Free枠あり) |
| Superwhisper | macOS / Win / iOS | 一部(カスタムモード) | 可(ローカルモデル) | 月額$8.49〜(Free枠あり) |
| VS Code Speech | 全OS | なし | 可 | 無料 |
| Talon Voice | 全OS | あり(Cursorless連携) | 可 | 無料(公開版) |
| Voibe | macOS | あり(Developer Mode) | 可 | 年額$44.10〜 |
| OS標準 | 各OS | なし | 可(macOS/Win) | 無料 |
選択の指針としては、まずClaude Code ネイティブ Voice Mode を試し、プログラミング用語の認識精度に不満がある場合に Aqua Voice や Wispr Flow へ移行するのが効率的。機密性の高いコードを扱う環境では、Superwhisper のローカルモデルや VS Code Speech のようなオフラインツールを優先する。
Phase 2: 実際の開発ワークフロー¶
2.1 ネイティブ Voice Mode での基本ワークフロー¶
Claude Code のネイティブ Voice Mode を使う場合の手順。
手順:
- ターミナルを開き、
claudeコマンドで対話モードを開始 /voiceでVoice Mode を有効化- スペースバーを押しながら指示を話す → 離すとテキストに変換されて送信
- Claude Code の応答を確認し、必要に応じて再度スペースバーで追加指示
# ターミナルで Claude Code を起動
claude
# Voice Mode を有効化
/voice
# スペースバーを押しながら話す:
# 「ReactでTodoアプリのコンポーネントを作成してください。
# TypeScriptを使用し、状態管理にはuseStateを使ってください。」
# スペースバーを離すと送信される
# Claude Code がコードを生成・ファイルを作成
# 再度スペースバーを押しながら追加指示:
# 「ダークモード対応も追加してください」
2.2 外部ツールでの基本ワークフロー¶
外部の音声入力ツールを使う場合は、ツールを起動した状態でターミナルの Claude Code 対話セッションに音声で入力する。
手順:
- ターミナルを開き、
claudeコマンドで対話モードを開始 - 音声入力ツールを起動(例: Wispr Flow なら
Fn長押し、Aqua Voice ならショートカットキー) - 音声で指示を話す → テキストに変換されて Claude Code のプロンプトとして入力される
- Claude Code の応答を確認し、必要に応じて音声で追加指示
2.3 実践例: 音声で Todo アプリを開発する¶
以下は、音声入力を使った Claude Code との実際の開発セッションの流れ。
あなた (音声入力):
新しいReactプロジェクトを作成してください。
TypeScriptでTodoアプリを作りたいです。
コンポーネントはTodoApp、TodoItem、TodoFormの3つに分けてください。
Claude Code:
プロジェクト構造を作成します。以下のファイルを生成してよいですか?
src/components/TodoApp.tsx
src/components/TodoItem.tsx
src/components/TodoForm.tsx
src/types/Todo.ts
src/hooks/useTodos.ts
あなた (音声入力): はい、進めてください。
Claude Code: ファイルを作成しました。
[各ファイルの内容が表示される]
あなた (音声入力):
ローカルストレージにデータを保存する機能も追加してください。
Claude Code: useTodos.ts に localStorage 連携を追加しました。
2.4 対話モード vs 非対話モード(-p)の使い分け¶
Claude Code には対話モード(claude)と非対話モード(claude -p)がある。音声入力では誤認識リスクがあるため、用途に応じた使い分けが重要。
対話モード(推奨 — ファイル編集・コマンド実行を伴う作業):
# 対話モードでは、ファイル変更やコマンド実行の前に確認ダイアログが表示される
claude
# → 音声で指示を入力
# → Claude Code が提案を表示
# → 「はい」「進めてください」で承認
対話モードでは各操作の前に Claude Code が確認を求めるため、音声入力の誤認識が意図しない変更に直結するリスクが低くなる。パーミッションモードは Shift+Tab で切り替えられる。音声入力時は Normal モード(デフォルト)を維持すること。
非対話モード(-p)— 短い質問・コード断片生成・要約向き:
# 質問やコード生成のワンショット実行
claude -p "ReactのuseCallbackとuseMemoの違いを説明してください"
# 短いコード断片の生成
claude -p "UUIDを生成するTypeScriptのユーティリティ関数を書いてください"
非対話モードと音声入力の注意点
-p フラグでは確認なしで実行されるため、ファイル編集やシェルコマンド実行を伴う指示には向かない。音声の誤認識がそのまま実行される可能性がある。ファイル操作を伴う作業は対話モードで承認しながら進めること。
2.5 音声入力が特に効果的なシナリオ¶
設計・要件の説明:
音声入力は自然言語での説明に適しているため、要件や設計意図を伝える場面で威力を発揮する。
音声: 「このAPIはユーザー認証にJWTを使い、アクセストークンの有効期限は15分、
リフレッシュトークンは7日間にしてください。
トークンのリフレッシュエンドポイントも作成してください。」
バグ報告と修正依頼:
音声: 「ログインページで、メールアドレスにプラス記号が含まれると
バリデーションエラーになるバグがあります。修正してください。」
コードレビューの依頼:
音声: 「このファイルをレビューして、セキュリティ上の問題がないか確認してください。
特にSQLインジェクションとXSSの観点でチェックしてください。」
2.6 ハンズフリー開発の実践パターン¶
キーボードを使えない状況(育児中、手の怪我、RSI 等)での開発パターン。
準備:
- ノイズキャンセリング対応のヘッドセットマイクを使用
- Claude Code ネイティブ Voice Mode を有効化、または外部音声入力ツールを常駐起動
- Claude Code の対話セッションを開いた状態にする
ワークフロー:
- 音声で要件を伝える
- Claude Code の提案を画面で確認
- 「はい」「進めてください」「やり直してください」等の短い音声で操作
- 必要に応じて追加の指示を音声で伝える
Talon Voice との組み合わせ
Talon Voice を使えば、ターミナルの操作(Ctrl+C での中断、タブ切り替え等)も音声で行える。完全なハンズフリー環境を構築したい場合は、Talon + Claude Code の組み合わせが最も強力。Claude Code のバックグラウンド化(Ctrl+B)も音声コマンドに割り当て可能。
Phase 3: 効率化テクニック¶
3.1 CLAUDE.md による指示の効率化¶
プロジェクトのルートに CLAUDE.md ファイルを置くと、Claude Code が毎回のセッションでそのコンテキストを自動的に読み込む。音声入力では毎回長い前提条件を話す必要がなくなる。
# CLAUDE.md の例
## プロジェクト概要
React ベースのタスク管理アプリケーション
## 技術スタック
- React 18 + TypeScript
- Tailwind CSS
- Vitest でテスト
## コーディング規約
- 関数コンポーネントのみ使用
- カスタムフックは hooks/ ディレクトリに配置
- テストファイルは __tests__/ ディレクトリに配置
これにより、音声では「Todo の完了機能を追加してください」と短く指示するだけで、Claude Code が技術スタックや規約を踏まえたコードを生成する。
Hooks や Skills と組み合わせることで、さらに効率化が可能。たとえば Hooks を使えば、ファイル変更時の自動 lint 実行やログ記録を Claude Code のワークフローに組み込める8。
3.2 tmux によるセッション管理¶
複数の Claude Code セッションを同時に管理したい場合は、tmux が便利。
# tmux セッションを作成
tmux new-session -s dev
# 画面を分割してフロントエンド用の Claude Code セッションを起動
claude
# 別ペインでバックエンド用のセッションを起動(Ctrl+B, % で画面分割)
# Ctrl+B → % で縦分割
# 新しいペインで:
claude
# ペイン間の切り替え: Ctrl+B → 矢印キー
# 音声入力はアクティブなペインに対して入力される
バックグラウンドエージェント機能(Ctrl+B でClaude Code セッションをバックグラウンド化)も活用できる。長時間のタスクをバックグラウンドで走らせながら、別のペインで音声入力による対話を続けるパターンが有効。
3.3 プログラミング用語の認識精度を上げるコツ¶
| 対策 | 説明 |
|---|---|
| カスタム語彙の登録 | Aqua Voice や Superwhisper の辞書機能にプロジェクト固有の用語を登録 |
| 言い換えの活用 | 「async」→「非同期関数」、「useState」→「ユーズステート」 |
| 英語モードの活用 | 技術用語が多い場合は言語設定を英語に切り替えると認識精度が向上 |
| 明瞭な発音 | 技術用語はゆっくり・はっきり発音する |
| コンテキスト対応ツール | Aqua Voice は画面内容を読み取るため、コードが表示されている状態だと認識精度が上がる |
3.4 効果的な音声プロンプトのパターン¶
音声入力では長く複雑な指示より、段階的に伝えるのが効果的。
良いパターン: 段階的な指示
1回目: 「ユーザー認証機能を追加してください」
→ Claude Code が設計を提案
2回目: 「JWTを使ってください。リフレッシュトークンも必要です」
→ Claude Code が実装
3回目: 「テストも書いてください」
→ Claude Code がテスト生成
避けるべきパターン: 一度に全部伝える
「ユーザー認証をJWTで実装してリフレッシュトークンも対応して
ミドルウェアも作ってテストも書いてエラーハンドリングも...」
→ 音声認識の誤認識リスクが高まる
→ Claude Code への指示が不明確になりやすい
安全装置: 音声入力時の事故防止¶
音声入力では誤認識によって意図しないコマンドが実行されるリスクがある。Claude Code のパーミッション設定とサンドボックス機能を活用して、危険な操作をブロックしておくことを推奨する。
パーミッション設定¶
.claude/settings.json(プロジェクト単位)または ~/.claude/settings.json(ユーザー単位)に deny ルールを設定できる。ルールは deny → ask → allow の順に評価され、最初にマッチしたルールが適用される9。
{
"$schema": "https://json.schemastore.org/claude-code-settings.json",
"permissions": {
"allow": [
"Bash(npm run lint)",
"Bash(npm run test *)"
],
"deny": [
"Bash(rm -rf *)",
"Bash(rm -rf /)",
"Bash(curl *)",
"Bash(wget *)",
"Read(./.env)",
"Read(./.env.*)",
"Read(./secrets/**)"
]
}
}
ワイルドカードと gitignore パターン
パーミッションルールは Tool(specifier) 形式で、ワイルドカード(*)や gitignore スタイルのパターン(**)に対応している。Bash(npm *) のように広めに設定することで、ルール数を抑えつつ柔軟な制御が可能。
パーミッションモード¶
Claude Code には5つのパーミッションモードがあり、セッション中に Shift+Tab で切り替えられる9。
| モード | 動作 | 音声入力での推奨度 |
|---|---|---|
| Normal(デフォルト) | 各操作で確認を要求 | 推奨 |
| Auto-accept (acceptEdits) | ファイル操作を自動承認 | 条件付き |
| Plan | 計画のみ提示し実行しない | 設計フェーズに有効 |
| dontAsk | 明示的に allow されていないものを拒否 | ヘッドレス用 |
| Bypass | すべての操作を自動承認 | 使用禁止 |
音声入力時は Normal モードを維持し、--dangerously-skip-permissions フラグは使わないこと。
ネイティブサンドボックス¶
Claude Code はOS レベルのサンドボックスも提供している。macOS では Seatbelt、Linux では bubblewrap(bwrap)を使用し、ファイルシステムやネットワークへのアクセスを制限する10。
# Linux: bubblewrap のインストール
# Debian/Ubuntu
sudo apt install bubblewrap
# Fedora/RHEL
sudo dnf install bubblewrap
サンドボックスは各コマンド起動に15ms未満のレイテンシを追加する程度のオーバーヘッドで動作する。
deny ルールの既知の不具合
2026年2月時点で、Read のdeny ルールが期待通りに機能しないケースが報告されている(GitHub Issue #24846、#27040)11。.env ファイルや機密情報の保護には、deny ルールだけでなく .gitignore への追加とサンドボックスのファイルシステム制限を併用すること。
トラブルシューティング¶
問題1: プログラミング用語が正しく認識されない¶
原因: 一般的な音声認識は日常会話向けに最適化されており、プログラミング用語(useState, async, TypeScript 等)は誤認識されやすい。
対策:
- Aqua Voice のようなプログラミング特化のツールを使う(Avalon モデルで精度が大幅に向上)
- Wispr Flow のコンテキスト認識を活用する(ターミナル入力時にコード関連の語彙を優先)
- カスタム辞書にプロジェクトで使う用語を登録する
- 認識されにくい用語は日本語で言い換える(「非同期関数を作ってください」等)
- コード内の識別子を直接口述する場合は英語モードに切り替える
問題2: 音声入力が途中で Claude Code に送信されてしまう¶
原因: 外部ツール使用時に改行が自動挿入されたり、区切りの判定が早い場合がある。
対策:
- ネイティブ Voice Mode では「スペースバー長押し→離す」で送信タイミングを完全に制御できるため、この問題は発生しにくい
- Claude Code の対話モードでは空行(Enter を2回)で初めて送信されるため、通常は問題にならない
- 外部ツール側の「自動送信」や「自動改行」の設定を確認・調整する
- 長い指示は意識的に区切り、段階的に伝える
問題3: 周囲の雑音で誤認識が発生する¶
対策:
- ノイズキャンセリング機能付きの指向性ヘッドセットマイクを使う
- 音声入力ツールのノイズゲートやフィルター設定を調整する
- Wispr Flow は Whisper Mode(小声入力モード)を搭載しており、静かな環境での小声入力に対応
- 騒がしい環境では音声入力よりもキーボード入力を優先する
問題4: Claude Code の応答が期待と異なる¶
対策:
- 音声入力後、送信前にテキスト内容を目視確認する(誤認識がないか)
CLAUDE.mdでプロジェクトのコンテキストを事前に定義しておく- 「やり直してください」「前の変更を元に戻してください」と音声で指示して修正
/voiceを一時的にオフにしてキーボードで正確な指示を入力する
まとめ¶
2026年3月のネイティブ Voice Mode 追加により、音声入力×Claude Code の導入障壁は大幅に下がった。以前は「外部ツールの選定→インストール→設定」というステップが必要だったが、現在は /voice 一発で音声駆動開発を始められる。
実装のポイント:
- まずネイティブ Voice Mode を試す:
/voiceで有効化し、プッシュ・トゥ・トークで指示。追加コスト・セットアップなし - 認識精度に不満があれば外部ツールへ: Aqua Voice(プログラミング特化)やWispr Flow(コンテキスト認識)で精度を改善
- 機密コードにはオフラインツール: Superwhisper のローカルモデルや VS Code Speech でクラウド送信を回避
- CLAUDE.md の活用: 音声で毎回説明する必要のある前提条件は CLAUDE.md に記述して省略
- パーミッション設定は必須: deny ルール + Normal モード + サンドボックスの三重防御で誤認識リスクを低減
関連記事¶
Anthropic エンジニア Thariq Shihipar が2026年3月3日に X で公式発表。Pro / Max / Team / Enterprise で追加料金なし。https://techcrunch.com/2026/03/03/claude-code-rolls-out-a-voice-mode-capability/ ↩↩
OpenAI Codex 0.105.0(2026年2月26日)は Wispr Flow エンジンをネイティブ音声入力に採用。https://wisprflow.ai/ ↩
Wispr Flow 公式ベンチマーク。Apple Dictation 85-90%、Google Docs Voice Typing 89-92% との比較。https://wisprflow.ai/ ↩
Wispr Flow Android アプリは2026年2月23日リリース。https://techcrunch.com/2026/02/23/wispr-flow-launches-an-android-app-for-ai-powered-dictation/ ↩
Wispr Flow の料金は情報源により$12-15/月と幅がある。公式サイトで最新価格を確認すること。https://wisprflow.ai/pricing ↩
Aqua Voice ベンチマーク精度97.3%。Avalon モデルによるプログラミング用語認識。https://aquavoice.com/ ↩
Superwhisper 料金体系。Free(小規模モデル無制限)/ Pro 月額8.49(年額84.99)/ Lifetime $249。https://superwhisper.com/ ↩
Claude Code Hooks は PreToolUse / PostToolUse / Stop 等のイベントでカスタムスクリプトを実行する機能。HTTP hooks もサポート。https://code.claude.com/docs/en/hooks ↩
Claude Code パーミッション設定の公式ドキュメント。deny → ask → allow の評価順序。https://code.claude.com/docs/en/settings ↩↩
Claude Code ネイティブサンドボックス。macOS は Seatbelt、Linux は bubblewrap を使用。https://code.claude.com/docs/en/security ↩
deny ルールの不具合に関する GitHub Issue。Read deny が .env ファイルに対して機能しないケースが報告されている。https://github.com/anthropics/claude-code/issues/24846 ↩