ボイスクローンのベストプラクティス
録音のヒント
環境
- 静かな部屋で録音する — エアコンの音、交通音、背景ノイズは避ける
- カーペットやカーテンなどの軟らかい素材が反響を軽減する
- 窓や硬い壁の近くでの録音は避ける
マイク
- 良質なUSBマイクはスマートフォンより大幅に良い結果をもたらす
- スマートフォンを使う場合は、服が詰まったクローゼットの中で録音する(自然な防音効果)
- マイクとの距離を一定に保つ — 15〜20cmを目安にする
話し方
- 自然な速さで話す
- 単調なリスト読みを避け、文に変化をつける
- バランスの取れたクローンのために、疑問文・平叙文・感情的な文を含める
- ささやき声や叫び声は避ける
理想的な録音内容
ニュース記事や商品説明など、自然な文章を短いパラグラフで読み上げてください。クリアな発話で30〜45秒を目安にしましょう。
よくある失敗
| 失敗例 | 影響 | 対処法 |
|---|---|---|
| 背景音楽 | 分離が不十分 | 音楽なしで再録音 |
| 複数の話者 | クローンが混乱 | 話者1人の録音のみ使用 |
| 強い圧縮(通話品質) | ロボット的な出力 | 非圧縮WAVを使用 |
| 非常に短いサンプル(10秒未満) | 薄く不安定な声 | 最低20秒録音する |
| 「えー」「あの」が多い | 不自然なクローン | アップロード前に編集して削除する |
クローン作成後
- まず短い文でテストする
- 疑問文・平叙文・感情的なセリフなど、さまざまな文体を試す
- 品質に満足できない場合は、より良いサンプルで再録音する


