Best Practices für die Stimmenklonung
Aufnahmetipps
Umgebung
- In einem ruhigen Raum aufnehmen — kein Lüftungsgeräusch, Verkehr oder Hintergrundlärm
- Weiche Einrichtungsgegenstände (Teppiche, Vorhänge) reduzieren das Echo
- Nicht in der Nähe von Fenstern oder harten Wänden aufnehmen
Mikrofon
- Ein gutes USB-Mikrofon liefert deutlich bessere Ergebnisse als ein Smartphone
- Beim Aufnehmen mit dem Smartphone: in einem Kleiderschrank aufnehmen (natürliche Schalldämpfung)
- Abstand konstant halten — 15–20 cm vom Mikrofon entfernt bleiben
Sprechweise
- Natürlich und in normalem Tempo sprechen
- Sätze variieren — keine monotone Liste vorlesen
- Fragen, Aussagen und begeisterte Sätze einschließen für einen ausgewogenen Klon
- Flüstern und Schreien vermeiden
Idealer Aufnahmeinhalt
Lies einen kurzen Absatz natürlich vor — ein Nachrichtenartikel oder eine Produktbeschreibung eignet sich gut. Ziel sind 30–45 Sekunden saubere Sprache.
Häufige Fehler
| Fehler | Auswirkung | Lösung |
|---|---|---|
| Hintergrundmusik | Schlechte Trennung | Ohne Musik neu aufnehmen |
| Mehrere Sprecher | Verwischter Klon | Nur Einzelsprecher-Aufnahmen verwenden |
| Starke Komprimierung (Telefonqualität) | Roboterhafte Ausgabe | Unkomprimiertes WAV verwenden |
| Sehr kurzes Sample (unter 10 s) | Dünne, inkonsistente Stimme | Mindestens 20 Sekunden aufnehmen |
| Viele „Ähms" und „Öhs" | Unnatürlicher Klon | Vor dem Hochladen herausschneiden |
Nach dem Klonen
- Zuerst mit kurzen Sätzen testen
- Verschiedene Texttypen ausprobieren (Fragen, Aussagen, emotionale Sätze)
- Falls die Qualität nicht gut ist, mit einem besseren Sample neu aufnehmen


