Question 1

Wie transkribiere ich Audio mit KI in Text?

Accepted Answer

Laden Sie eine Audio- oder Videodatei hoch und wählen Sie Ihr Transkriptionsmodell. Whisper-1 (OpenAI) unterstützt 50+ Sprachen mit 99 % Genauigkeit und gibt Text, SRT, VTT oder zeitgestempeltes JSON aus. ElevenLabs Scribe v2 identifiziert zusätzlich einzelne Sprecher — ideal für Interviews und Aufnahmen mit mehreren Personen. Eine einstündige Datei wird in der Regel in unter 2 Minuten transkribiert.

Question 2

Welche KI-Stimme eignet sich am besten für Voiceovers?

Accepted Answer

Das hängt von Sprache und Stil ab. ElevenLabs v3 liefert den emotional ausdrucksstärksten Output für Storytelling und Charakternarration. Gemini TTS 2.5 deckt 24 Sprachen ab und eignet sich gut für mehrsprachige Inhalte. OpenAI TTS-1-HD liefert konsistente, natürlich klingende Sprache mit hoher Geschwindigkeit. Für Stimmenkloning — Audio in der Stimme einer bestimmten Person — verwenden Sie Qwen 3 TTS oder ElevenLabs Cloning.

Question 3

Wie funktioniert Sprecher-Diarisierung?

Accepted Answer

Sprecher-Diarisierung identifiziert und kennzeichnet automatisch verschiedene Sprecher in einer Aufnahme. Bei der Transkription mit ElevenLabs Scribe v2 enthält die Ausgabe Sprecher-Labels (z.B. 'Sprecher 1', 'Sprecher 2') neben jedem Textsegment. Das erleichtert die Formatierung von Podcast-Transkripten, Interview-Zitaten und Besprechungsprotokollen erheblich.

Question 4

Kann ich KI-Musik lizenzfrei erstellen?

Accepted Answer

Ja. Beatoven AI erstellt stimmungsangepasste Hintergrundmusik aus einem Textprompt — Stil, Tempo und Dauer festlegen. MiniMax Music v2 und v2.6 können vollständige Songs mit Gesang aus Ihren Liedtexten erstellen. Alle KI-generierten Musik-Dateien in faktry sind für die kommerzielle Nutzung lizenzfrei — keine Lizenzgebühren, keine Quellenangabepflicht.

Question 5

Welche Audioformate unterstützt faktry?

Accepted Answer

faktry akzeptiert und gibt MP3, WAV, OGG, FLAC, AAC und M4A aus. Sie können zwischen diesen Formaten konvertieren und dabei Bitrate, Abtastrate und Qualität steuern. Für Videodateien als Audioeingabe (z.B. zur Transkription) werden auch MP4 und MOV unterstützt.

Question 6

Wie füge ich einen KI-Voiceover zu einem Video hinzu?

Accepted Answer

Generieren Sie Ihren Voiceover mit einem TTS-Modell in der Audio-Suite und verwenden Sie dann die Operation 'Audio ersetzen' der Video-Suite, um die vorhandene Audiospur des Videos durch Ihren generierten Voiceover zu ersetzen. Beide Operationen arbeiten nahtlos zusammen — Audio in einem Schritt generieren, im nächsten auf das Video anwenden, alles ohne faktry zu verlassen.

Transkribieren, Stimmen klonen &
Audio mit KI erstellen.

Eine Suite ersetzt Ihren gesamten Audio-Stack

9 Audio-Operationen

KI-gestützte Operationen

Transkribieren

Sprache generieren

Stimme klonen

Musik generieren

Verarbeitung & Konvertierung

Formate konvertieren

Audio mischen

Audio schneiden

Audio zusammenführen

Audio herunterladen

KI-Modelle & Anbieter

Whisper + ElevenLabs Scribe

OpenAI & Gemini TTS

ElevenLabs & Qwen 3 TTS

Beatoven & MiniMax Music

Von der Aufnahme zur Produktion

Podcasting

Video-Sprachaufnahme

Content-Erstellung

Barrierefreiheit

Komplette Audio-Verarbeitung

9 Operationen inklusiveFREE CREDITS

Häufig gestellte Fragen

Wie transkribiere ich Audio mit KI in Text?

Welche KI-Stimme eignet sich am besten für Voiceovers?

Wie funktioniert Sprecher-Diarisierung?

Kann ich KI-Musik lizenzfrei erstellen?

Welche Audioformate unterstützt faktry?

Wie füge ich einen KI-Voiceover zu einem Video hinzu?

Weitere Suiten erkunden

Bild-Suite

Video-Suite

Dokument-Suite

KI Schreibassistent

Workflow-Pipelines

Transkribieren, Stimmen klonen &Audio mit KI erstellen.

Eine Suite ersetzt Ihren gesamten Audio-Stack

9 Audio-Operationen

KI-gestützte Operationen

Transkribieren

Sprache generieren

Stimme klonen

Musik generieren

Verarbeitung & Konvertierung

Formate konvertieren

Audio mischen

Audio schneiden

Audio zusammenführen

Audio herunterladen

KI-Modelle & Anbieter

Whisper + ElevenLabs Scribe

OpenAI & Gemini TTS

ElevenLabs & Qwen 3 TTS

Beatoven & MiniMax Music

Von der Aufnahme zur Produktion

Podcasting

Video-Sprachaufnahme

Content-Erstellung

Barrierefreiheit

Komplette Audio-Verarbeitung

9 Operationen inklusiveFREE CREDITS

Häufig gestellte Fragen

Wie transkribiere ich Audio mit KI in Text?

Welche KI-Stimme eignet sich am besten für Voiceovers?

Wie funktioniert Sprecher-Diarisierung?

Kann ich KI-Musik lizenzfrei erstellen?

Welche Audioformate unterstützt faktry?

Wie füge ich einen KI-Voiceover zu einem Video hinzu?

Weitere Suiten erkunden

Bild-Suite

Video-Suite

Dokument-Suite

KI Schreibassistent

Workflow-Pipelines

Transkribieren, Stimmen klonen &
Audio mit KI erstellen.