Custom Voice Training Pro

Cloud GPUs Private Models Quality Metrics

Upload 30+ minutes of clean audio with transcripts for best results. More data = better quality.

or click to browse

MP3, WAV, FLAC supported. Max 2GB total.

0 minutes uploaded

Auto-generated or upload

Model Name

Base Model

Language

Training Quality

Description (optional)

Training typically completes in 1-4 hours depending on dataset size and quality settings.

Audio Minutes

Credits Required

~2h

Est. Time

Training requires Pro plan or credits

Upgrade to Pro

No trained models yet.

Training Credits

30 credits

Recommended

50 credits

100 credits