🔊 Bench TTS — BATCH / non-stream (écoute)

⚠️ La latence classe la réactivité, pas le rendu — c'est l'oreille qui tranche la qualité/l'accent. Sorties whole-call / chunké (non temps réel) — inclut Kokoro (voix rejetée, gardé pour mémoire) et les phrases dures Cartesia. Clique un chip pour écouter (lecteur en bas). Sections fermées par défaut. Généré le 2026-06-24.

Cartesia Sonic-3.5 (REST + multi-voix)

☁️ cloud61 extraits
Sorties whole-call : nombreuses voix FR (Laurent/Inès/Pauline…) avec émotions ET phrases dures (num/marques/noms/codes), + voix natives par langue.
Français + Anglais · 34 extraits
Français 🎙️ FrenchNarratorLadyneutre ▶# chiffres ▶👤 noms ▶🔡 codes ▶ 🎙️ Ines PoisedCommunicatorneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶ 🎙️ Laurent DependableAnchorneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶ 🎙️ Mathieu AssuredExpertneutre ▶# chiffres ▶👤 noms ▶🔡 codes ▶ 🎙️ Pauline HelpfulCompanionneutre ▶# chiffres ▶👤 noms ▶🔡 codes ▶
Anglais 🎙️ Gemma DecisiveAgent GBneutre ▶ 🎙️ George ComposedConsultant GBneutre ▶ 🎙️ Skylar FriendlyGuide USneutre ▶ 🎙️ Theo ModernNarrator USneutre ▶
Monde · 8 langues · 27 extraits
Espagnol : 🎙️ Andres TrustedVoice MXneutre ▶🎙️ Daniela RelaxedWoman MXneutre ▶🎙️ Marcos SteadyAdvisor ESneutre ▶🎙️ Mariana NurturingGuide COneutre ▶🎙️ Nuria TrustedAdvisor ESneutre ▶   Portugais : 🎙️ Beatriz SupportGuide PTneutre ▶🎙️ Bruno ReliableComm BRneutre ▶🎙️ Isabella WarmStory BRneutre ▶🎙️ Tiago NarrationExpert PTneutre ▶   Allemand : 🎙️ Henrik SteadyAnalystneutre ▶🎙️ Marlene ElegantSpeakerneutre ▶🎙️ Sebastian Oratorneutre ▶   Italien : 🎙️ Alessandra MelodicGuideneutre ▶🎙️ Francesca ElegantPartnerneutre ▶🎙️ Lorenzo HospitableHostneutre ▶   Néerlandais : 🎙️ Jeroen ClearStory NLneutre ▶🎙️ Lucas Storyteller NLneutre ▶🎙️ Sanne ClearCompanion NLneutre ▶   Japonais : 🎙️ Hinata GracefulGuide JPneutre ▶🎙️ Kenji CalmMan JPneutre ▶🎙️ Yuki CalmWoman JPneutre ▶   Chinois : 🎙️ Hao FriendlyGuyneutre ▶🎙️ Jing ClearCoordinatorneutre ▶🎙️ Tao Lecturerneutre ▶   Turc : 🎙️ Aylin WarmGuide TRneutre ▶🎙️ Leyla StoryCompanion TRneutre ▶🎙️ Taylan ExpressiveVoice TRneutre ▶  

Chirp 3 HD (REST + multi-voix)

☁️ cloud91 extraits
Sorties whole-call : voix par locale + émotions/dures FR. Résidence EU dispo.
Français + Anglais · 69 extraits
Français 🎙️ Achernarneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶ 🎙️ Achirdneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶ 🎙️ Aoedeneutre ▶neutre (2) ▶🤩 enthousiaste ▶# chiffres ▶# chiffres (2) ▶👤 noms ▶👤 noms (2) ▶🔡 codes ▶🔡 codes (2) ▶ 🎙️ Charonneutre ▶neutre (2) ▶🤩 enthousiaste ▶# chiffres ▶# chiffres (2) ▶👤 noms ▶👤 noms (2) ▶🔡 codes ▶🔡 codes (2) ▶ 🎙️ Fenrirneutre ▶🤩 enthousiaste ▶# chiffres ▶👤 noms ▶🔡 codes ▶ 🎙️ Koreneutre ▶neutre (2) ▶🤩 enthousiaste ▶# chiffres ▶# chiffres (2) ▶👤 noms ▶👤 noms (2) ▶🔡 codes ▶🔡 codes (2) ▶ 🎙️ Ledaneutre ▶🤩 enthousiaste ▶# chiffres ▶👤 noms ▶🔡 codes ▶ 🎙️ Puckneutre ▶🤩 enthousiaste ▶# chiffres ▶👤 noms ▶🔡 codes ▶
Anglais 🎙️ Achernarneutre ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶ 🎙️ Aoedeneutre ▶ 🎙️ Charonneutre ▶ 🎙️ Koreneutre ▶ 🎙️ Puckneutre ▶
Monde · 8 langues · 22 extraits
Espagnol : 🎙️ Aoedeneutre ▶🎙️ Charonneutre ▶🎙️ Koreneutre ▶🎙️ Puckneutre ▶   Portugais : 🎙️ Aoedeneutre ▶🎙️ Charonneutre ▶🎙️ Koreneutre ▶   Allemand : 🎙️ Aoedeneutre ▶🎙️ Charonneutre ▶🎙️ Koreneutre ▶   Italien : 🎙️ Aoedeneutre ▶🎙️ Charonneutre ▶🎙️ Puckneutre ▶   Néerlandais : 🎙️ Charonneutre ▶🎙️ Koreneutre ▶   Japonais : 🎙️ Aoedeneutre ▶🎙️ Charonneutre ▶🎙️ Koreneutre ▶   Chinois : 🎙️ Aoedeneutre ▶🎙️ Charonneutre ▶   Turc : 🎙️ Charonneutre ▶🎙️ Koreneutre ▶  

Gemini TTS preview-tts

☁️ cloud · bufferisé26 extraits
Qualité TOP mais NE STREAME PAS (TTFA ~4 s, 1 bloc). Éliminé pour le temps réel ; gardé comme référence qualité.
Français + Anglais · 18 extraits
Français 🎙️ Koreneutre ▶neutre (2) ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶
Anglais 🎙️ Koreneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶🔡 codes ▶
Monde · 8 langues · 8 extraits
Espagnol : 🎙️ Koreneutre ▶   Portugais : 🎙️ Koreneutre ▶   Allemand : 🎙️ Koreneutre ▶   Italien : 🎙️ Koreneutre ▶   Néerlandais : 🎙️ Koreneutre ▶   Japonais : 🎙️ Koreneutre ▶   Chinois : 🎙️ Koreneutre ▶   Turc : 🎙️ Koreneutre ▶  

Voxtral TTS (Mistral)

☁️ cloud34 extraits
ANGLAIS uniquement, voix à émotion. TTFA ~1172 ms. Écarté (pas de FR/multilingue).
Français + Anglais · 34 extraits
Anglais 🎙️ defaultneutre ▶neutre ▶😠 colère ▶😠 colère ▶😠 colère (2) ▶😠 colère (2) ▶🤩 enthousiaste ▶🤩 enthousiaste ▶😢 triste ▶😢 triste ▶😊 gaie ▶😊 gaie ▶# chiffres ▶# chiffres ▶™ marques ▶™ marques ▶👤 noms ▶👤 noms ▶🔡 codes ▶🔡 codes ▶ 🎙️ en_paul_angry😠 colère ▶😠 colère ▶ 🎙️ en_paul_cheerful😊 gaie ▶😊 gaie ▶ 🎙️ en_paul_excited🤩 enthousiaste ▶🤩 enthousiaste ▶😊 gaie ▶😊 gaie ▶ 🎙️ en_paul_happy😊 gaie ▶😊 gaie ▶😊 gaie (2) ▶😊 gaie (2) ▶ 🎙️ en_paul_sad😢 triste ▶😢 triste ▶

Qwen3-TTS 1.7B

🖥️ self-host · chunké24 extraits
✅ OFFLINE, Apache-2.0. Émotions + dures FR/EN. RTF 2,49 sur L4 — à re-mesurer Mac/MLX.
Français + Anglais · 18 extraits
Français 🎙️ defaultneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶
Anglais 🎙️ defaultneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶
Monde · 6 langues · 6 extraits
Espagnol : 🎙️ defaultneutre ▶   Portugais : 🎙️ defaultneutre ▶   Allemand : 🎙️ defaultneutre ▶   Italien : 🎙️ defaultneutre ▶   Japonais : 🎙️ defaultneutre ▶   Chinois : 🎙️ defaultneutre ▶  

Chatterbox Multilingual 0.5B

🖥️ self-host · chunké26 extraits
✅ OFFLINE, MIT, 23 langues. RTF 1,08. ⚠️ voix FR par défaut = accent anglais (clonage utilisé en stream).
Français + Anglais · 18 extraits
Français 🎙️ defaultneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶
Anglais 🎙️ defaultneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶
Monde · 8 langues · 8 extraits
Espagnol : 🎙️ defaultneutre ▶   Portugais : 🎙️ defaultneutre ▶   Allemand : 🎙️ defaultneutre ▶   Italien : 🎙️ defaultneutre ▶   Néerlandais : 🎙️ defaultneutre ▶   Japonais : 🎙️ defaultneutre ▶   Chinois : 🎙️ defaultneutre ▶   Turc : 🎙️ defaultneutre ▶  

Kokoro 82M

🖥️ self-host · batch23 extraits
⛔ VOIX REJETÉE (trop synthétique, « fait IA ») + FR = 1 seule voix. MAIS 82 M params, <1 Go, RTF excellent → repli edge/embarqué ultra-léger. Présenté pour mémoire.
Français + Anglais · 18 extraits
Français 🎙️ defaultneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶
Anglais 🎙️ defaultneutre ▶😠 colère ▶🤩 enthousiaste ▶😢 triste ▶😊 gaie ▶# chiffres ▶™ marques ▶👤 noms ▶🔡 codes ▶
Monde · 5 langues · 5 extraits
Espagnol : 🎙️ defaultneutre ▶   Portugais : 🎙️ defaultneutre ▶   Italien : 🎙️ defaultneutre ▶   Japonais : 🎙️ defaultneutre ▶   Chinois : 🎙️ defaultneutre ▶  

⚠️ Non testable sur GCP (L4) — TTS SELF-HOST à mesurer sur le Mac mini M4 UNIQUEMENT

Les latences TTS self-host (Kyutai, Qwen3-TTS, Chatterbox : RTF, TTFA, pic VRAM) sont mesurées sur L4 CUDA en mode eager (sans flash-attn ni torch.compile). Ces chiffres NE sont PAS le verdict pour la cible Mac mini M4 — juste une comparaison entre modèles. À refaire sur le Mac : Côté cloud (Cartesia, Chirp 3 HD, Gemini), les latences mesurées sont valables (ce sont des APIs) ; seul le self-host exige la cible Mac. → Bench DÉCISIF = Mac mini M4.
— clique un extrait —