Text to Speech

Eleven Flash V2.5

Fastest TTS model with ultra-low latency.

Exemple

Sample music output

Exemple de sortie affiché ci-dessus. Le prompt et les paramètres sont pré-remplis à gauche.

Votre requête coûtera $0.05 par exécution. Pour $10 vous pouvez exécuter ce modèle environ 200 fois.

README

ElevenLabs / Eleven Flash V2.5Text to Speech (eleven_flash_v2_5)

Eleven Flash V2.5 est le modèle de synthèse vocale le plus rapide d'ElevenLabs, optimisé pour les applications en temps réel avec une latence ultra-basse et des prix 50% inférieurs.

Points forts

  • Ultra-rapide ~75ms de latence pour utilisation en temps réel.
  • 50% moins cher Modèle ElevenLabs le plus abordable.
  • 32 langues Support linguistique étendu.
  • Haute capacité Jusqu'à 40 minutes par requête.

Paramètres

  • prompt*Text to convert to speech (max 40000 characters). Write text in target language for non-English output.
  • voiceVoice preset to use
    • George (British narrator)
    • Rachel (American female)
    • Adam (American male)
    • Bella (British female)
    • Josh (American male)
    • Arnold (Deep male)
  • language_codeLanguage for text normalization (e.g., number/date pronunciation). Does NOT translate - text must be in target language.
    • English
    • Spanish
    • French
    • German
    • Italian
    • Portuguese
    • Polish
    • Hindi
    • Arabic
    • Chinese
    • Japanese
    • Korean
    • Dutch
    • Russian
    • Turkish
    • Swedish
    • Indonesian
    • Filipino
    • Vietnamese
    • Thai
    • Czech
    • Danish
    • Finnish
    • Greek
    • Hungarian
    • Norwegian
    • Romanian
    • Ukrainian
    • Malay
    • Tamil
    • Bulgarian
    • Croatian
  • output_formatAudio output format
    • MP3 128kbps
    • MP3 192kbps
    • MP3 64kbps
    • PCM 44.1kHz
    • PCM 24kHz
  • stabilityVoice stability (0-1)
  • similarity_boostVoice similarity boost (0-1)
  • speedSpeech speed (0.25-4.0)

Tarification

$0.15 par génération

Comment utiliser

  1. 1.Entrez le texte pour génération de parole instantanée.
  2. 2.Sélectionnez le preset de voix pour votre cas d'utilisation.
  3. 3.Optimisé pour la vitesse - idéal pour le streaming.
  4. 4.Générez et intégrez dans votre application.

Autres modèles à essayer

Applications temps réel : Assistants vocaux et chatbots.
Jeux interactifs : Dialogue de personnage dynamique.
Streaming en direct : Synthèse vocale en temps réel.
Sensible aux coûts : Besoins TTS à volume élevé.

Frequently Asked Questions

What is the Eleven Flash V2.5 API?
Fastest TTS model with ultra-low latency.
How much does Eleven Flash V2.5 cost via API?
Eleven Flash V2.5 costs $0.1500 per generation through Renderful's API. No subscription required — pay only for what you use.
How do I use Eleven Flash V2.5 via API?
Sign up for a free Renderful API key, then send a POST request to the /v1/predictions endpoint with model "eleven_flash_v2_5". See the documentation at renderful.ai/docs for code examples in Python, JavaScript, and cURL.
What type of content does Eleven Flash V2.5 generate?
Eleven Flash V2.5 is a text to audio model by ElevenLabs. Key features include: 32 languages, Ultra-fast (~75ms), 50% cheaper.
Is the Eleven Flash V2.5 API fast?
Eleven Flash V2.5 has fast generation speed. Results are delivered via polling or webhook callback for seamless integration.