Configurar Conversación - Clean Speech 🗣️🗨️

Aquí tienes la traducción con el contexto de documentación que solicitaste:


Normalizar Texto para Síntesis de Voz

La función Normalizar Texto para Síntesis de Voz convierte ciertas partes del texto (como números, divisas o fechas) a su forma hablada. Esto asegura una síntesis de voz más consistente, ya que los modelos de TTS a veces pueden interpretar incorrectamente el texto sin normalizar.

Por ejemplo, antes de generar el audio, la frase:

"Call my number 2137112342 on Jul 5th, 2024 for the $24.12 payment"

se transformará en:

"Call my number two one three seven one one two three four two on july fifth, twenty twenty four for the twenty four dollars twelve cents payment"

Es importante tener en cuenta que esta característica añade una pequeña latencia (aproximadamente 100 ms) al proceso general.

Configuración de Idioma

Actualmente, la normalización de voz es compatible con los siguientes idiomas:

  • Inglés

  • Español

  • Francés

  • Alemán

Para otros idiomas, esta función no realizará ninguna modificación en el texto. Si seleccionas un idioma no multilingüe, se usará el código de ese idioma para normalizar el texto (por ejemplo, "1" se normalizará a "one" si usas inglés). Si seleccionas la opción multilingüe, el sistema detectará automáticamente el idioma basándose en el texto generado y lo normalizará de forma apropiada.

Last updated