Análisis de softwares de inteligencia artificial generativa de voz aplicados al podcasting
Fitó-Carreras, Maria 
(Universitat Internacional de Catalunya)
Vidal-Mestre, Montse 
(Universitat Autònoma de Barcelona)
Freire-Sánchez, Alfonso 
(Universitat Abat Oliba CEU)
| Títol variant: |
Analysis of voice-generative artificial intelligence software applied to podcasting |
| Data: |
2025 |
| Descripció: |
18 pàg. |
| Resum: |
La inteligencia artificial generativa (IAG) de voz es capaz de generar mensajes en lenguaje humano mediante algoritmos de aprendizaje profundo, como las redes neuronales convolucionales (CNN), que aprenden a imitar los patrones vocales a partir de datos de habla. Ante este contexto, el principal objetivo es ofrecer una radiografía de la IAG de voz aplicada al podcasting para responder si la actual oferta tecno-lógica representa una amenaza para los empleos de los profesionales del audio, en particular para los/as locutores/as. Con este fin, se analizan los principales softwares que emplean los creadores de pódcast para la clonación de voz y se establece un marco comparativo. En segundo lugar, se recopilan las percepciones de los creadores acerca de los resultados obtenidos mediante el análisis de 10 títulos. Los principales softwares ofrecen herramientas específicas, que pueden mejorar el flujo de trabajo y optimizar los costes de producción. Gracias a los resultados sobre el estado actual de la IAG de voz aplicada al podcasting, hemos identificado tanto las oportunidades como las limitaciones que esta tecnología ofrece a los creadores. Se observa que la industria de la IAG de voz está adaptándose a las necesidades del sector, ofreciendo múltiples herramientas a través de plataformas especializadas que permiten clonar la voz, editar grabaciones, publicar pódcast y distribuirlos en varios idiomas. Sin embargo, no se interpreta como una amenaza inmediata debido a la reproducción de una prosodia inexacta y la ausencia de elementos paralingüísticos. |
| Resum: |
Voice AI is capable of generating human language messages through deep learning algorithms, such as convolutional neural networks (CNN), which learn to imitate vocal patterns from speech data. In this context, the main objective is to provide an overview of voice AI applied to podcasting, aiming to answer whether the current technological offerings pose a threat to audio professionals' jobs, particularly voice-over artists. To this end, the main software used by podcast creators for voice cloning is analyzed, and a comparative framework is established. Secondly, creators' perceptions of the results are gathered by analyzing 10 titles. The main software provides specific tools that can enhance workflow and optimize production costs. Based on the findings about the current state of voice AI in podcasting, we have identified both the opportunities and limitations this technology offers to creators. It is observed that the voice AI industry is adapting to the sector's needs, offering multiple tools through specialized platforms that allow for voice cloning, editing recordings, publishing podcasts, and distributing them in several languages. However, it is not perceived as an immediate threat due to the reproduction of inaccurate prosody and the absence of paralinguistic elements. |
| Drets: |
Aquest document està subjecte a una llicència d'ús Creative Commons. Es permet la reproducció total o parcial, la distribució, la comunicació pública de l'obra i la creació d'obres derivades, sempre que no sigui amb finalitats comercials, i sempre que es reconegui l'autoria de l'obra original.  |
| Llengua: |
Castellà i anglès |
| Document: |
Article ; recerca ; Versió publicada |
| Matèria: |
Inteligencia artificial generativa ;
Voz sintética ;
Podcasting ;
Automatización ;
Prosodia ;
Generative artificial intelligence ;
Synthetic voice ;
Automation ;
Prosody |
| Publicat a: |
Comunicación y hombre, Núm. 21 (2025) , p. 179 - 196, ISSN 1885-9542 |
DOI: 10.32466/eufv-cyh.2025.21.860.179-196
18 p, 477.5 KB
|
Angles. Al document "Machine Translated by Google"
18 p, 738.7 KB
|
El registre apareix a les col·leccions:
Articles >
Articles de recercaArticles >
Articles publicats
Registre creat el 2025-02-19, darrera modificació el 2025-04-12