ElevenLabs se ha convertido en el modelo de IA más potente en la creación de voces sintéticas, es decir, aquellas creadas artificialmente mediante software o algoritmos que imitan la voz humana. Es una empresa que, a diferencia de muchas otras, se han especializado en voz creada por IA.
Como podéis ver desde su página, con ElevenLabs puedes crear desde texto a voz con casi 80 idiomas e incluso acentos como el inglés norteamericano o el cockney hasta el español argentino o mexicano. Pero también la función inversa, es decir, transcribir de voz a texto en casi 100 idiomas. También la clonación de tu propia voz o la traducción de vídeo y audio o doblaje de contenido en 29 idiomas.
Seguramente, muchos ya conoceréis modelos o herramientas de IA que realicen estas funciones que os acabamos de decir, pero la diferencia es que ElevenLabs se ha convertido en la plataforma más completa de audio creado con IA con mayor calidad. Puedes probarla de forma totalmente gratuita para unos pocos minutos al mes, pero si quieres utilizarla profesionalmente tienes unos planes de pago.
La empresa fue creada en el año 2022 por Mati Staniszewski y Piotr Dąbkowski, ambos polacos, el primero matemático y el segundo ingeniero de computación y que habían trabajado en empresas de la talla de Palantir Technologies y de Google. Como declaran en una entrevista: “Somos de Polonia, y hay una peculiaridad: si ves una película extranjera en polaco, todas las voces, tanto masculinas como femeninas, están narradas por un solo personaje, por lo que tienes una sola narración en todo el contenido y, como puedes imaginar, la experiencia es bastante mediocre. Todas las emociones y la entonación originales, las voces, la creatividad desaparecen, y esto es algo que nos encantaría cambiar con ElevenLabs.” Es decir, desde la infancia a vieron que algo ya fallaba y con la llegada de la IA volvieron a ver que la mayoría de las voces generadas por IA sonaban robóticas, monótonas y poco naturales, lo que las hacía inadecuadas para aplicaciones del mundo real como audiolibros, creación de contenido y atención al cliente. Si bien la IA de voz había avanzado, ninguna empresa había dominado por completo la síntesis de voz realista a gran escala y vieron una gran oportunidad de negocio.
Con los avances en aprendizaje profundo o Deep Learning, Procesamiento del Lenguaje Natural (PNL) e IA generativa, descubrieron la manera de crear las voces de IA más realistas jamás creadas. ElevenLabs no se limitó a crear otra herramienta de text-to-speech. Su enfoque revolucionario se centra en aprender qué hace que una voz humana suene humana. La compañía desarrolló sus modelos fundamentales de voz basándose en investigación propia (algo que prácticamente ninguna startup hace actualmente), creando un sistema de síntesis de voz capaz de replicar la «humanidad» innata del habla.
Algo estarán haciendo bien cuando son contratados por las principales empresas audiovisuales del mundo como, por ejemplo, las majors de Hollywood como Walt Disney Studios, Universal Pictures, o Sony Pictures para el doblaje de sus películas y de sus contenidos. Sin duda, los actores de doblaje no estarán muy contentos.
Aunque hay otras empresas que le hacen la competencia como Murf.ai o Resemble.ai o en menor medida Play.ht y sobre todo las grandes corporaciones como Amazon Polly, Microsoft Azure y especialmente Google con Wavenet o su Text To Speech (TTS) ElevenLabs se ha convertido en la más importante empresa del sector de la voz generada por IA en todas sus vertientes: síntesis de voz o texto a voz, clonación de voz, doblaje, etc.
Su valoración actual supera los 3.300 millones de dólares, lo que no está nada mal para una empresa que nació en Europa, con sede en Londres, hace apenas 3 años y que ha conseguido atraer a los más importantes inversores del mundo del capital riesgo como, por ejemplo, los norteamericanos A16z o Sequoia.
Desde Gana Inteligencia como asesores expertos en IA te informamos de las mejores herramientas de IA y, sin duda, esta es de las mejores en audio. Si tienes alguna duda o necesitas de más información, no dudes en ponerte en contacto con nosotros.



