Connect with us

Hi, what are you looking for?

Tech

Après ChatGPT et DALL-E, voici VALL-E – l’IA de synthèse vocale qui peut simuler la voix de n’importe qui

Après ChatGPT et DALL-E, voici VALL-E – l’IA de synthèse vocale qui peut simuler la voix de n’importe qui

L’année dernière a vu l’émergence d’outils d’intelligence artificielle (IA) capables de créer des images, des illustrations ou même des vidéos à l’aide d’une invite de texte.

Il y a aussi eu de grands progrès Saisie IAavec ChatGPT d’OpenAI Cela a provoqué un émoi généralisé – et la peur – pour l’avenir de l’écriture.

Maintenant, quelques jours seulement après le début de 2023, un autre cas d’utilisation puissant de l’IA fait son apparition : un outil de synthèse vocale capable de simuler avec précision la voix d’une personne.

Développé par Microsoft, VALL-E peut enregistrer la voix d’une personne pendant trois secondes, boucler cette voix et convertir des mots écrits en discours, avec un ton et une émotion réalistes en fonction du contexte du texte.

Formé avec 60 000 heures d’enregistrements de discours en anglais, il peut prononcer un discours dans une « situation inutile », c’est-à-dire sans exemples précédents ni formation dans un contexte ou une situation donnée.

Présentation de VALL-E dans Article publié par l’Université CornellLes développeurs ont expliqué que les données d’enregistrement se composent de plus de 7 000 locuteurs uniques.

L’équipe affirme que le TTS a utilisé des centaines de fois plus de données que les systèmes TTS existants, ce qui les a aidés à surmonter le problème du non-paiement.

L’outil n’est actuellement pas disponible pour un usage public – mais il soulève des questions de sécurité, étant donné qu’il peut être utilisé pratiquement pour générer n’importe quel texte émanant de la voix de n’importe qui.

Microsoft parie gros sur l’intelligence artificielle

Cependant, il a perdu j’ai fait une offreaffiche un certain nombre d’invites de haut-parleur de trois secondes et une explication du processus de synthèse vocale en action, simulant correctement la voix.

READ  Technologie modulaire NVIDIA Frame Generation avec pipelines XeSS et AMD FSR .

Avec l’invite du haut-parleur et la sortie VALL-E, vous pouvez comparer les résultats avec la « vérité terrain » – le locuteur réel lisant le texte instantané – et le résultat « terrain » de la technologie de synthèse vocale existante.

Microsoft a beaucoup investi dans l’intelligence artificielle et est l’un des bailleurs de fonds d’OpenAI, la société à l’origine de ChatGPT et de DALL-E, un outil de synthèse d’images ou d’art.

Le géant du logiciel a investi 1 milliard de dollars (930 millions d’euros) dans OpenAI en 2019, et un rapport publié cette semaine sur semafor.com indiquait qu’il envisageait d’investir 10 milliards de dollars supplémentaires (9,3 milliards d’euros) dans l’entreprise.

Click to comment

Leave a Reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

You May Also Like

Tech

C’est enfin là ! La conférence mondiale annuelle des développeurs d’Apple débutera lundi avec le discours d’ouverture traditionnel à 10h00 PST. Lors de cet...

Tech

F-Zero GX (Dauphin) sur Steam Deck (image: Via Twitter) Valve vient de sortir le Steam Deck – un nouvel ordinateur portable de jeu. Il...

World

biélorusse la sprinteuse Kristina Tsimanskaya Jeudi, elle a déclaré qu’elle avait pris la décision de fuir Tokyo en Pologne après avoir reçu des avertissements...

sport

Dans le cadre de sa vision du développement humain, le Qatar attache une grande importance à la jeunesse du pays à travers un certain...

Copyright © 2020 ZoxPress Theme. Theme by MVP Themes, powered by WordPress.