L’IA vocale française va lancer une campagne pour demander aux locuteurs francophones de donner un peu de leur voix

04/04/2023

En manque de sons pour entraîner leurs modèles d’intelligence artificielle (IA), les entreprises et labos français de techniques vocales («voicetech») vont lancer une campagne pour demander aux locuteurs francophones de donner, gratuitement, un peu de leur voix, a expliqué Karel Bourgois, président du Voice Lab.

Une trentaine d’acteurs du secteur ont mis leur force en commun dans cette association pour réunir leurs jeux de données, ou «datasets»: des milliers d’heures de voix enregistrées, indispensables pour nourrir et améliorer des modèles d’IA vocales. «Ensemble, nous avons réuni 9.000 heures. Mais nous sommes des start-up et PME face à des mastodontes comme Microsoft ou Google, qui avec YouTube dispose de millions d’heures.

En France, les «datasets» sont peu nombreux et souvent sans licence pour usage commercial, d’où la difficulté à entraîner les IA. Récemment, une jeune chercheuse a passé deux ans à juste constituer ses données», a déploré l’entrepreneur, également fondateur de la start-up Voxist. Pour aller plus loin, le Voice Lab, en partenariat avec la Fondation Mozilla, va contribuer à relancer la collecte de voix en français sur le site Common Voice, où chacun peut s’enregistrer en lisant du texte. Et, en septembre, il va lancer une campagne pour une nouvelle version de cet outil, «qui va collecter des voix plus naturelles, en proposant de répondre à des questions». Autre piste, avec le laboratoire Human-Num, le projet «écouter parler»: un camion qui parcourt la France pour enregistrer des voix, plus diverses que les voix de radios ou de télés. Le Voice Lab discute aussi avec Radio France, France Télévisions et l’INA, mais se heurte au flou juridique concernant la notion d’usage à des fins d’entraînement des IA.

En 2021, le Voice Lab a remporté un appel à projet public et obtenu 4,7 millions d’euros sur 5 ans pour mutualiser les données vocales, créer des modèles en commun, exposer les services de ses membres, à des visées de recherche ou commerciales. Secteur en plein essor, révolutionné par l’IA, les «voicetech» comprennent la reconnaissance et la synthèse vocale, l’analyse des émotions, l’identification des locuteurs, la transcription orale de textes, l’élimination des accents ou encore les imitations et transformation de la voix, y compris en temps réel. Ces techniques intéressent le grand public tout comme des grands groupes qui veulent utiliser la voix comme identifiant ou automatiser des centres d’appels. En janvier, Microsoft a présenté VALL-E, modèle d’IA qui peut imiter une voix à partir de 3 secondes d’enregistrement.

France tv distribution: «Mon premier cinéma avec Les Trois Bricochons» arrive…

Anatole Latuile arrive au cinéma le 4 août 2027

Deauville Green Awards 2026 : La Journée Grand Public débarque à…

Brad Pitt au cœur de la survie dans «Heart of the…

ARTE lance «Putain de chat !», nouvelle série courte d’animation humoristique…

SCELF : Shoot the Book au Marché du Film d’Annecy

LCP diffuse un inédit de «VIP Very Important Paysans» consacré à…

France Télévisions au coeur des élections provinciales de Nouvelle- Calédonie

ZED nommée pour la 8ème année consécutive au Realscreen Global 100

KABO : Chloé Gavard rejoint le groupe en qualité de productrice

majelanX à bord de la Collection DS 3 Maison Sarah Lavoine

CTS Eventim s’associe à Pierre-Alexandre Vertadier pour investir le marché français…

OneNext Influence 2026 : la presse confirme son statut de média…

Presse : plusieurs centaines de journalistes mobilisés à Paris face à…

Le Groupe Bayard propose la nomination de Jérôme Chapuis à la…

Le tribunal administratif donne raison à un journaliste de Politis privé…

NRJ lance la radio digitale «NRJ Fan Power»

Les Bleus : France Culture raconte 120 ans d’histoire entre gloire…

Fip accueille Gilles Peterson le 24 juin

RTL devient partenaire de la Foire du livre de Brive

CANAL+ dévoile une nouvelle campagne pour RAT+

Canal+ Brand Solutions noue un partenariat data avec Leboncoin

Fox Corporation annonce l’acquisition de Roku pour 22 milliards de dollars

TF1 : le magazine «Sept à huit» en baisse (-153.000 téléspectateurs)…

Bouygues Telecom lance «Mode Enfant», une nouvelle solution de contrôle parental…

Orange accélère l’accès des start-up françaises au marché

Apple contraint d’augmenter ses prix face à la flambée des coûts…

SFR au cœur du dispositif télécoms du Sommet du G7 à…

IA : Emmanuel Macron assume utiliser Mistral pour ses recherches

IA : l’UE appelle à une coopération renforcée avec les États-Unis

Orange et le CEA créent un laboratoire dédié aux communications sémantiques

NPA : 14 millions de Français sont abonnés à une…

Olivier THEVENET (Terre Sauvage) : «Continuer à parler à nos lecteurs…

A-S de CHAISEMARTIN (France 24) : « VivaTech a été pour…

François TURQUETY (AGrAF) : «L’AGrAF redouble d’efforts pour encourager la création…

Stéphanie LEBRUN (Babel Doc) : «Plus l’intelligence artificielle progresse, plus le…

L’IA vocale française va lancer une campagne pour demander aux locuteurs francophones de donner un peu de leur voix

Aucun article à afficher