Papercup lève 20 millions de dollars pour une IA qui duplique automatiquement les vidéos – TechCrunch

Le doublage est un marché lucratif, Verified Market Research prédit que le doublage de films à lui seul pourrait rapporter 3,6 milliards de dollars par an d’ici 2027. Mais c’est aussi un processus laborieux et coûteux. En moyenne, une narration de cinq minutes peut prendre une heure d’enregistrement en studio ; une calculatrice fixe le prix d’une simple vidéo à 75 $ la minute.

La promesse de l’intelligence artificielle dans ce domaine, notamment le traitement du langage naturel, accélère la tâche en créant des doublons à consonance humaine dans plusieurs langues. Une start-up britannique, Papercup, affirme que la technologie est utilisée par les géants des médias Sky News, Discovery et Business Insider pour traduire l’émission emblématique de Bob Rossi pendant 30 saisons. Jle plaisir de peindre.

Le PDG Jesse Shemen estime que plus de 300 millions de personnes ont regardé les vidéos traduites de Papercup au cours des 12 derniers mois.

“Il existe un décalage important entre la demande de localisation et de traduction et la satisfaction de la demande”, a déclaré Shemen. “Montre aime [Netflix’s] “Squid Game” confirme dans la thèse que les gens peuvent voir le contenu créé n’importe où et dans n’importe quelle langue s’il est divertissant et intéressant. C’est pourquoi le secteur est si prêt pour la croissance.

Honnêtement, Papercup a annoncé aujourd’hui avoir levé 20 millions de dollars lors d’une ronde de financement de série A dirigée par Octopus Ventures, qui comprenait Local Globe, Sands Capital, Sky et Guardian Media Ventures, Entrepreneur First et BDMI. Cela portera la société basée à Londres à un total d’environ 30,5 millions de dollars, dont la plupart iront à la recherche de voix d’IA expressives et à l’expansion du support de Papercup pour les langues étrangères, a déclaré Shemen à TechCrunch dans un e-mail.

Fondée en 2017 par Shemen et Jiameng Gao, Papercup propose une solution de doublage par intelligence artificielle qui reconnaît les voix humaines dans un film ou une émission cible et génère un doublage dans une nouvelle langue. Les producteurs de contenu vidéo téléchargent leurs vidéos, définissent la langue, attendent que les équipes de locuteurs natifs de Papercup vérifient la qualité du son et reçoivent une traduction vocale synthétique.

Shemen affirme que la plate-forme Papercup est capable de générer des doublons à un volume et à un rythme qui ne peuvent pas être comparés manuellement. En plus des traductions sur mesure qu’il réalise pour ses clients, Papercup propose un catalogue de voix aux tonalités et émotions “réalistes”. Selon Shemen, nombre d’entre eux ont été utilisés dans les communications internes, les annonces d’entreprise et le matériel pédagogique en plus des films et de la télévision.

“Notre approche “personne dans la boucle” signifie que les traducteurs humains assurent le contrôle de la qualité et la précision, mais doivent être beaucoup moins pratiques que s’ils fournissaient l’intégralité de la traduction, ce qui signifie qu’ils peuvent travailler plus rapidement et avec plus de traductions”, a déclaré Shemen. . “Les gens ont regardé plus de contenu vidéo pendant la pandémie, ce qui a considérablement augmenté la demande pour nos services.”

Le marché des médias synthétiques créés avec l’IA est en pleine croissance. Les entreprises axées sur la vidéo et la voix, notamment Synthesia, Respeecher, Resemble AI et Deepdub, ont lancé des outils de doublage de l’IA pour les émissions et les films. En plus des start-ups, Nvidia a développé une technologie qui transforme la vidéo d’une manière qui capture les expressions faciales de l’acteur et les adapte à un nouveau langage.

Mais cela peut avoir ses inconvénients. Comme Poste de Washington Steven Zeitchik souligne qu’un contenu doublé d’intelligence artificielle sans souci du détail peut perdre sa “saveur locale”. Les expressions dans une langue peuvent ne pas avoir le même sens dans une autre. De plus, la duplication de l’intelligence artificielle soulève des questions éthiques, comme celle de savoir s’il faut restaurer la voix de la personne décédée.

Les conséquences des voix générées par les performances des acteurs agissants sont également obscures. Le Wall Street Journal rapporte que plus d’une entreprise a tenté de reproduire la voix de Morgan Freeman dans des démos privées, et que les studios ajoutent de plus en plus de dispositions aux contrats qui utilisent des voix synthétiques au lieu d’interprètes “si nécessaire” – par exemple, pour personnaliser les astuces. dialogue pendant la post-production.

Shemen positionne Papercup comme une plate-forme largement neutre, bien qu’elle surveille l’utilisation de cette plate-forme pour détecter d’éventuels abus (par exemple, une contrefaçon profonde). Shemen a révélé que des travaux sont en cours sur la traduction en temps réel de contenus tels que les actualités et les événements sportifs, ainsi que sur la capacité de contrôler et d’affiner plus en détail la capacité d’exprimer les voix créées par son intelligence artificielle.

“Évaluer [dubbing] C’est clair : les gens retiennent 41% de leurs informations lorsqu’ils regardent une courte vidéo qui n’est pas dans leur langue – 50% pour les sous-titres et 70% pour le doublage via Papercup. C’est une augmentation de 40% des sous-titres seuls “, a déclaré Shemen. La duplication véritablement émotionnelle de l’intelligence artificielle permet à Papercup de gérer toutes sortes de contenus, rendant la vidéo et l’audio plus accessibles et agréables pour tous.

Papercup emploie actuellement 38 personnes à Londres et un réseau de traducteurs sur trois continents. L’entreprise s’attend à ce qu’il double d’ici la fin de l’année.

Leave a Comment