L'utilisation de l'IA dans la manipulation vidéo et la création de Deepfakes dans les médias sociaux a créé une menace sur Internet. Cependant, récemment, un développeur et YouTuber du nom de Denis Shiryaev ont pris une vidéo de 1895 et l'ont mise à l'échelle en 4K en utilisant la capacité de manipulation vidéo de l'IA.!
La vidéo est de un court métrage documentaire en français, «L'arrivée d'un train en gare de La Ciotat«. La vidéo de 50 secondes montre un train arrivant à la gare de Ciotat. Ce court métrage est célèbre pour avoir fait paniquer les spectateurs car tous les spectateurs pensaient que le train sortira de l'écran et les piétinera. Le manque de films à cette époque était la cause d'une telle panique parmi les téléspectateurs.
Comment a-t-il fait?
Shiryaev a pris cette scène rétro du court métrage et a travaillé sa magie pour la transformer en une vidéo qui semble avoir été tournée avec un appareil photo de smartphone moderne. Selon un article de Reddit, le développeur a utilisé "plusieurs réseaux de neurones”Pour mettre à l'échelle la vidéo pour en faire une version 4K 60FPS. Il serait prudent de dire que le résultat de la mise à l'échelle est assez bon.
Shiryaev a également ajouté des effets sonores pertinents à la vidéo pour la rendre plus réaliste. Jusqu'à présent, on ne sait pas exactement quels réseaux de neurones le développeur a réellement utilisé pour la mise à l'échelle afin d'obtenir un si bon résultat. Selon The Next Web, Denis a peut-être utilisé des GAN (Generative Adversarial Networks). Ce type de réseau de neurones alimente Deepfakes et FaceGAN de Nvidia.
Bien que la version 4K 60FPS de la vidéo n'ait pas cette sensation rétro de la scène classique, elle montre la puissance de l'IA dans les vidéos de conversion ascendante. Les experts ont déjà mis en garde contre l'utilisation de l'IA dans la manipulation vidéo. Mais cette mise en œuvre intelligente de l'IA pour améliorer une vidéo si ancienne prouve que chaque technologie a ses avantages et ses inconvénients. Cela dépend simplement de l'utilisateur qui utilise la technologie, de la manière dont il l'utilise.