Selon des informations révélées par 404 Media et racontées par Tom’s Hardware, Nvidia, le célèbre fabricant de puces graphiques, est accusé d’avoir collecté des millions de vidéos en ligne sans autorisation pour entraîner ses propres produits d’intelligence artificielle. Le projet, baptisé Cosmos, aurait pour objectif ambitieux de rassembler l’équivalent d’une « vie humaine » de vidéos par jour. Une pratique qui soulève de sérieuses questions éthiques et légales.
Un appétit insatiable pour les données. Cette collecte massive s’inscrirait dans la stratégie de Nvidia pour développer des modèles d’IA fondamentaux, un marché en pleine expansion. Les sources présumées de ces vidéos seraient aussi diverses que YouTube, Netflix, ou même des jeux vidéo via la plateforme GeForce Now. Ces données alimenteraient le développement de produits phares de l’entreprise, tels que le générateur de mondes 3D Omniverse, les systèmes de voitures autonomes, ou encore le générateur d’avatars Digital Humans.
Un ancien employé anonyme de Nvidia aurait même rapporté que des cadres supérieurs auraient donné leur feu vert à cette pratique. Selon 404 Media, Ming-Yu Liu, vice-président de la recherche chez Nvidia, aurait déclaré : « C’est une décision exécutive. Nous avons une approbation globale pour toutes les données. »
Le Far West numérique : quand l’innovation défie la loi
Une pratique répandue dans l’industrie. Si Nvidia se retrouve aujourd’hui sous les feux des projecteurs, elle est loin d’être la seule entreprise tech à être accusée de telles pratiques. OpenAI, Stability AI, ou encore Midjourney font déjà l’objet de poursuites judiciaires pour des raisons similaires. Le cœur du problème ? L’absence d’un cadre juridique clair encadrant l’entraînement des IA. Face à ces accusations, certaines entreprises comme Google tentent de se défendre en arguant que le « scraping » de données relève du « Fair Use » (usage équitable), un concept juridique américain autorisant l’utilisation limitée d’œuvres protégées sans l’accord de leurs auteurs.
La régulation, grande absente de la course à l’IA. Face à ce flou juridique, les législateurs commencent à s’emparer du sujet. Aux États-Unis, plusieurs projets de loi sont en cours d’élaboration, comme l’AI Foundation Model Transparency Act ou le Generative AI Copyright Disclosure Act. Ces initiatives visent à encadrer les pratiques des géants de la tech dans le domaine de l’IA. Comme l’explique Tom’s Hardware : « Nvidia cherche probablement à construire son modèle alors que les questions de droits d’auteur et d’autres problèmes liés à l’entraînement de l’IA ne sont pas encore résolus, ce qui entraîne une zone grise juridique massive. »