"L’IA devrait être une sorte de bien commun": Hugging Face, les Français au coeur de la révolution

Fondée par trois Français, cette plateforme se veut la boîte à outils de la révolution de l’intelligence artificielle. Il héberge déjà des milliers de modèles et les composants essentiels des IA les plus populaires.

“Pendant la ruée vers l’or, ce ne sont pas les chercheurs d’or qui se sont enrichis, mais les vendeurs de pioches.” Qui profitera de la ruée vers l’IA qui obsède aujourd’hui l’industrie technologique, des géants américains comme Google et Microsoft aux startups sans fin ? Parmi les vendeurs de pioches les mieux placés, on compte trois Français.

Julien Chaumond, Clément Delangue et Thomas Wolf sont aujourd’hui à la tête d’un des rouages ​​essentiels de cet écosystème en pleine croissance : la plateforme Hugging Face. Un nom encore peu connu du grand public, et qui l’était encore moins il y a six ans lorsque l’entreprise a dû s’exiler aux Etats-Unis pour espérer lever des fonds. “L’IA semblait si lointaine à l’époque, il était impossible de lever des fonds en France en investissant à si long terme”, explique Tech&Co Thomas Wolf.

Dire que la situation a changé serait un euphémisme. Chaque semaine apporte son lot de nouvelles IA aux capacités étonnantes, de l’écriture automatique de texte à la création d’images en passant par la reproduction de voix plus vraies que nature. Et Hugging Face a réussi à se placer au centre de cette révolution.

La boîte à outils de l’IA

Hugging Face est une plate-forme d’IA à tout faire qui fait partie d’une boîte à outils, d’une bibliothèque et d’un bac à sable. Sur le site, n’importe qui peut concevoir sa propre IA, la former avec ses propres ensembles de données ou ceux déjà existants, et la publier pour que tout le monde l’utilise gratuitement ou la commente. A la manière d’un GitHub (qui permet à n’importe qui de stocker des lignes de code et de les mettre à disposition de tous), Hugging Face héberge près de 150 000 modèles conçus par ses utilisateurs.

Jusqu’à récemment, la plateforme hébergeait principalement des programmes spécialisés dans le traitement du langage, comme le modèle Bert de Google. Mais 2022 est là. Parmi les plus populaires aujourd’hui, on retrouve les modèles “text-to-image” comme Stable Diffusion, ou son prédécesseur Craiyon, dont le style graphique en a fait le générateur de mèmes préféré sur les réseaux sociaux.

« Nous avons dû ajouter des serveurs en urgence pour répondre à la demande », s’amuse Thomas Wolf de Tech&Co.

Mais Hugging Face n’est pas (seulement) un “AI App Store”. La plateforme héberge également certaines pièces indispensables à la construction des principaux modèles actuels. La bibliothèque Transformers, qui permet à des modèles de langage comme ChatGPT de comprendre une phrase en contexte ; ou Diffuseurs, qui permettent à Stable Diffusion de générer des images à partir d’un groupe de pixels de couleur aléatoire ; ces bibliothèques sont maintenues par les équipes de Hugging Face, mises à jour et accessibles à tous. Tout cela en open source.

Concilier IA et éthique

Car Hugging Face cultive aussi une image d’entreprise éthique et ouverte, contrairement aux géants de la tech comme Google ou OpenAI, qui gardent bien souvent secret le fonctionnement de leurs modèles ou des données de formation. “Il y a beaucoup de connaissances qui sont privées et non partagées autour de ces modèles, nous pensons que ce n’est pas quelque chose de sain pour le domaine sur le long terme”, estime Thomas Wolf.

“L’IA devrait être une sorte de bien commun, pas seulement la propriété de quelques Big Tech américaines”, déclare Thomas Wolf pour Tech&Co.

Cette politique d’ouverture se reflète dans le prix de la plateforme : elle est gratuite pour les particuliers, avec des comptes payants uniquement pour les grandes entreprises qui ont des besoins plus importants en termes de puissance de calcul. En mai 2022, la plateforme comptait environ 1 000 de ces comptes payants, pour des entreprises comme Renault ou Bloomberg. De quoi lever des revenus tout en restant ouvert aux chercheurs et utilisateurs les plus créatifs.

Mais le développement de ces IA alimente aussi les inquiétudes. N’y a-t-il pas des risques à mettre autant de modèles puissants à la disposition de n’importe qui ? Hugging Face se dit conscient de ces dangers, et réfléchit en permanence à la manière de concilier IA et éthique.

“Nous savons que nous manipulons des systèmes puissants qui peuvent avoir des répercussions négatives sur la société”, insiste Tech&Co Giada Pistilli, éthicienne en chef chez Hugging Face.

Discrétion autour du chiffre d’affaires

L’entreprise emploie déjà de grands noms de la recherche en éthique de l’IA, comme Margaret Mitchell, anciennement chez Google. Parmi ses 160 collaborateurs, elle compte depuis peu une équipe spécifiquement dédiée à ces problématiques, chargée de concevoir des chartes éthiques pour guider ses développeurs à travers des questions morales complexes.

“Si j’ai un modèle qui peut créer de l’art érotique, dans quelle mesure est-ce que je lui permets d’aller jusqu’à la pornographie ? Dans quelle mesure dois-je autoriser ou bloquer ce que la communauté demande ?” demande Giada Pistilli pour Tech&Co.

Ces réflexions théoriques doivent ensuite être mises en pratique, et évoluer au fil du temps et des évolutions de la législation. A quoi s’applique Hugging Face, tout en publiant régulièrement des articles détaillant leur méthodologie de diffusion des bonnes pratiques. Une image protectrice et empathique résumée par le nom de l’entreprise et son logo, un emoji câlin.

L’éthique et l’open source sont-ils compatibles avec la rentabilité ? L’entreprise refuse de donner publiquement ses chiffres. Le coût des ressources informatiques nécessaires pour traiter autant de modèles reste très élevé, mais Hugging Face cherche à les réduire, notamment grâce au partenariat privilégié avec Amazon Web Services qu’il a conclu en 2021.

Indiquer évoque des revenus de 15 millions de dollars en 2022, et des perspectives optimistes. “La communauté du machine learning sera multipliée par 50 d’ici 2030 parce que les développeurs de logiciels vont s’y mettre”, promet le co-fondateur Julien Chaumond dans l’hebdomadaire. Pour les vendeurs de pioches, l’avenir s’annonce prometteur.

Leave a Comment

Your email address will not be published. Required fields are marked *