L'Initiative Open Source définit l'IA ouverte
Un pas vers la transparence dans l'intelligence artificielle.
L'Initiative Open Source (OSI), connue pour son plaidoyer en faveur des standards ouverts dans le logiciel, s'attaque désormais, à travers une définition claire, à ce que devrait être une "IA open source".
Un besoin de clarification
L'utilisation ambiguë du terme "open source" dans le domaine de l'IA a récemment suscité de vifs débats. Des géants de la tech comme Meta ont lancé des modèles de langage avec leur code source, tout en imposant des restrictions d'utilisation, dans une approche qui ne correspond pas aux critères traditionnels de l'appellation tels que définis par l'OSI pour les logiciels. Prenons l'exemple du modèle Llama 3. Bien que librement accessible, il ne répond pas pleinement aux conditions en raison de restrictions liées à la taille de l'entreprise utilisatrice ou au type de contenu produit. De même, le générateur d'images IA Flux, bien que qualifié d'ouvert, n'est pas véritablement open source. Face à ces ambiguïtés, l'industrie a commencé à utiliser des termes alternatifs comme "open-weights" ou "source-available" pour décrire ces modèles partiellement ouverts. Une définition formelle et universellement acceptée manque donc cruellement.
Une initiative collaborative pour définir l'IA open source
Pour combler cette lacune, l'OSI a réuni un groupe d'environ 70 participants, représentant un large éventail d'expertises: chercheurs, juristes, décideurs politiques et activistes. Des représentants de grandes entreprises technologiques comme Meta, Google et Amazon ont également rejoint l'effort. La version actuelle (0.0.9) de la définition proposée par ce groupe met l'accent sur quatre libertés fondamentales, rappelant celles qui définissent le logiciel libre:
La liberté d'utiliser le système d'IA à toute fin sans autorisation préalable
La liberté d'étudier son fonctionnement
La liberté de le modifier pour tout usage
La liberté de le partager, avec ou sans modifications
Au-delà du modèle: une approche holistique
La définition de l'OSI va au-delà du simple modèle d'IA ou de ses poids. Elle englobe l'ensemble du système et ses composants. Pour qu'un système soit qualifié d'open source, il doit fournir accès à ce que l'initiative appelle la "forme préférée pour effectuer des modifications". Cela inclut des informations détaillées sur les données d'entraînement, le code source complet utilisé pour ce même entraînement et l'exécution du système, ainsi que les poids et paramètres du modèle. Tous ces éléments doivent être disponibles sous des licences ou des conditions approuvées par l'OSI.
La question épineuse des données d'entraînement
De manière intéressante, le projet de définition n'exige pas la publication des données brutes d'entraînement. À la place, il requiert des informations sur ces dernières (des métadonnées détaillées sur les données et méthodes d'entraînement). Cela comprend des informations sur les sources, les critères de sélection, les techniques de prétraitement et d'autres détails pertinents qui permettraient à une personne qualifiée de recréer un système similaire. Cette approche vise à assurer la transparence et la reproductibilité sans nécessairement divulguer l'ensemble de données réel, répondant ainsi aux préoccupations potentielles en matière de confidentialité ou de droits d'auteur tout en adhérant aux principes de l'open source.
Un processus inclusif et transparent
L'approche de l'OSI pour élaborer cette définition remonte à 2022. Le processus a impliqué une série d'ateliers mondiaux réunissant des groupes diversifiés. Selon l'initiative, 53% des participants étaient des personnes de couleur, et 28% étaient des femmes. Ces concertations se poursuivent, et il n'est pas trop tard pour y participer. L'OSI invite à une plus large participation à travers des forums et des réunions publics, ainsi que des opportunités de commenter les versions provisoires de la définition. Lorsque la version finale sera dévoilée en octobre prochain, elle pourrait avoir des implications profondes pour l'industrie:
Influencer la manière dont les entreprises publient leurs modèles d'IA
Façonner les futures réglementations, comme la controversée SB-1047 en Californie
Fournir un point de référence clair pour évaluer l'ouverture des systèmes d'IA
Potentiellement améliorer la sécurité des systèmes en permettant un examen approfondi de leur fonctionnement interne
Vers une norme mondiale pour l'IA ouverte
L'OSI aspire à ce que cette nouvelle définition de l'IA open source devienne une norme mondiale, tout comme celle de l'open source pour les logiciels est devenue un standard accepté globalement. Dans un secteur où des propriétaires comme ChatGPT d'OpenAI dominent, une définition claire pourrait ouvrir la voie à une plus grande transparence et à une innovation "sans permission" dans le domaine et pourrait bien devenir un pilier fondamental, guidant le développement éthique et ouvert des technologies qui façonneront notre avenir.
Continuez votre lecture avec un essai gratuit de 7 jours
Abonnez-vous à ActuTech pour continuer à lire ce post et obtenir 7 jours d'accès gratuit aux archives complètes des posts.