Le piège classique
Beaucoup d'editeurs croient qu'en publiant leur modèle sous licence Apache 2.0 ou MIT avec les poids sur Hugging Face, ils échappent a l'AI Act. C'est faux sur deux points precis. D'abord, des que le modèle franchit le seuil du risque systemique (10^25 FLOPs ou désignation par l'AI Office), l'exemption tombe entièrement. Ensuite, même pour un modèle open-source 'standard', deux obligations restent dues : le resume détaillé du contenu d'entrainement (template AI Office) et la politique de respect du droit d'auteur européen, notamment l'opt-out article 4(3) de la directive 2019/790. L'AI Office de Bruxelles a deja indique qu'il scrutera ces deux livrables, et la CNPD reste competente sur le volet données personnelles dans les jeux d'entrainement.
Le test d'eligibilite a l'exemption open-source
Pour bénéficier de l'allegement de transparence du considérant 104, les quatre conditions cumulatives suivantes doivent être réunies, et auditables :
- Licence reellement libre : licence OSI-approved ou equivalente, sans clause de champ d'usage restrictif (les licences 'open-weight' style Llama Community License sont contestables).
- Poids publiquement accessibles sans inscription bloquante ni contrôle d'export deguise.
- Architecture documentee : nombre de paramètrès, couches, fonctions d'activation, tokenizer.
- Informations d'usage publiees : contextes recommandes, limitations, évaluations de performance.
Et surtout, deux obligations restent dues même si les quatre conditions sont remplies :
- Le resume suffisamment détaillé du contenu d'entrainement, selon le template publie par l'AI Office (article 53(1)(d)).
- La politique de respect du droit d'auteur, incluant le mécanisme de détection et de respect des opt-out machine-readable (robots.txt, TDM Réservation Protocol, balises ai.txt).
Comment Luxgap automatise ce risque
Notre Luxgap Open-Source Model Exemption Auditor tranche en 48h la question 'mon modèle beneficie-t-il vraiment de l'exemption du considérant 104, et si oui pour quelles obligations ?'. L'outil analyse votre depot Hugging Face ou GitLab, la licence appliquee, la documentation publiee, le pipeline d'entrainement (DVC, Weights and Biases, MLflow) et produit un verdict opposable a l'AI Office avec la liste exacte des obligations residuelles qui vous incombent.
- Scanne automatiquement votre model card, la licence et les fichiers de configuration pour valider les quatre conditions cumulatives de l'exemption.
- Calcule le compute d'entrainement total en FLOPs à partir de vos logs MLflow ou Weights and Biases pour détecter le franchissement du seuil 10^25 et basculer en regime 'risque systemique'.
- Genere le resume détaillé du contenu d'entrainement au format template AI Office, en croisant vos datasets declares avec Common Crawl, LAION, The Pile et vos sources proprietaires.
- Vérifié le respect des opt-out article 4(3) directive 2019/790 en confrontant vos crawls a robots.txt, TDM Réservation Protocol et balises ai.txt des sites scrapes.
- Produit la politique copyright documentee, prete a être publiee et opposable lors d'un contrôle de l'AI Office.
- Alerte en temps reel si une évolution de la licence ou du modèle fait basculer hors du regime d'exemption.
Disponible en complement d'un mandat DPO ou CISO Luxgap ou en brique SaaS dediee selon votre périmètre. Demandez un devis personnalise et nos équipes preparent une demonstration sur votre modèle reel, avec un audit blanc gratuit sous 48h pour mesurer votre exposition avant tout engagement.