Je dois mettre mon organisation luxembourgeoise en conformité au considérant 108 du AI Act (UE 2024/1689). Quelles sont les exigences concretes a respecter, les sanctions encourues, et comment Luxgap peut-il m'accompagner ?

Le piège classiqueBeaucoup de fournisseurs de modèles d'IA à usage général lisent ce considérant comme une exonération : puisque l'EU AI Office ne fait pas de vérification œuvre par œuvre, ils pensent pouvoir publier un résumé d'entraînement vague ("sources web publiques, données sous licence, datasets open source") et passer entre les gouttes. C'est exactement l'inverse : le considérant 108 préserve intégralement l'application de la directive 2019/790 sur le droit d'auteur, ce qui signifié que les ayants droit conservent leur droit d'action civile devant les juridictions nationales, indépendamment du contrôle de l'AI Office. Le risque n'est donc pas une sanction administrative IA, mais une action en contrefaçon massive portée par éditeurs, sociétés de gestion collective ou artistes individuels, avec le résumé public comme pièce à charge.Comment lire ce considérant en pratiqueL'AI Office contrôle l'existence d'une politique copyright et la publication du résumé, pas leur véracité œuvre par œuvre.La véracité du résumé reste opposable devant les juridictions civiles nationales : un résumé mensonger ou trop vague devient un aveu de mauvaise foi.Le mécanisme d'opt-out TDM de l'article 4(3) de la directive 2019/790 doit être techniquement respecté (robots.txt, balises ai.txt, headers HTTP, métadonnées C2PA).Les déployeurs européens qui intègrent un modèle non conforme deviennent co-responsables au titre de l'article 53 de l'AI Act et du droit national de la contrefaçon.Le résumé publié doit être suffisamment détaillé pour permettre aux ayants droit d'exercer leurs droits, selon le template que prépare l'AI Office.Comment Luxgap automatise ce risqueNotre Luxgap Training Data Provenance rend impossible la publication d'un résumé d'entraînement attaquable en contrefaçon, en reconstituant cryptographiquement la traçabilité de chaque corpus ingéré par votre modèle. L'outil s'intercale entre vos pipelines de collecte (scrapers, connecteurs HuggingFace, S3, Azure Blob, datasets sous licence) et votre cluster d'entraînement pour scanner, hasher et étiqueter chaque document, en croisant les empreintes avec les registres d'opt-out TDM publiés par les éditeurs européens et les bases SACEM, SACD, GESAC, CISAC.Détecte automatiquement les contenus marqués opt-out TDM (robots.txt étendu, ai.txt, en-têtes HTTP TDM-Reservation, métadonnées C2PA) avant ingestion dans le pipeline d'entraînement.Classifie chaque source par typologie juridique (domaine public, licence Creative Commons compatible, licence négociée, contenu réservé) et bloque automatiquement les sources non autorisées.Génère le résumé public d'entraînement conforme au template AI Office, avec niveau de granularité défendable devant les juridictions civiles (catégories, volumétries, fourchettes temporelles, licences).Produit un journal cryptographiquement scellé de chaque décision d'ingestion ou d'exclusion, opposable en cas d'action en contrefaçon ou de contrôle de l'EU AI Office.Alerte en temps réel qua...

Considérant 108 AI Act — Considérant 108

Cadre européenRGPD NIS 2 DORAAI ActLanceurs d'alerte

Circulaires CSSFCSSF 22/806 CSSF 25/883 CSSF 25/880 CSSF 25/881 CSSF 25/882 CSSF 20/750 CSSF 12/552 CSSF 11/504 (abrogée)CSSF 24/847

Considérant 108

Règlement établissant des règles harmonisées sur l'intelligence artificielle · UE 2024/1689

(108)

En ce qui concerne l’obligation imposée aux fournisseurs de modèles d’IA à usage général de mettre en place une politique visant à respecter la législation de l’Union sur le droit d’auteur et de mettre à la disposition du public un résumé du contenu utilisé pour l’entraînement, le Bureau de l’IA devrait vérifier si le fournisseur a rempli cette obligation sans vérifier ou évaluer œuvre par œuvre les données d’entraînement en ce qui concerne le respect du droit d’auteur. Le présent règlement n’affecte pas l’application des règles en matière de droit d’auteur prévues par la législation de l’Union.

Conseil Luxgap · DPO & CISO

Comment se conformer

Le piège classique

Beaucoup de fournisseurs de modèles d'IA à usage général lisent ce considérant comme une exonération : puisque l'EU AI Office ne fait pas de vérification œuvre par œuvre, ils pensent pouvoir publier un résumé d'entraînement vague ("sources web publiques, données sous licence, datasets open source") et passer entre les gouttes. C'est exactement l'inverse : le considérant 108 préserve intégralement l'application de la directive 2019/790 sur le droit d'auteur, ce qui signifié que les ayants droit conservent leur droit d'action civile devant les juridictions nationales, indépendamment du contrôle de l'AI Office. Le risque n'est donc pas une sanction administrative IA, mais une action en contrefaçon massive portée par éditeurs, sociétés de gestion collective ou artistes individuels, avec le résumé public comme pièce à charge.

Comment lire ce considérant en pratique

L'AI Office contrôle l'existence d'une politique copyright et la publication du résumé, pas leur véracité œuvre par œuvre.
La véracité du résumé reste opposable devant les juridictions civiles nationales : un résumé mensonger ou trop vague devient un aveu de mauvaise foi.
Le mécanisme d'opt-out TDM de l'article 4(3) de la directive 2019/790 doit être techniquement respecté (robots.txt, balises ai.txt, headers HTTP, métadonnées C2PA).
Les déployeurs européens qui intègrent un modèle non conforme deviennent co-responsables au titre de l'article 53 de l'AI Act et du droit national de la contrefaçon.
Le résumé publié doit être suffisamment détaillé pour permettre aux ayants droit d'exercer leurs droits, selon le template que prépare l'AI Office.

Comment Luxgap automatise ce risque

Notre Luxgap Training Data Provenance rend impossible la publication d'un résumé d'entraînement attaquable en contrefaçon, en reconstituant cryptographiquement la traçabilité de chaque corpus ingéré par votre modèle. L'outil s'intercale entre vos pipelines de collecte (scrapers, connecteurs HuggingFace, S3, Azure Blob, datasets sous licence) et votre cluster d'entraînement pour scanner, hasher et étiqueter chaque document, en croisant les empreintes avec les registres d'opt-out TDM publiés par les éditeurs européens et les bases SACEM, SACD, GESAC, CISAC.

Détecte automatiquement les contenus marqués opt-out TDM (robots.txt étendu, ai.txt, en-têtes HTTP TDM-Reservation, métadonnées C2PA) avant ingestion dans le pipeline d'entraînement.
Classifie chaque source par typologie juridique (domaine public, licence Creative Commons compatible, licence négociée, contenu réservé) et bloque automatiquement les sources non autorisées.
Génère le résumé public d'entraînement conforme au template AI Office, avec niveau de granularité défendable devant les juridictions civiles (catégories, volumétries, fourchettes temporelles, licences).
Produit un journal cryptographiquement scellé de chaque décision d'ingestion ou d'exclusion, opposable en cas d'action en contrefaçon ou de contrôle de l'EU AI Office.
Alerte en temps réel quand un éditeur publie un nouvel opt-out TDM sur un corpus déjà utilisé, et déclenche la procédure de désapprentissage ciblé.
Croise vos datasets avec les bases d'œuvres protégées des sociétés de gestion collective européennes pour quantifier votre exposition résiduelle avant publication du résumé.

Disponible en complément d'un mandat DPO ou CISO Luxgap ou en brique SaaS dédiée selon votre périmètre. Demandez un devis personnalisé et nos équipes préparent une démonstration sur votre pipeline d'entraînement réel, avec un audit blanc gratuit sous 48h pour mesurer votre exposition copyright avant publication du résumé public.

Besoin d'aide sur cet article ?

Notre équipe (juristes + ingénieurs cyber) vous fournit le concret. Réponse sous 24 h ouvrées.

Considérant 108

Ils nous font confiance

Avant de discuter