OpenAI tatoue ses images façon messager grec

Tu te souviens d’Histiée, ce Grec ancien qui tatouait des messages secrets sur le crâne rasé de ses esclaves ? Ben OpenAI vient de piquer l’idée pour tracer ses images générées par IA. La route commerciale de Darius n’emporte pas sur les data centers de Sam Altman, mais l’idée de fond est la même : cacher l’info là où on ne la cherche pas.

OpenAI a annoncé mardi deux nouvelles couches de protection pour ses images générées par DALL-E, Sora et ChatGPT. La première, c’est l’adoption du standard C2PA (Coalition for Content Provenance and Authenticity), un format de métadonnées ouvert qui signale l’origine IA de l’image. La seconde, c’est un watermark invisible développé par Google, baptisé SynthID, qui se planque dans les pixels eux-mêmes.

Le problème du métadata

Jusqu’ici, les métadonnées C2PA étaient fragiles : un screenshot, un recadrage, un filtre Instagram, et pouf, envolées. Les éditeurs d’images les stripent facilement. La promesse de SynthID, c’est de résister à ces altérations. OpenAI combine les deux : le C2PA pour les infos riches (qui a généré, quand, sur quel modèle), le SynthID pour la robustesse. En théorie, l’un compense les faiblesses de l’autre.

Steganographie 2.0

Derrière le terme ronflant, c’est de la stéganographie : cacher un message dans le fichier sans qu’il soit visible. SynthID modifie subtilement les valeurs des pixels d’une manière que seuls les algorithmes savent lire. Une screenshot, une compression JPEG, ça passe. C’est la même technique que les filigranes d’Adobe ou ceux de Google dans leurs propres modèles.

Le test de la vérification publique

OpenAI déploie aussi un outil de vérification public, accessible sur son site, qui permet de tester si une image provient de ses modèles. Il scanne les deux couches : métadonnées et watermark. Au début, il ne marchera que pour les images OpenAI. L’entreprise promet d’étendre la prise en charge à d’autres générateurs plus tard. On verra.

Limites assumées

Le système a des trous. D’abord, les autres générateurs (Midjourney, Stable Diffusion, et les usines à porno synthétique) n’ont pas signé. Ensuite, un attaquant motivé peut toujours analyser les différences entre des images avec et sans watermark, et entraîner un modèle à les effacer. Comme le disait un chercheur : « Le watermarking, c’est une course aux armements, pas une solution miracle. »

OpenAI le reconnaît : « Le watermarking est plus durable à travers les transformations (screenshots), tandis que les métadonnées apportent plus d’informations. Ensemble, ils rendent la provenance plus résiliente que chaque couche seule. » Sauf que si l’attaquant utilise un autre générateur, le problème reste entier.

Pourquoi c’est mieux que rien ?

Si tu bosses dans les médias, le fact-checking ou la justice, avoir une signature fiable sur les images OpenAI, c’est un pas en avant. Ça réduit le nombre de sources douteuses, ça facilite la traçabilité en cas d’enquête, ça responsabilise un des plus gros producteurs. Mais ça ne va pas arrêter les campagnes de désinformation venues d’ailleurs.

La vraie question, c’est : est-ce que les autres boîtes vont suivre ? Meta, Google (qui a déjà le sien avec SynthID), Midjourney, Stability AI ? Si le standard C2PA devient un réflexe, on gagne. Si chacun fait son petit watermark propriétaire, on va se retrouver avec 15 outils de vérification incompatibles, et ce sera le bordel.

Conclusion

OpenAI fait un geste. Pas par altruisme (le timing avec les élections américaines de 2026 n’est pas un hasard), mais parce que l’inaction leur coûterait cher en crédibilité. Le tatouage grec d’Histiée a marché parce que personne ne savait qu’il fallait regarder le crâne. Aujourd’hui, tout le monde sait que les images IA sont suspectes. Le watermarking ne changera pas ça. Mais au moins, on aura un début de piste.

Sources :

OpenAI tatoue ses images façon messager grec

Latest Comments

Assistant MOGWAI

Assistant MOGWAI