IA : DeepSeek a-t-il copié ChatGPT pour concevoir son intelligence artificielle ?

Les ingénieurs d’OpenAI affirment avoir découvert des indices suggérant que DeepSeek aurait eu recours à la « distillation des connaissances » pour entraîner son modèle à partir de ChatGPT. Cette technique, interdite par les conditions d’utilisation d’OpenAI, aurait permis au groupe chinois de réduire drastiquement ses coûts en s’appuyant sur des années de recherche et développement menées par OpenAI.

L’intelligence artificielle de DeepSeek : une prouesse ou une stratégie douteuse ?

DeepSeek revendique la création d’un modèle d’intelligence artificielle plus performant que ChatGPT-01, tout en étant 27 fois moins coûteux à produire. Avec un budget de seulement 5,6 millions de dollars, là où les géants du secteur investissent des centaines de millions, l’entreprise chinoise intrigue. Son modèle, DeepSeek-R1, impressionne par sa capacité à répondre avec précision, à détailler ses raisonnements et à surpasser ChatGPT dans plusieurs tests. Son code open source a rapidement été repris par des entreprises comme Perplexity ou Groq, qui exploitent déjà leurs propres versions sur des serveurs basés aux États-Unis.

Si l’efficacité de DeepSeek-R1 ne fait plus débat, les conditions exactes de son développement soulèvent des interrogations. Certes, ce modèle est optimisé pour fonctionner avec une consommation énergétique minimale, mais la somme investie pour son élaboration paraît étonnamment faible. OpenAI, dans une déclaration au Financial Times le 29 janvier, soupçonne DeepSeek d’avoir contourné les méthodes classiques d’entraînement en s’appuyant directement sur ChatGPT.

  Augmentez votre visibilité sur YouTube avec l'achat de vues

Un apprentissage facilité grâce à ChatGPT ?

Selon OpenAI, DeepSeek aurait exploité la technique de la « distillation des connaissances ». Ce procédé repose sur l’idée qu’un modèle d’intelligence artificielle avancé (le modèle enseignant) peut transférer son savoir à un modèle plus petit (le modèle étudiant). Concrètement, un modèle étudiant interroge un modèle plus performant et apprend à imiter ses réponses, accélérant ainsi son propre entraînement. Cette approche permet d’éviter un apprentissage à partir de zéro et de s’appuyer sur des modèles existants pour progresser rapidement.

Si cette méthode est courante en intelligence artificielle, OpenAI interdit explicitement l’utilisation de ses modèles pour développer des alternatives concurrentes. Selon l’entreprise, des analyses auraient révélé que, dès 2024, DeepSeek aurait massivement interrogé les modèles d’OpenAI via son API afin d’entraîner DeepSeek-V3 et DeepSeek-R1 à moindre coût. Une telle stratégie expliquerait comment l’entreprise chinoise a pu concevoir un modèle aussi performant avec des ressources limitées, en exploitant indirectement les infrastructures d’OpenAI.

Une affaire qui inquiète jusqu’à la Maison-Blanche

L’affaire a rapidement attiré l’attention des autorités américaines. David Sacks, désigné par Donald Trump pour superviser les questions liées à l’IA et aux cryptomonnaies, a évoqué le sujet sur Fox News, suggérant que DeepSeek pourrait avoir « aspiré » les données d’OpenAI. Selon lui, des preuves crédibles indiqueraient que l’entreprise chinoise aurait utilisé les modèles d’OpenAI pour en extraire des connaissances. Il a également exhorté les entreprises américaines à renforcer leurs mesures de protection face aux risques de vol technologique.

Si les soupçons d’OpenAI sont confirmés, DeepSeek ne serait pas le premier acteur du secteur à s’appuyer sur la distillation des connaissances pour accélérer le développement d’un modèle concurrent. Toutefois, ce qui distingue DeepSeek des précédents cas, c’est la qualité exceptionnelle de son IA, rendue possible grâce à une architecture innovante qui réduit considérablement les coûts.

  Dans quelle mesure la recherche vocale impacte-t-elle le SEO ?

Une avancée technologique qui bouscule le marché

Quelle que soit l’origine exacte de son modèle, DeepSeek a déjà bouleversé l’écosystème de l’IA. L’annonce de sa performance a eu un impact direct sur les marchés financiers, entraînant une baisse brutale des actions des grandes entreprises américaines le 27 janvier, avant un début de stabilisation dès le lendemain.

Reste à voir si OpenAI prendra des mesures légales contre DeepSeek et si des régulations viendront encadrer plus strictement l’usage des modèles existants pour entraîner de nouvelles intelligences artificielles. Quoi qu’il en soit, DeepSeek a prouvé qu’il est possible de rivaliser avec les leaders du marché en adoptant des approches novatrices. Reste à déterminer si cette prouesse repose uniquement sur du génie technique… ou sur une exploitation discutable des ressources d’OpenAI.

👉 Pensez-vous que la distillation des connaissances devrait être mieux régulée dans le domaine de l’IA ? Partagez votre avis en commentaire !