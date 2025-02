Début 2025, DeepSeek, une jeune entreprise chinoise spécialisée en intelligence artificielle, annonce son premier modèle de raisonnement : DeepSeek-R1. Se voulant aussi performant que ses concurrents américains, ce nouveau système a provoqué un véritable séisme dans la Silicon Valley. Son modèle, avec un code source libre (open source), développé avec un budget dérisoire, remet en question l’hégémonie technologique des États-Unis et lance la course à l’IA entre Washington et Pékin.

David contre Goliath

Fondée en 2023 à Hangzhou en Chine par Liang Wenfeng, DeepSeek était initialement une entreprise axée sur les algorithmes de trading. Rapidement, elle s’est orientée vers l’intelligence artificielle, avec l’ambition de créer un modèle performant capable de rivaliser avec les chefs de file du secteur. Contrairement aux mastodontes américains, comme OpenAI ou Anthropic, qui reposent sur des milliards de dollars d’investissements et qui ont pour objectif d’innover, DeepSeek a misé sur une approche beaucoup plus frugale. Son secret ? L’optimisation du code de modèles existants, disponibles en code source libre.

L’annonce de DeepSeek-R1 a secoué les marchés financiers. Développé avec un budget de seulement 10 millions de dollars, bien loin des investissements colossaux d’OpenAI ou Meta, ce modèle a soulevé l’hypothèse d’une surévaluation du marché de l’intelligence artificielle aux États-Unis. En réaction, le leader du marché, Nvidia, a perdu 17% de sa valeur en 24 heures et a entraîné le NASDAQ à la baisse avec un retrait de 2 000 milliards de dollars des marchés financiers, l’équivalent du PIB français, et ce, en quelques heures. Par ailleurs, cette percée est survenue peu après l’annonce du plan Stargate : près de 500 milliards de dollars d’investissement prévus par l’administration Trump pour renforcer l’infrastructure de l’IA. Marc Andreessen, entrepreneur influent et conseiller de Donald Trump, a décrit cet événement comme un « moment Spoutnik », faisant référence à l’affolement provoqué par le premier satellite soviétique sur les marchés américains en 1957, dans le cadre de la course à l’espace pendant la Guerre froide.

En parallèle, l’application DeepSeek est devenue l’une des plus téléchargées sur iPhone aux États-Unis, en Australie, en Chine et au Royaume-Uni, démontrant l’intérêt et la curiosité des consommateurs pour cette alternative au colosse ChatGPT.

Course à l’IA : la Chine redistribue les cartes

Au lieu de développer son IA à partir de zéro, comme OpenAI ou Anthropic, la start-up chinoise a optimisé des architectures déjà disponibles, réduisant ainsi les coûts de développement et d’entraînement de son modèle. Tout cela en étant contrainte d’utiliser des puces moins puissantes, à cause des restrictions américaines sur les exportations de semi-conducteurs vers la Chine. DeepSeek prouve qu’un modèle performant peut être conçu avec des ressources limitées.

L’aspect du code source libre joue un rôle central : en rendant son modèle accessible à tous, DeepSeek suit une philosophie initialement prônée par OpenAI avant son virage vers une approche fermée. Ce choix permet une collaboration mondiale, où entreprises et chercheurs peuvent œuvrer ensemble pour améliorer le modèle.

Mais DeepSeek ne se distingue pas seulement par son modèle économique. Son PDG, Liang Wenfeng, adopte une politique de recrutement atypique, misant sur de jeunes diplômés et des profils issus des sciences humaines plutôt que sur des ingénieurs expérimentés. Selon lui, « l’expérience peut être un frein à l’innovation (tdlr) », car les experts établis ont tendance à reproduire ce qu’ils connaissent déjà, tandis que les jeunes diplômés, moins sûrs d’eux, explorent davantage de solutions nouvelles. Dans une entrevue donnée au média chinois 36Kr, il expliquait : « les travailleurs expérimentés ont des certitudes sur la bonne manière de faire, alors que les jeunes se remettent constamment en question, ce qui les pousse à innover ». Un pari risqué, mais qui, à en juger par le succès fulgurant de DeepSeek, semble avoir porté ses fruits.

L’arrivée de DeepSeek-R1 bouleverse l’équilibre de la course à l’intelligence artificielle entre la Chine et les États-Unis, un affrontement qui rappelle la course à l’espace du 20e siècle. Conscients de l’enjeu stratégique, les États-Unis avaient tenté d’entraver les avancées chinoises en restreignant l’exportation des puces Nvidia vers la Chine. Pourtant, le PDG de DeepSeek avait anticipé ces restrictions en commandant des milliers de puces performantes à l’avance, lui permettant de bénéficier d’une partie de la puissance des dernières puces Nvidia A100. Les cartes sont désormais rebattues : pour la première fois, un modèle chinois s’impose comme un concurrent direct d’OpenAI. En réponse, ce dernier a dû accélérer la sortie de son modèle « OpenAI o3 mini ». De plus, ce n’est pas seulement DeepSeek qui inquiète les États-Unis : la plateforme de commerce en ligne Alibaba a également annoncé son propre modèle, Qwen 2.5‑Max, qui se dit encore plus performant que DeepSeek-R1, renforçant davantage la pression chinoise sur le marché mondial de l’IA.

Au-delà des enjeux géopolitiques, le choix du consommateur est aussi redéfini. Pour Théophile et Antoine, étudiants en ingénierie à McGill, l’offre de DeepSeek change la donne. « Honnêtement, DeepSeek est gratuit et assez performant pour l’usage que j’en fais », explique Antoine, « payer 20 dollars par mois pour ChatGPT Plus, ce n’est pas négligeable pour un étudiant ». Théophile ajoute également : « de telles initiatives permettent aux géants de se réinventer pour conserver leurs clients, ces percées technologiques sont dans notre intérêt, nous, les consommateurs ».

