Le 27 janvier 2025, une secousse a traversé les marchés financiers et l'industrie de l'intelligence artificielle. La start-up chinoise DeepSeek a développé un nouveau modèle open-source et à faible coût qui laisse certains analystes sceptiques mais pourrait menacer des centaines de milliards investis dans l'infrastructure de l'IA.
Une nouvelle menace pour les géants de l'IA
La start-up DeepSeek a récemment dévoilé son modèle DeepSeek-V3, un assistant intelligent capable de rivaliser avec les meilleures solutions du marché, notamment ChatGPT d'OpenAI. Ce qui distingue ce modèle, au-delà de ses performances, c'est son coût de développement remarquablement bas, estimé entre 5 et 6 millions de dollars – une fraction des sommes investies par les entreprises américaines comme OpenAI ou Meta. L'impact sur les marchés financiers a été immédiat, impactant non seulement les géants des semi-conducteurs comme Nvidia (-17% et près de 600 milliards de dollars de capitalisation boursière perdue) et Broadcom (-17%) mais aussi les fournisseurs de services tels qu’Oracle (-14%), et les fournisseurs d'infrastructures de centres de données tels que Cisco (-5%).
Un modèle open-source qui pourrait redistribuer les cartes
L'un des aspects les plus frappants de DeepSeek-V3 est son ouverture. Contrairement à la plupart de ses concurrents, DeepSeek a choisi de rendre son modèle libre d'accès et modifiable sous l'une des licences open-source les plus ouvertes. Cette décision pourrait transformer radicalement l'écosystème de l'IA en permettant à un grand nombre d'acteurs, au-delà des frontières chinoises, de bénéficier de cette approche frugale de l’intelligence artificielle. Des précédents historiques, (normes compatibles IBM PC dans les années 1980, navigateur web Mozilla Firefox dans les années 2000, système d'exploitation Android dans les années 2010) montrent que les architectures ouvertes ont souvent favorisé l'innovation tout en abaissant les barrières à l'entrée pour les nouveaux venus sur le marché.
Remise en cause des modèles de performance
L'annonce de DeepSeek remet en question l'hypothèse dominante selon laquelle la performance des modèles d'IA s'améliore avec l'augmentation des paramètres, des données utilisées pour l’entrainement des modèles et de la puissance de calcul mise en oeuvre.
Si le modèle de DeepSeek venait à essaimer et satisfaire à bon nombre d’applications de l’intelligence artificielle générative à moindre coût, les capacités de calcul considérables actuellement en cours de construction pourraient devenir excédentaires, provoquant une baisse des prix et une réévaluation des stratégies d'investissement dans l'IA. Pour l'industrie des semi-conducteurs, des services cloud, et des centres de données, l'enjeu est de taille. Une réduction de la demande des équipements de pointe pourrait précipiter une crise de surcapacité, entraînant une réévaluation de toute la chaîne de valeur de l'IA.
Marchés financiers : une plus grande volatilité à court terme
À court terme, les marchés doivent se préparer à une période de volatilité, les investisseurs réévaluant la valorisation des entreprises impliquées dans l'IA. Les géants de la technologie comme Nvidia, Broadcom, et ASML, à la pointe des technologies les plus avancées, pourraient connaître une baisse soutenue de leur valeur. Mais les risques ne se limitent pas aux entreprises cotées. Les fonds de capital-risque et les investisseurs institutionnels ayant massivement misé sur l'IA ces dernières années sont également sous pression. Il faut cependant différencier les effets dans le temps. Si cette correction s'avère inévitable à court terme, elle pourrait, à moyen terme, créer un environnement plus favorable pour l'innovation, en stimulant des modèles d'IA moins coûteux et plus ciblés.
Géopolitique : une menace pour l’influence américaine
La mise en avant de DeepSeek s'inscrit dans le contexte de rivalité technologique entre les États-Unis et la Chine. Son fondateur, Liang Wenfeng, opère depuis Hangzhou, une place forte de l’IA en Chine, et a récemment rencontré le Premier ministre chinois Li Qiang. L'approche frugale de DeepSeek et l'attention médiatique qu'elle a suscitée peuvent ainsi être vues comme une réponse stratégique aux restrictions croissantes sur l'accès de la Chine aux technologies avancées desÉtats-Unis. Des modèles d'IA moins chers réduiraient considérablement l'impact des restrictions américaines sur l'écosystème IA chinois historiquement largement dépendant des technologies américaines (DeepSeek lui-même aurait été développé en utilisant une gamme de puces Nvdia qui, bien qu’avancées, ne sont pas les plus performantes). Ils pourraient également être bénéfiques pour les régions du monde ayant un fort intérêt pour les applications de l'IA, mais une infrastructure d'IA limitée, comme l'Europe.
Au-delà de ces premières annonces il faut cependant interroger les possibles limites de DeepSeek. De nombreux experts soulignent notamment que ses coûts de développement sont probablement sous-estimés et n’incluent pas, entre autres, les coûts liés au nettoyage des données, aux équipements de réseau, à la consommation d'énergie, aux salaires des ingénieurs en IA et aux ressources open-source. Le coût total de construction du modèle est donc probablement plus élevé que ce qui est revendiqué.
> Allez plus loin sur la guerre technologique entre la Chine et les Etats-Unis dans notre étude économique.