×
Dans

DeepSeek-V2 : Comment un modèle d’IA chinois a contourné les restrictions américaines avec des puces Nvidia

L’intelligence artificielle est au cœur d’une course technologique mondiale, et les puces graphiques (GPU) sont les chevaux de bataille de cette révolution. Récemment, l’entreprise chinoise DeepSeek a fait les gros titres en annonçant avoir entraîné son nouveau modèle de langage, DeepSeek-V2, grâce à des puces Nvidia H800. Une nouvelle qui relance le débat sur l’efficacité des restrictions américaines visant à freiner le développement de l’IA chinoise.

DeepSeek-V2 : Un modèle de langage prometteur

DeepSeek-V2 est le dernier-né des grands modèles de langage (LLM) en source ouverte de l’entreprise chinoise. Ce modèle, basé sur une architecture « mixture-of-experts » (MoE), est particulièrement efficace et performant. Il se distingue par sa capacité à gérer de longs contextes et, selon DeepSeek, surpasse le modèle Llama 3 8B de Meta. Sa conception MoE le rend également plus efficient en termes de calcul et de mémoire vive, ce qui est crucial pour le déploiement à grande échelle.

Les puces Nvidia H800 : La faille dans le bouclier américain ?

Le nœud du problème réside dans les puces utilisées pour son entraînement : les Nvidia H800. Ces GPU ne sont pas des H100 « standard », mais des versions spécialement conçues par Nvidia pour se conformer aux premières restrictions à l’exportation imposées par les États-Unis en octobre 2022. L’objectif de Washington était de limiter l’accès de la Chine aux technologies d’IA de pointe, potentiellement utilisables à des fins militaires.

Le H800, bien que moins performant que le H100 original (notamment en termes de bande passante d’interconnexion entre les puces), restait une bête de somme pour l’entraînement d’IA. Il respectait les seuils de performance imposés par les régulations, permettant à Nvidia de continuer à vendre des puces de haute volée au marché chinois, qui représente un segment crucial pour le fabricant.

Le jeu du chat et de la souris technologique

L’annonce de DeepSeek met en lumière la difficulté des gouvernements à contrôler la diffusion de technologies de pointe. En trouvant des solutions adaptées aux restrictions initiales, Nvidia et les entreprises chinoises comme DeepSeek ont pu continuer à innover. Cependant, cette situation n’a pas échappé à Washington. En octobre 2023, face à l’ingéniosité de l’industrie, les États-Unis ont durci leurs règles, interdisant désormais l’exportation des puces H800 et L40S, qui étaient devenues la nouvelle cible des restrictions.

Cette saga illustre parfaitement le « jeu du chat et de la souris » géopolitique et technologique en cours. D’un côté, la volonté américaine de ralentir l’avancée chinoise en IA, de l’autre, la capacité d’adaptation et d’innovation des entreprises pour contourner ou s’adapter aux contraintes. Pendant ce temps, des modèles comme DeepSeek-V2 continuent de repousser les limites de ce qui est possible en intelligence artificielle.

Quel avenir pour la course à l’IA ?

Alors que les restrictions se multiplient, la Chine cherche à développer ses propres alternatives aux puces Nvidia, un défi colossal mais essentiel pour son autonomie technologique. L’histoire de DeepSeek et du H800 est un chapitre fascinant dans cette course mondiale à l’IA, montrant que même avec des obstacles, l’innovation trouve toujours son chemin.

Que pensez-vous de ces stratégies de contournement et de l’impact des restrictions sur l’innovation ? Partagez vos avis en commentaires !


Auteur/autrice

marcpm@gmail.con

Publications similaires

Dans

Terres rares : « Ce sera compliqué de les remplacer »

Terres Rares : Les Substituer, un Défi de Taille pour l’Avenir Les terres rares sont devenues indispensables à notre quotidien technologique, des...

Lire la suite
Dans

LIVRE. « Infiniment proches » : portraits de chimpanzés

« Infiniment Proches » : Quand la Photographie Révèle l’Âme des Chimpanzés Le livre « Infiniment Proches, portraits de chimpanzés » du photographe animalier Jean-Michel Krief,...

Lire la suite
Dans

CHRONIQUE. Pourquoi lire encore à l’heure des LLM ?

Pourquoi continuer à lire (vraiment) à l’ère des IA génératives ? L’avènement des grands modèles de langage (LLM) comme ChatGPT a bousculé...

Lire la suite
Dans

Forage record sous la glace de l’Antarctique

Forage Record Sous la Glace Antarctique : Une Fenêtre sur le Climat Passé et Futur Une équipe internationale de scientifiques vient de...

Lire la suite
Dans

En Allemagne, le loup qui a mordu une femme a été relâché dans la nature

Un Loup Ayant Mordu une Femme Relâché en Allemagne : Une Décision Qui Fait Débat L’Allemagne est au cœur d’un débat passionnant...

Lire la suite
Dans

Les moteurs du magnétisme terrestre

Le Mystère du Magnétisme Terrestre : Plongée au Cœur de notre Planète Vous êtes-vous déjà demandé ce qui protège la Terre des...

Lire la suite