法语助手
2025-02-05
Après Google, Microsoft, Meta ou encore OpenAI,
il y a un nouveau nom à retenir dans le monde de la tech,
DeepSeek.
Alors DeepSeek, si vous ne savez pas ce que c'est,
c'est que vous n'êtes pas beaucoup allé sur les réseaux sociaux ces dernières heures
parce que tout le monde parle de cette entreprise chinoise qui est relativement jeune.
Elle a été fondée en 2023
et elle est peut-être la réponse chinoise à ChatGPT.
DeepSeek, c'est une entreprise qui développe des modèles d'intelligence artificielle.
Les modèles d'intelligence artificielle,
c'est ce qu'on appelle aussi des LLM
et vous les connaissez chez OpenAI avec GPT 4.0 par exemple,
avec Gemini chez Google, avec Lama chez MetaEye.
Et bien là, il y a plusieurs modèles développés par DeepSeek.
Et ce qui est intéressant, c'est que ces modèles sont super efficaces,
mais qu'ils coûtent très peu d'argent.
La grosse actualité de DeepSeek ces dernières heures,
c'est que pour la première fois depuis la création de ChatGPT,
une application est passée devant dans les téléchargements sur l'App Store.
DeepSeek est la nouvelle application la plus téléchargée aux Etats-Unis
et elle le sera bientôt en France.
Est-ce que c'est une vraie révolution ?
Est-ce que les Etats-Unis ont été ringardisés ?
On va répondre rapidement à ces questions dans cette vidéo.
Déjà, qui se cache derrière DeepSeek ?
Eh bien, des ingénieurs chinois.
C'est une entreprise qui a été fabriquée
pour répondre à la montée de l'intelligence artificielle générative aux États-Unis.
Elle est composée majoritairement de jeunes ingénieurs.
Le but, c'est d'aller vite, c'est de ne pas prioriser l'expérience,
mais de prioriser des gens qui ont envie de changer le monde.
Et elle mise énormément sur l'open source
pour inciter des chercheurs à publier ce qu'ils découvrent sur Internet,
à collaborer avec des chercheurs du monde entier
et donc à aller beaucoup plus rapidement que dans une entreprise traditionnelle.
Sur le site de DeepSeek, on trouve plusieurs modèles de langage.
Il y en a plusieurs qui sont spécialisés,
c'est-à-dire que DeepSeek va travailler sur des modèles pour les maths,
pour le code, pour différents domaines très spécifiques.
Et il y a deux modèles dont on parle énormément depuis la fin d'année 2024,
c'est DeepSeek V3 et DeepSeek R1.
DeepSeek V3, c'est un modèle polyvalent, universel.
C'est similaire à ce que ChatGPT propose par défaut avec GPT 4.0
ou à ce que Google propose avec Gemini.
C'est un modèle qui peut générer du texte,
qui peut analyser de longs documents et les résumés,
qui peut discuter avec vous et il le fait très bien.
Tous les tests montrent que DeepSeek V3 est quasiment aussi bon que GPT 4.0,
alors qu'il coûte beaucoup moins cher
et qu'en comparaison avec ChatGPT qui a coûté plusieurs centaines de millions de dollars,
lui n'a coûté que 5 millions de dollars.
Et puis, le 20 janvier 2025,
DeepSeek a présenté son modèle le plus impressionnant à ce jour,
DeepSeek R1. DeepSeek R1。
Là, on est sur un modèle de réflexion,
un modèle d'avant-garde, comme l'industrie aime bien les appeler.
C'est un modèle qui, d'une certaine manière,
a été conçu pour répondre à des problématiques plus compliquées,
puisqu'il peut poser différentes hypothèses.
En gros, vous lui posez une question,
et au lieu de répondre immédiatement et de générer mot par mot comme les autres modèles,
il va se poser lui-même plusieurs questions.
Est-ce que je dois faire ça ?
Est-ce que c'est bien ?
Non, c'était pas bien, je repars en arrière.
Je vais récupérer les données sur Internet pour voir si ça peut coïncider, etc.
Et à la fin, il génère une réponse qui a plein de contextes.
DeepSeek R1, d'après les premiers tests,
c'est quasiment le meilleur modèle du marché à ce jour,
le meilleur modèle de réflexion.
ChatGPT propose le modèle O1 qui est quasiment équivalent.
Mais la grosse différence,
c'est que DeepSeek R1 coûte 27 fois moins cher par réponse.
Parce que oui, comme je viens de vous le dire,
la grosse différence entre DeepSeek et les Américains,
c'est le prix.
Déjà au niveau du financement,
DeepSeek a très peu d'argent pour une grande entreprise de l'intelligence artificielle.
Avec seulement 5 millions et des GPU Nvidia H800
qui ont plusieurs années et qui ne sont pas du tout optimisés pour l'IA,
ils ont réussi à créer des modèles plus performants que ceux d'OpenAI,
ce qui remet complètement en question l'approche des Américains avec l'IA.
Le plus impressionnant avec DeepSeek R1,
c'est ce que l'entreprise appelle le mix d'experts.
Quand vous parlez à une intelligence artificielle comme ChatGPT,
plus elle est performante, plus elle a de milliards de paramètres.
C'est ce qui lui donne en quelque sorte son intelligence.
Et DeepSeek a complètement repensé la manière dont fonctionne une IA.
L'idée est d'avoir un modèle avec 671 milliards de paramètres.
C'est immense, mais il ne veut en utiliser que 37 milliards à la fois.
En fait, l'idée, c'est qu'il va y avoir un expert pour la médecine,
un expert pour les maths, un expert pour le code,
un expert pour pour la géographie et en fonction de la question que vous lui posez,
il ne va interroger que les paramètres concernés.
À quoi ça sert ?
À utiliser beaucoup moins de puissance et beaucoup moins de mémoire
et donc à répondre sans dépenser de l'argent.
Autre économie imaginée par le groupe chinois,
une précision à 8 décimales près contre 32 décimales chez les concurrents.
Alors, ça va faire des résultats moins précis,
c'est vrai, mais ça donne une précision très bonne
pour des résultats qui coûtent énormément moins d'argent.
Le résultat, il est sans appel.
Quand vous parlez à DeepSeek R1, pour 1 million de tokens,
1 million de réponses générées, vous allez payer 2,19 dollars,
alors que ChatGPT, c'est 60 dollars.
Et avec ça, c'est que DeepSeek va s'adresser aux développeurs qui veulent créer leur propre chatbot avec une solution
qui coûte 27 mois d'argent que chez OpenAI et que puisque le système est open source,
n'importe quelle entreprise peut s'en inspirer pour développer son propre modèle.
En gros, ils viennent de mettre une belle baffe aux Américains
en leur montrant comment on peut faire une IA efficace pour pas beaucoup d'argent.
Bon, évidemment, la question qui se pose, c'est celle de la censure.
Ces derniers jours, on a vu pas mal de vidéos de personnes
qui essayent de poser des questions problématiques à DeepSeek sur l'histoire de la Chine,
sur le régime, sur le parti communiste.
Et à chaque fois, on voit que DeepSeek est bridé.
En fait, ce qui est marrant, c'est qu'il génère une réponse normale.
Et dès que le nom Xi Jinping ou le parti communiste chinois est mentionné,
eh bien, il se bride et il dit impossible de générer la réponse.
J'ai envie de vous dire que c'est à la fois inquiétant
et à la fois pas vraiment un problème.
C'est inquiétant parce qu'évidemment
que ces systèmes d'IA qui sont censés nous donner un savoir universel peuvent influer les pensées,
peuvent créer des bulles d'opinion,
mais en même temps il faut distinguer DeepSeek en tant que service,
le site qui est disponible à la fois dans une application et sur un site web,
et DeepSeek en tant que modèle.
Le modèle et ses prouesses technologiques qui permettent de faire des économies,
eh bien, il est open source.
N'importe quelle entreprise américaine,
européenne peut récupérer le code, le faire tourner sur ses propres serveurs
et lui dire de répondre librement sans censure et il ne se censurera pas.
Maintenant, le service en lui-même, évidemment,
qu'on va vous recommander d'être prudent avant de vous inscrire sur un service chinois
et de l'utiliser à la place de chat GPT.
DeepSeek a la particularité d'auto-entraîner ses modèles,
ce qui fait qu'ils apprennent tout seuls.
Et donc, tout ce que vous allez lui dire,
ça va être transféré sur un serveur en Chine.
DeepSeek est la numéro 1 des téléchargements sur l'App Store.
On peut imaginer que ça va continuer quelques temps,
même si ChatGPT devrait logiquement repasser devant.
En téléchargements globaux, ils sont largement au-dessus.
La question, c'est quel sera l'impact de ce succès médiatique
et de ce buzz phénoménal qui est provoqué par DeepSeek.
On peut imaginer qu'il ne sera pas éphémère,
dans le sens où poser une question à DeepSeek coûte 27 fois moins qu'avec ChatGPT.
Donc forcément, ça va avoir un impact sur l'industrie.
On peut imaginer qu'à court terme,
OpenAI, Google, Microsoft s'inspirent de ce qu'a fait DeepSeek
pour justement ce système d'experts pour réduire les coûts.
On peut aussi imaginer que la course à qui aura le plus de serveurs
et mis le plus d'argent dans l'IA va peut-être ralentir.
C'est pas forcément bon pour les entreprises comme Nvidia, ARM qui proposent des puces
parce que ça veut dire qu'on n'a pas besoin d'avoir les meilleures puces du marché
pour pouvoir faire une bonne IA.
En fait, ce qui se passe avec DeepSeek,
c'est tout simplement un retour de la Chine.
On pensait que les États-Unis avaient énormément d'avance sur l'IA,
que personne ne pourrait les rattraper,
que seuls leurs investissements massifs étaient capables de révolutionner le monde.
Et les Chinois sont en train de prouver que non,
ils ne sont pas en retard et surtout qu'ils peuvent innover différemment.
A l'avenir, il va falloir surveiller la réponse d'OpenAI,
notamment on sait que le modèle o3 ne va pas tarder à sortir.
On sait aussi que ce modèle, il risque de coûter super cher par question,
qu'il va sans doute falloir le réoptimiser s'ils veulent être en mesure de rivaliser avec DeepSeek.
Et il faudra aussi évidemment surveiller les futures innovations de DeepSeek,
parce qu'il est probable que ce modèle R1 soit rapidement suivi d'un modèle R2
capable de rivaliser avec les futures innovations des géants américains.
Bref, la guerre de l'IA ne fait que recommencer.
Jusqu'à maintenant, c'était des entreprises américaines
qui s'affrontaient entre elles avec le plus de puissance,
le plus d'argent, le plus de paramètres, etc.
Et maintenant, la Chine prouve qu'il y a une autre manière de faire de l'IA,
qui plus est, moins consommatrice d'énergie.
沙发还没有被抢走,赶紧过来坐会吧