Est-ce que DeepSeek est plus utile que ChatGPT dans une salle de presse?
Oui. Mais quand même non.
DeepSeek fait énormément jaser. On a ici une IA comparable à ChatGPT, mais pour une fraction du prix. Et en plus, c’est open source, alors on peut penser que c’est plus sécuritaire. Alors DeepSeek, c’est une révolution pour les salles de presse qui veulent utiliser l’IA, ou bien c’est juste un autre cheap knockoff chinois?
Pour en avoir le cœur net, j’en ai parlé à Stéphane Ricoul, vice-président chez Talsom et expert en économie numérique, ainsi qu’à Bruno Guglielminetti, analyste spécialiste du numérique.
Vraiment, cr***ement moins cher
Commençons avec le plus évident : le prix. Même si on ignore l’annonce sur le coût de développement de DeepSeek – ça a l’air qu’ils n’ont pas vraiment dit toute la vérité là-dessus – le coût d’exploitation demeure tout de même dérisoire si on compare à ChatGPT.
« L’IA se consomme par tokens. ChatGPT facture au minimum 15$ par million de tokens alors que DeepSeek c’est seulement 0,55 $ par million de tokens. On est sur une autre planète », souligne Stéphane Ricoul.
(Pour une analyse plus complète des coûts et des performances de DeepSeek et ChatGPT, je suggère cet article de l’Economic Times.)
En plus, vu que c’est open source, n’importe-quel petit génie peut adapter le code à sa façon pour créer des outils IA de plus en plus nichés pour pas très cher.
« Il y a une armée de développeurs indépendants qui vont venir ajouter des briques à la fondation », affirme M. Ricoul.
Plus simple de protéger les droits d’auteurs (et les sources!)
J’ai déjà parlé du fait qu’il est plus complexe de réclamer des redevances aux compagnies créant des outils IA si on utilise ces mêmes outils dans la création du contenu. J’ai tout détaillé ici, mais en gros, mieux vaut les bloquer complètement jusqu’à ce que tu saches exactement ce que tu veux en termes de redevances.
Selon Bruno Guglielminetti, DeepSeek offre un début de solution pour les médias souhaitant utiliser l’IA dans leurs opérations sans envoyer tout leur contenu à une compagnie externe.
« L’usage d’ensembles de données sous licence ouverte ou de modèles spécialisés pour les médias pourrait limiter [les enjeux liés aux droits d’auteur], mais ne les élimine pas complètement », souligne-t-il.
Étant donné que c’est open source (ou « code source ouvert » en français), le code peut être copié sur des serveurs appartenant au média ou à un partenaire de confiance. Il ne serait alors plus question d’entraîner une IA externe avec ton contenu. Ce qui simplifie autant la protection du droit d’auteur que la protection des informations confidentielles.
« Toutefois, cette approche exige des ressources et des compétences en interne pour assurer une gestion sécurisée et efficace », rappelle l’analyste.
Pas très sécuritaire
Généralement, quand c’est moins cher, c’est plus risqué. DeepSeek c’est pareil.
En partant, le fait que c’est une compagnie chinoise devrait te faire réfléchir deux fois.
« La Chine est autoritaire, souligne Stéphane Ricoul. Le gouvernement impose des règles à ses compagnies technologiques, qui doivent donner accès au gouvernement à leurs données. »
C’est ce qu’on appelle un backdoor, ou une « porte dérobée » : un gouvernement force la compagnie à insérer du code caché qui permet au détenteur de la clé d’accéder aux données. Dans le cas de DeepSeek, une firme de cybersécurité a trouvé du code qui permet à l’IA d’envoyer les données récoltées à un serveur appartenant au Parti communiste chinois.
Les backdoors existent chez les compagnies américaines également, alors ChatGPT ce n’est pas nécessairement mieux.
« Un modèle code source ouvert, développé de manière collaborative et transparent par une communauté internationale, offrirait une meilleure traçabilité et réduirait le risque de biais imposés par un gouvernement ou une entreprise », avance Bruno Guglielminetti.
Et puis, le code de DeepSeek n’est pas très sécuritaire en partant. La firme Wiz Research a trouvé une façon de dérober toutes sortes d’informations sensibles. Le magazine Wired a aussi déterminé que l’outil échoue à se protéger contre une cinquantaine de méthodes de jailbreaking, des procédés destinés à contourner les barrières à l’accès aux données.
Conclusion : cheap knockoff
Alors, DeepSeek c’est utile? Seulement si tu te fous un peu de la sécurité des informations que tu mets dans l’outil. Certes, tu peux mieux protéger tes droits d’auteur dans le sens que tu peux utiliser le code de DeepSeek pour créer ton propre outil hébergé sur tes propres serveurs. Mais tu te rends drôlement vulnérable au regard du gouvernement chinois. Sans parler de tous les hackers sans scrupules qui pourraient voler tes données.
Si tu veux utiliser DeepSeek, mieux vaut attendre que « l’armée de développeurs » vienne améliorer la sécurité du code source et crée des outils spécifiques aux médias d’information.
Vous voulez en savoir plus sur l’utilité de l’IA et comment l’utiliser dans votre salle de presse? Écrivez-moi!
Abonnez-vous à mon infolettre pour recevoir plus d’informations et de conseils sur les nouveaux développements affectant les médias numériques.