Comment vérifier si ce contenu est rédigé par un humain ou une IA ?

Marie Louisy
De Marie Louisy 14 min de lecture
14 min de lecture

Comment détecter un contenu rédigé par l’IA : Avantages, inconvénients et méthodes de vérification

Rapide et réputée indétectable. Si nous reconnaissons d’emblée le gain de temps obtenu par l’usage de l’IA pour la rédaction de contenu, il est pourtant possible de la détecter.

Dans cet article, vous apprendrez comment vérifier si un contenu est rédigé par un humain ou une IA. Vous découvrirez également la course contre la montre que se livrent d’un côté, les détecteurs de contenu IA et de l’autre les outils de rédaction IA pour rester invisibles.  

Qu’est-ce que le contenu généré par l’IA ?

Le contenu généré par l’IA est un contenu créé par l’IA suivant les instructions reçues, encore appelées invites ou prompt1. L’IA est capable de produire un contenu varié (texte, audio, vidéo) en quantités importantes.

Pourquoi le contenu généré par l’IA est-il important ?

Au fil des mises à jour, l’IA est capable de produire du contenu de plus en plus ressemblant à l’écriture humaine. Par conséquent, les particuliers et les entreprises de secteurs variés sont de plus en plus nombreux à l’utiliser.

Quels sont les avantages et les inconvénients du contenu généré par l’IA ?

Les avantages du contenu généré par l’IA

  • Des quantités infinies de texte
  • Un contenu vraisemblable
  • Une variété infinie de thèmes
  • L’assistance à la créativité
  • Le gain de temps
  • L’économie budgétaire
  • La capacité d’analyse
  • La précision
  • L’économie d’énergie physique ou cognitive
  • La capacité d’adaptation
  • Une assistance pour le contenu SEO 

Pour le SEO, l’IA vous aide à créer plusieurs types de contenus, tels que :

  • Les meta titres et descriptions meta
  • Les sections, la hiérarchie et le contenu d’un blog
  • Les descriptions de produits ou de vidéos, etc.

Les inconvénients du contenu généré par l’IA

L’absence de références

  • Références inexactes
  • Références obsolètes
  • Références inappropriées
  • Références trop techniques
  • Absence de références

 Les incohérences

  • Style décousu
  • Changements brusques de ton
  • Manque de transitions

Le défaut de contexte

  • Pertes de contexte dans les passages d’une certaine longueur
  • Inconsistance des paragraphes
  • “Oubli” du sujet principal lors de la rédaction

Les défaillances linguistiques

  • Langage trop sophistiqué
  • Absence d’expressions idiomatiques ou familières
  • Reproduction artificielle du langage humain

Comment vérifier si un contenu est rédigé par un humain ou une IA ?

Détecter le contenu généré par l’IA peut sembler difficile. Cependant, avec du bon sens et de l’observation, vous pouvez identifier les signes techniques qui la trahissent.

Quels sont les antécédents de l’auteur ?

Impossible de vous décider ? Le texte est trop bien écrit et vous ne savez pas quoi penser ? Dans ce cas, tournez-vous vers l’auteur de l’article.

  • Qui est-il ?
  • Où a-t-il travaillé auparavant ?
  • Quels sont ses travaux passés ?
  • Travaille-t-il en équipe ?

Cet exercice est d’autant plus important que des auteurs eux-mêmes générés par l’IA existent désormais. Si rien ne cloche à ce niveau-là, croisez ce critère avec d’autres pour être assuré de l’authenticité de l’article2.

Que racontent les faits ?

L’IA rédige globalement. Les mises à jour sont périodiques, aussi le contenu doit être assez logique et sans trop de détails pour rester vraisemblable. Un contenu peut être généré par l’IA si vous observez :

  • Des incohérences, y compris dans les statistiques
  • L’absence de chiffres
  • L’imprécision dans la description des faits
  • L’âge dépassé des informations rapportées

c’est que ce texte est probablement rédigé par une IA.

Y a-t-il des répétitions inutiles ou étranges ?

L’IA a un vocabulaire limité, par sa base de données d’une part, et par son besoin de simplifier l’information transmise d’autre part. Cela se reflète dans les textes rédigés par l’IA qui sont souvent redondants ou utilisent les mêmes expressions pour plusieurs situations distinctes. Autrement dit, l’IA reproduit des modèles de langage. Par conséquent, vous pouvez démasquer l’utilisation de l’IA pour la rédaction d’un texte grâce à sa structure.

Le contenu est-il dénué d’émotion ?

Surtout à leur lancement, les IA étaient incapables de reproduire l’émotion humaine lors de la rédaction des textes. Ce qu’il faut rechercher dans l’écriture :

  • L’absence des mots et expressions émotionnels
  • Le manque de personnalité
  • Une description factuelle, sans émotion

Cependant, avec l’évolution récente des chatbots, il est important de croiser le facteur “émotion” avec d’autres critères pour déterminer l’origine d’un contenu.

Le texte est-il cohérent ?

Le contenu généré par l’IA présente souvent des incohérences :

  • La ponctuation
  • Trop formel
  • Fautes grammaticales
  • Rigidité ou absence de transitions entre les parties du texte

Si vous êtes en face d’un texte qui va du coq à l’âne, il est probablement généré par l’IA (ou bien rédigé par un enfant !)

Les autres éléments à considérer

  • Un contenu générique ou fade
  • Les hallucinations de l’IA
  • L’absence d’émotion et d’anecdotes
  • Contenu dupliqué plusieurs fois sur internet
  • Sources absentes
  • La vérification des métadonnées
  • L’absence de ton
  • Contenu reproduit mot à mot par une IA à l’aide de prompt, etc.

L’IA est limitée. Pour prévenir les erreurs, il est généralement recommandé d’affiner au maximum vos invites, de mixer le contenu humain au travail fourni et de retravailler vos contenus.

Si vous êtes pressé ou devez contrôler une quantité importante de texte, des outils spécifiques peuvent vous aider à identifier le contenu généré par l’IA.

Quels outils de détection ?

Quelques outils pour rendre l’écriture générée par l’IA indétectable

Jasper

L’outil Jasper utilise l’IA et la PNL avancées pour échapper à la détection de contenu IA. Pour y parvenir, Jasper va intervenir sur plusieurs points, en particulier :

  • L’intégration du SEO (Surfer SEO)
  • L’amélioration de la grammaire, de l’engagement et du style
  • La détection du plagiat
  • La réécriture de contenu

BlogAssistant.co

BlogAssistant.co prétend faire mieux que de modifier un contenu généré par l’IA pour le rendre indétectable. Alimenté par GPT-3, il rédige du texte IA indétectable par les outils actuels. BlogAssistant.co fournit plusieurs services, tels que :

  • La génération de mots-clés
  • La création rapide de blogs optimisés SEO
  • Du texte
  • La personnalisation de la longueur des articles rédigés

BlogAssistant.co écorche si bien l’éthique que nous ignorons encore s’il pourra subsister longtemps dans le paysage de l’IA, déjà en proie à des protestations. De nombreuses initiatives sont en cours pour éliminer tout risque de plagiat.

Quelques outils pour détecter efficacement l’écriture générée par l’IA

ZeroGPT

  • Ouvert à tous les utilisateurs
  • Facile à utiliser
  • Adossé sur la technologie propriétaire DeepAnalyse, formée à l’aide de 10 millions d’entrées textuelles
  • Il suffit de coller votre texte puis attendre
  • Les résultats sont facilement compréhensibles
  • Taux d’exactitude de 98%
  • Outil gratuit

Originality.AI

  • Adapté pour les éditeurs de contenu
  • Fournit une extension Chrome
  • Efficace pour plusieurs formats de contenu : les sites internet, les emails et les fichiers
  • Orienté business, déconseillé pour les milieux d’apprentissage
  • Efficace à 96% globalement
  • Efficace à 83% sur ChatGPT
  • Efficace à 94,5% sur GPT-4
  • Outil facturé automatiquement : un centime de dollars US pour 100 mots

AI Text Classifier

  • Nécessite un échantillon de 1000 caractères au minimum
  • Moins efficace en-dehors de l’anglais
  • Moins performant pour l’écriture enfantine
  • Ses critères d’évaluation : Très probable, probable ou peu probable (qu’un texte soit rédigé par une IA)
  • Créé par OpenAI pour ChatGPT3
  • Peut se tromper, inversant l’écriture générée par l’IA et l’écriture humaine
  • Peut se tromper si le texte généré est modifié efficacement
  • Outil approximatif : distingue l’écriture IA sans trancher clairement
  • Outil gratuit

GPTZero

  • Vérifie la perplexité : complexité du langage et des idées
  • Contrôle l’uniformité de la longueur des phrases
  • Détecte les rafales ou problèmes de rédaction
  • Efficace dès une seule phrase (250 caractères minimum)
  • Évalue jusqu’à 3 fichiers par téléchargement groupé et 5000 caractères par document
  • Plus précis au fur et à mesure qu’il évalue les contenus
  • Peut se tromper, inversant l’écriture générée par l’IA et l’écriture humaine
  • Accessible sur GPTZero.me
  • Développé par un Edward Tsai, de Princeton
  • Outil gratuit
  • Outil payant GPTZero Educator, disponible à 9,99$ par mois, mieux adapté aux besoins d’évaluation des enseignants

Writer AI Content Detector

  • Efficace jusqu’à 1500 caractères
  • Fournit un pourcentage de détection de contenu
  • Il suffit de coller une URL dans l’espace choisi puis d’attendre
  • Créé par Writer
  • Possibilité de détection sur de grands volumes de texte après entente, pour les utilisateurs du plan d’entreprise Writer
  • Outil gratuit

Les autres outils de détection du contenu généré par l’IA

  • Winston AI
  • Scribbr
  • Copyleaks
  • Turnitln

Bon à savoir : Les outils de détection de contenu généré par l’IA semblent utiliser une formule inversée. Autrement dit, ils recherchent l’écriture humaine puis en déduisent le ratio d’écriture générée par l’IA. Leur efficacité est variable4 non prioritaire], le plus faible étant AI Text Classifier l’outil natif de OpenAI. Avec un taux de précision de 99%, Copyleaks et Winston AI trônent parmi les plus performants.

Les questions fréquentes sur le sujet

Pourquoi a-t-on besoin de l’écriture générée par l’IA ?

L’écriture générée par l’IA a plusieurs avantages. Elle s’appuie sur une vaste bibliothèque de données, à laquelle l’auteur lui-même n’a probablement pas accès. Elle est intuitive et rapide. Enfin, l’IA corrige la grammaire et l’orthographe pour un texte contextualisé. Cependant, l’IA génère souvent des textes redondants qu’il convient de corriger avant leur publication.

Qu’est-ce qui est reproché à l’écriture générée par l’IA ?

Le reproche est principalement éthique. L’IA puise dans sa base de données d’entraînement pour rédiger. Les bots d’entraînement de l’IA extraient les informations disponibles sur internet sans le consentement des utilisateurs, ce qui est constitutif de plagiat et puni par la loi. Pour l’exemple, OpenAI a dû se confronter à une contestation massive des créateurs et des auteurs et plusieurs procès.

Comment Google peut-il détecter l’écriture générée par l’IA ?

Les algorithmes de Google sont entraînés pour détecter l’écriture générée par l’IA. Des éléments comme une écriture policée mais répétitive et dépourvue d’émotion, la grammaire, la structure et la syntaxe, ainsi que la prise en compte du contexte aident le moteur de recherche à l’identifier. Même si l’écriture générée par l’IA est détectable, Google ne la pénalise pas tant qu’elle tient compte de l’intérêt de l’utilisateur.  

L’IA peut-elle être indétectable ?

Des outils, tels que BlogAssistant.co ou Jasper, existent pour rendre l’écriture générée par l’IA indétectable. Cependant, cette notion est à nuancer. L’indétectabilité de l’IA ne peut être obtenue que par des outils plus avancés que les détecteurs eux-mêmes. C’est une course technologique contre la montre, et l’IA sera détectée dès que les traqueurs seront améliorés.

Pour ou contre  

Certains sont pour; d’autres, contre. L’utilisation de l’IA pour la rédaction des contenus est encore à la croisée des chemins. Derrière l’image pimpante d’assistant à tout faire, elle présente des imperfections qu’on ne peut pas ignorer. Et dans l’immédiat, les contenus rédigés par l’IA présentent des lacunes, comparés aux rédactions humaines, notamment :

  • L’éthique
  • Le contexte
  • L’émotion
  • Le caractère unique (non redondant)

Si vous optez pour la qualité, vous devez faire plus qu’un simple automatisme. Selon Jules Renard, “le vrai ne se distingue du faux, en littérature, que comme les fleurs naturelles des artificielles : par une espèce d’inimitable odeur.” Jusqu’à présent, les sites utilisant l’IA font l’effort de le mentionner.

Cependant, cette mesure est appliquée individuellement et ne garantit rien pour l’internaute. Même si l’odeur du faux est improbable avec l’IA, les méthodes décrites dans cet article devraient vous éloigner de tout tracas pendant un long moment.


Références :

  1. How to Check If Something Was Written by AI, Enstine Muki. Publié le 15 août 2023. Consulté le 02 janvier 2024. ↩︎
  2. How To Detect AI-Generated Articles: A Step-By-Step Guide, Originality.ai. Consulté le 02 janvier 2024. ↩︎
  3. 5 Ways to Detect Text Written by ChatGPT and Other AI Tools, PC Mag. Publié le 1er mai 2023. Consulté le 02 janvier 2024. ↩︎
  4. How To Detect AI Writing in 2023, Elegant Themes. Publié le 07 août 2023. Consulté le 02 janvier 2024. ↩︎
Partagez cet article