Comment vérifier si un contenu est rédigé par l'IA

Comment détecter un contenu rédigé par l'IA : Avantages, inconvénients et méthodes de vérification

Rapide et réputée indétectable. Si nous reconnaissons d'emblée le gain de temps obtenu par l'usage de l'IA pour la rédaction de contenu, il est pourtant possible de la détecter.

Dans cet article, vous apprendrez comment vérifier si un contenu est rédigé par un humain ou une IA. Vous découvrirez également la course contre la montre que se livrent d'un côté, les détecteurs de contenu IA et de l'autre les outils de rédaction IA pour rester invisibles.

Qu'est-ce que le contenu généré par l'IA ?

Le contenu généré par l'IA est un contenu créé par l'IA suivant les instructions reçues, encore appelées invites ou prompt¹. L'IA est capable de produire un contenu varié (texte, audio, vidéo) en quantités importantes.

Pourquoi le contenu généré par l'IA est-il important ?

Au fil des mises à jour, l'IA est capable de produire du contenu de plus en plus ressemblant à l'écriture humaine. Par conséquent, les particuliers et les entreprises de secteurs variés sont de plus en plus nombreux à l'utiliser.

Quels sont les avantages et les inconvénients du contenu généré par l'IA ?

Les avantages du contenu généré par l'IA

Des quantités infinies de texte
Un contenu vraisemblable
Une variété infinie de thèmes
L'assistance à la créativité
Le gain de temps
L'économie budgétaire
La capacité d'analyse
La précision
L'économie d'énergie physique ou cognitive
La capacité d'adaptation
Une assistance pour le contenu SEO

Pour le SEO, l'IA vous aide à créer plusieurs types de contenus, tels que :

Les meta titres et descriptions meta
Les sections, la hiérarchie et le contenu d'un blog
Les descriptions de produits ou de vidéos, etc.

Les inconvénients du contenu généré par l'IA

L'absence de références

Références inexactes
Références obsolètes
Références inappropriées
Références trop techniques
Absence de références

Les incohérences

Style décousu
Changements brusques de ton
Manque de transitions

Le défaut de contexte

Pertes de contexte dans les passages d'une certaine longueur
Inconsistance des paragraphes
“Oubli” du sujet principal lors de la rédaction

Les défaillances linguistiques

Langage trop sophistiqué
Absence d'expressions idiomatiques ou familières
Reproduction artificielle du langage humain

Comment vérifier si un contenu est rédigé par un humain ou une IA ?

Détecter le contenu généré par l'IA peut sembler difficile. Cependant, avec du bon sens et de l'observation, vous pouvez identifier les signes techniques qui la trahissent.

Quels sont les antécédents de l'auteur ?

Impossible de vous décider ? Le texte est trop bien écrit et vous ne savez pas quoi penser ? Dans ce cas, tournez-vous vers l'auteur de l'article.

Qui est-il ?
Où a-t-il travaillé auparavant ?
Quels sont ses travaux passés ?
Travaille-t-il en équipe ?

Cet exercice est d'autant plus important que des auteurs eux-mêmes générés par l'IA existent désormais. Si rien ne cloche à ce niveau-là, croisez ce critère avec d'autres pour être assuré de l'authenticité de l'article².

Que racontent les faits ?

L'IA rédige globalement. Les mises à jour sont périodiques, aussi le contenu doit être assez logique et sans trop de détails pour rester vraisemblable. Un contenu peut être généré par l'IA si vous observez :

Des incohérences, y compris dans les statistiques
L'absence de chiffres
L'imprécision dans la description des faits
L'âge dépassé des informations rapportées

c'est que ce texte est probablement rédigé par une IA.

Y a-t-il des répétitions inutiles ou étranges ?

L'IA a un vocabulaire limité, par sa base de données d'une part, et par son besoin de simplifier l'information transmise d'autre part. Cela se reflète dans les textes rédigés par l'IA qui sont souvent redondants ou utilisent les mêmes expressions pour plusieurs situations distinctes. Autrement dit, l'IA reproduit des modèles de langage. Par conséquent, vous pouvez démasquer l'utilisation de l'IA pour la rédaction d'un texte grâce à sa structure.

Le contenu est-il dénué d'émotion ?

Surtout à leur lancement, les IA étaient incapables de reproduire l'émotion humaine lors de la rédaction des textes. Ce qu'il faut rechercher dans l'écriture :

L'absence des mots et expressions émotionnels
Le manque de personnalité
Une description factuelle, sans émotion

Cependant, avec l'évolution récente des chatbots, il est important de croiser le facteur “émotion” avec d'autres critères pour déterminer l'origine d'un contenu.

Le texte est-il cohérent ?

Le contenu généré par l'IA présente souvent des incohérences :

La ponctuation
Trop formel
Fautes grammaticales
Rigidité ou absence de transitions entre les parties du texte

Si vous êtes en face d'un texte qui va du coq à l'âne, il est probablement généré par l'IA (ou bien rédigé par un enfant !)

Les autres éléments à considérer

Un contenu générique ou fade
Les hallucinations de l'IA
L'absence d'émotion et d'anecdotes
Contenu dupliqué plusieurs fois sur internet
Sources absentes
La vérification des métadonnées
L'absence de ton
Contenu reproduit mot à mot par une IA à l'aide de prompt, etc.

L'IA est limitée. Pour prévenir les erreurs, il est généralement recommandé d'affiner au maximum vos invites, de mixer le contenu humain au travail fourni et de retravailler vos contenus.

Si vous êtes pressé ou devez contrôler une quantité importante de texte, des outils spécifiques peuvent vous aider à identifier le contenu généré par l'IA.

Quels outils de détection ?

Quelques outils pour rendre l'écriture générée par l'IA indétectable

Jasper

L'outil Jasper utilise l'IA et la PNL avancées pour échapper à la détection de contenu IA. Pour y parvenir, Jasper va intervenir sur plusieurs points, en particulier :

L'intégration du SEO (Surfer SEO)
L'amélioration de la grammaire, de l'engagement et du style
La détection du plagiat
La réécriture de contenu

BlogAssistant.co

BlogAssistant.co prétend faire mieux que de modifier un contenu généré par l'IA pour le rendre indétectable. Alimenté par GPT-3, il rédige du texte IA indétectable par les outils actuels. BlogAssistant.co fournit plusieurs services, tels que :

La génération de mots-clés
La création rapide de blogs optimisés SEO
Du texte
La personnalisation de la longueur des articles rédigés

BlogAssistant.co écorche si bien l'éthique que nous ignorons encore s'il pourra subsister longtemps dans le paysage de l'IA, déjà en proie à des protestations. De nombreuses initiatives sont en cours pour éliminer tout risque de plagiat.

Quelques outils pour détecter efficacement l'écriture générée par l'IA

ZeroGPT

Ouvert à tous les utilisateurs
Facile à utiliser
Adossé sur la technologie propriétaire DeepAnalyse, formée à l'aide de 10 millions d'entrées textuelles
Il suffit de coller votre texte puis attendre
Les résultats sont facilement compréhensibles
Taux d'exactitude de 98%
Outil gratuit

Originality.AI

Adapté pour les éditeurs de contenu
Fournit une extension Chrome
Efficace pour plusieurs formats de contenu : les sites internet, les emails et les fichiers
Orienté business, déconseillé pour les milieux d'apprentissage
Efficace à 96% globalement
Efficace à 83% sur ChatGPT
Efficace à 94,5% sur GPT-4
Outil facturé automatiquement : un centime de dollars US pour 100 mots

AI Text Classifier

Nécessite un échantillon de 1000 caractères au minimum
Moins efficace en-dehors de l'anglais
Moins performant pour l'écriture enfantine
Ses critères d'évaluation : Très probable, probable ou peu probable (qu'un texte soit rédigé par une IA)
Créé par OpenAI pour ChatGPT³
Peut se tromper, inversant l'écriture générée par l'IA et l'écriture humaine
Peut se tromper si le texte généré est modifié efficacement
Outil approximatif : distingue l'écriture IA sans trancher clairement
Outil gratuit

GPTZero

Vérifie la perplexité : complexité du langage et des idées
Contrôle l'uniformité de la longueur des phrases
Détecte les rafales ou problèmes de rédaction
Efficace dès une seule phrase (250 caractères minimum)
Évalue jusqu'à 3 fichiers par téléchargement groupé et 5000 caractères par document
Plus précis au fur et à mesure qu'il évalue les contenus
Peut se tromper, inversant l'écriture générée par l'IA et l'écriture humaine
Accessible sur GPTZero.me
Développé par un Edward Tsai, de Princeton
Outil gratuit
Outil payant GPTZero Educator, disponible à 9,99$ par mois, mieux adapté aux besoins d'évaluation des enseignants

Writer AI Content Detector

Efficace jusqu'à 1500 caractères
Fournit un pourcentage de détection de contenu
Il suffit de coller une URL dans l'espace choisi puis d'attendre
Créé par Writer
Possibilité de détection sur de grands volumes de texte après entente, pour les utilisateurs du plan d'entreprise Writer
Outil gratuit

Les autres outils de détection du contenu généré par l'IA

Winston AI
Scribbr
Copyleaks
Turnitln

Bon à savoir : Les outils de détection de contenu généré par l'IA semblent utiliser une formule inversée. Autrement dit, ils recherchent l'écriture humaine puis en déduisent le ratio d'écriture générée par l'IA. Leur efficacité est variable⁴ non prioritaire], le plus faible étant AI Text Classifier l'outil natif de OpenAI. Avec un taux de précision de 99%, Copyleaks et Winston AI trônent parmi les plus performants.

Les questions fréquentes sur le sujet

Pourquoi a-t-on besoin de l'écriture générée par l'IA ?

L'écriture générée par l'IA a plusieurs avantages. Elle s'appuie sur une vaste bibliothèque de données, à laquelle l'auteur lui-même n'a probablement pas accès. Elle est intuitive et rapide. Enfin, l'IA corrige la grammaire et l'orthographe pour un texte contextualisé. Cependant, l'IA génère souvent des textes redondants qu'il convient de corriger avant leur publication.

Qu'est-ce qui est reproché à l'écriture générée par l'IA ?

Le reproche est principalement éthique. L'IA puise dans sa base de données d'entraînement pour rédiger. Les bots d'entraînement de l'IA extraient les informations disponibles sur internet sans le consentement des utilisateurs, ce qui est constitutif de plagiat et puni par la loi. Pour l'exemple, OpenAI a dû se confronter à une contestation massive des créateurs et des auteurs et plusieurs procès.

Comment Google peut-il détecter l'écriture générée par l'IA ?

Les algorithmes de Google sont entraînés pour détecter l'écriture générée par l'IA. Des éléments comme une écriture policée mais répétitive et dépourvue d'émotion, la grammaire, la structure et la syntaxe, ainsi que la prise en compte du contexte aident le moteur de recherche à l'identifier. Même si l'écriture générée par l'IA est détectable, Google ne la pénalise pas tant qu'elle tient compte de l'intérêt de l'utilisateur.

L'IA peut-elle être indétectable ?

Des outils, tels que BlogAssistant.co ou Jasper, existent pour rendre l'écriture générée par l'IA indétectable. Cependant, cette notion est à nuancer. L'indétectabilité de l'IA ne peut être obtenue que par des outils plus avancés que les détecteurs eux-mêmes. C'est une course technologique contre la montre, et l'IA sera détectée dès que les traqueurs seront améliorés.

Pour ou contre

Certains sont pour; d'autres, contre. L'utilisation de l'IA pour la rédaction des contenus est encore à la croisée des chemins. Derrière l'image pimpante d'assistant à tout faire, elle présente des imperfections qu'on ne peut pas ignorer. Et dans l'immédiat, les contenus rédigés par l'IA présentent des lacunes, comparés aux rédactions humaines, notamment :

L'éthique
Le contexte
L'émotion
Le caractère unique (non redondant)

Si vous optez pour la qualité, vous devez faire plus qu'un simple automatisme. Selon Jules Renard, “le vrai ne se distingue du faux, en littérature, que comme les fleurs naturelles des artificielles : par une espèce d'inimitable odeur.” Jusqu'à présent, les sites utilisant l'IA font l'effort de le mentionner.

Cependant, cette mesure est appliquée individuellement et ne garantit rien pour l'internaute. Même si l'odeur du faux est improbable avec l'IA, les méthodes décrites dans cet article devraient vous éloigner de tout tracas pendant un long moment.

Références :

How to Check If Something Was Written by AI, Enstine Muki. Publié le 15 août 2023. Consulté le 02 janvier 2024. ↩︎
How To Detect AI-Generated Articles: A Step-By-Step Guide, Originality.ai. Consulté le 02 janvier 2024. ↩︎
5 Ways to Detect Text Written by ChatGPT and Other AI Tools, PC Mag. Publié le 1er mai 2023. Consulté le 02 janvier 2024. ↩︎
How To Detect AI Writing in 2023, Elegant Themes. Publié le 07 août 2023. Consulté le 02 janvier 2024. ↩︎