L'utilisation de l'intelligence artificielle est perçue aujourd'hui par un grand nombre d'étudiants comme une solution de facilité pour rédiger un devoir, ou pire, un mémoire. C'est un fait, la sensibilisation à son usage est en plein essor au sein des établissements scolaires et universitaires. Mais un autre problème est son émergence dans de nombreuses sources en ligne. Sans avoir recours à l'IA, on peut donc se retrouver à citer des idées ... de l'IA. Comment faire à l'heure actuelle pour éviter cela et vérifier le caractère humain de ses sources ?

Pourquoi chercher à reconnaître un texte rédigé par IA ?
La fiabilité des sources est un sujet abordé dès le lycée et évalué tout au long de votre cursus. Croiser les sources, vérifier l’identité de l’auteur, savoir dans quel contexte le texte a été écrit : ce sont autant de tâches qui peuvent vous paraître fastidieuses. Pour autant, avec l’essor de l’IA, cela est devenu encore plus important. Avant même de lire une source, il est primordial d’en vérifier l’authenticité. Une IA aurait en effet bien moins de légitimité qu’un véritable chercheur spécialiste du sujet, ce qui risquerait de vous faire perdre du temps en lisant un document peu pertinent.
En utilisant un texte rédigé par IA, vous vous exposez également à un risque de plagiat. Si le texte n’est pas détecté comme tel, puisque reformulé et donc difficilement assimilable au texte d’origine par les détecteurs anti-plagiat, il ne citera pas pour autant la multitude de sources utilisées, posant un sérieux problème de propriété intellectuelle.
Ces deux problèmes majeurs font qu’il est important de savoir si un texte a été rédigé par une IA afin de déterminer si vous pouvez ou non l’utiliser comme source fiable, cela afin de garantir l’intégrité académique de vos productions.
Comment fonctionne l’IA générative ?
Avant de savoir détecter un texte généré par une IA, il est indispensable de comprendre son fonctionnement. Comment fonctionne une IA générative ?
L'IA générative fonctionne grâce à des modèles d'apprentissage automatique (ou machine learning) qui utilisent les données issues d’une multitude de sources sur le web (contenus accessibles en ligne, tels que les pages web, les articles d'actualité, les blogs, les forums, etc.), mais aussi des échanges qu’elle opère avec ses utilisateurs et ses formateurs. L’IA a été entrainée afin de formuler des phrases à la syntaxe et orthographe parfaites, mais elle reste un algorithme qui assemble des mots sans en comprendre la réelle signification. Et cela est important à comprendre, car c’est cette faiblesse qui va rendre notre identification de ses écrits possible !
Comment détecter un texte rédigé par IA en le lisant ?
Tous les textes rédigés par une IA présentent des similitudes qui permettent de les identifier à l’œil nu.
Un texte rédigé par IA présente en effet une écriture plate. Cela se manifeste par un rythme toujours identique, un vocabulaire simple et une rédaction neutre sans prise de position. Aucune erreur de syntaxe ne sera certes présente, mais le texte laissera une impression d’absence de relief.
Cet aspect peut être renforcé par des répétitions. Le vocabulaire utilisé est répétitif, et les formulations sont souvent les mêmes. L’IA a en effet des tics de langage identifiables, avec certains mots et expressions qui reviennent régulièrement : crucial, primordial, impact, mettre en lumière, etc., n’en sont que quelques exemples. Les doubles adjectifs et les formules de type « non seulement … mais » sont aussi fortement plébiscités par l’IA.
Sur le fond, un texte généré par IA affichera un contenu générique avec de longues phrases générales, sans profondeur ni analyse. Le texte de fait pas de hors sujet, mais il présente peu d’intérêt. L’algorithme reprend les idées les plus fréquentes, ce qui se traduit par une absence de mise en opposition et d’avis divergents et minoritaires. Par ailleurs, si vous voyez plusieurs phrases qui répètent la même idée sans rien apporter de plus, cela est surement l’oeuvre d’une IA. Le texte est aussi souvent dépourvu d’exemples concrets et de références réelles.
L’IA est en effet soumise à de récurrentes incohérences. Cela se traduit par des contradictions au sein même de ses propos et par des hallucinations. Ces erreurs peuvent notamment se retrouver dans les références, avec des références partiellement ou totalement inventées : il vous faudra donc vérifier si vous retrouvez la source exacte et si toutes les informations (nom de l’auteur, date, titre, etc.) sont exactes. Par ailleurs, un "auteur" qui aurait demandé une bibliographie à une IA et simplement copié-collé peut aussi afficher une fâcheuse tendance à inclure, après chaque référence, le prétendu apport de cette référence au sujet.
Pour finir, un texte qui aurait été simplement copié-collé d’une IA peut se détecter dans sa mise en page, avec notamment des successions d’idées rédigées sous la forme de puces.
Quels outils aident à détecter la présence de textes rédigés par IA ?
Si un algorithme pour former des phrases peut exister, un autre pour les détecter le peut tout autant ! Cependant, les IA génératives ont eu un temps d’avance sur les détecteurs anti-IA qui ont dû se mettre dans une course effrénée pour se développer en s’entrainant à détecter le style d’écriture de l’IA et proposer des services performants aux utilisateurs. Aujourd’hui, plusieurs détecteurs anti-IA sont disponibles en ligne, certains sont gratuits et d’autres payants. Malheureusement, leur fiabilité est souvent remise en question, avec de fréquents faux-positifs et des textes rédigés par IA qui ne sont pas détectés. Les logiciels gratuits semblent malheureusement moins fiables, car le développement et le maintien à jour des algorithmes représentent un coût certain.
FAQ
Un texte généré par IA, puis modifié par un humain, reste-t-il détectable ?
La détection est plus difficile, car bon nombre d’indices sont effacés. La forme sera affectée donc pas forcément détectée, notamment par les algorithmes, mais si le fond reste le même, la qualité du document n’en sera pas meilleure et cela restera visible pour les yeux les plus aguerris.
Peut-on quand même utiliser l’IA ?
Oui, vous pouvez, par exemple, l’utiliser comme outil de brainstorming, mais il vous faudra vous approprier les idées en les formulant à votre manière et en les enrichissant de vos propres réflexions et expériences.
Que faire si j’ai utilisé une source qui s’avère être de l’IA ?
Nous vous conseillons de la retirer de votre bibliographie et de reprendre les passages où vous les avez utilisés en cherchant de nouvelles sources fiables à partir des mots clés utilisés ; cela évitera tout risque de plagiat et vous permettra même peut-être d’enrichir votre production.
Comment faire si j’ai un doute sur une source ?
Vérifiez bien le style d’écriture et les références bibliographiques, ce sont les indices les plus faciles à repérer et les plus révélateurs. Si un doute persiste, il vaut mieux s’abstenir de l’utiliser.
Puis-je être pénalisé(e) si j’utilise une source qui a été rédigée par une IA ?
Si cela est involontaire, il n’y a presque aucune chance pour que vous soyez sanctionné. Mais si vous rédigez une revue de littérature et que l’authenticité de vos sources compte dans votre notation, et que plusieurs de vos sources sont issues d’une IA, alors cela pourrait effectivement avoir un impact sur votre note.