Détection du plagiat : la beauté des évolutions technologiques

Dans ce billet, j’aimerais vous parler un peu des questions de détection de plagiat, dans la lignée des derniers billets. C’est classique quand l’on rend des devoirs maison ou des examens, et un sujet relativement bien connu des universités, qui ont souvent un abonnement à Compilatio ou équivalent. C’est la beauté des devoirs numérisés : on détecte le plagiat tellement facilement, par rapport à des copies papier. Quelques mots sur le sujet …

Comment cela marche, au juste? On va calculer des similarités entre différents documents grâce à différentes techniques de fouille de données textuelles, sur lesquelles je ne vais pas épiloguer. Il y a même certains LMS (comprendre ENT) qui ne passent pas par des services spécialisés comme Compilatio, et qui passent directement par des outils en interne pour pouvoir détecter du plagiat. Dans Google Classrooms, des passages d’une copie considérés comme suspects sont surlignés. Google recherche des matchs avec ce qu’il trouve sur le web,  et met des liens vers les sites correspondants, d’où viendraient les passages. Et si la personne a utilisé des guillemets ou des citations,  finalement, ce n’est pas du plagiat, c’est une utilisation  classique de citations. Et bien cela, en l’occurrence, Google le détecte bien. Seul hic du moment, ChatGPT, qui génère du contenu « original », donc plus dur à détecter.

Soit dit en passant, il y a la stratégie des petits malins qui consiste à modifier un peu le texte copié pour tâcher de passer entre les gouttes. Google n’est absolument pas dupe, et met en gras les éléments qui ont été recopiés depuis internet tout en soulignant les tentatives de dévier un peu du texte originel. Le grand classique, c’est l’article de Wikipedia qui a été recopié et un peu changé.  Et si Google n’est pas dupe, l’instructeur non plus.  A noter qu’il y a aussi l’approche par corpus. On cherche du plagiat avec des copies des années précédentes, des étudiants d’autres promos qui n’ont pas nécessairement trop copié Internet, mais qui sont solidaires des promos suivantes. Cela existe. Cela sous-entend qu’il y a communication entre promotions d’étudiants pour faire ce travail. Intéressant. Je pense que la plupart du temps, les gens vont plutôt se concentrer sur le Web, mais sait-on jamais. Cela arrive que les sujets d’examen évoluent peu d’une année à l’autre. Dans le doute, si on peut cibler les deux types de plagiat, c’est mieux.

Dernier point : la question de la compréhension du plagiat par les apprenants. Personnellement, quand je fais un examen, je préviens les étudiants qu’il y aura de la détection de plagiat qui sera mise en place, et je fais une démonstration en direct sinon ils ne me croient pas vraiment. A mon sens, mieux vaut prévenir que guérir. Il y a tout un sujet de la démonstration du fonctionnement de ces logiciels à mettre en place avant les examens pour faire de la prévention. Bien sûr, le risque est que si on leur explique le fonctionnement des outils, ils arrivent à contourner les règles une fois qu’ils ont compris comment fonctionne l’outil. Donc à vous de déterminer si vous préférez garder secrètes vos petites techniques de détection de plagiat oour sanctionner ou, si vous préférez comme moi, à des fins de prévention, et pour ne pas vous retrouver dans la situation désagréable d’avoir à admonester des étudiants, leur montrer comment ça marche. Il y a deux écoles, j’ai l’impression.

Leave a Comment

Filed under Non classé

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *