Le volet suivant des analyses sur theses.fr porte sur l’exploitation des titres et résumés présents dans la base de données afin d’en tirer des enseignements sur le fonctionnement des recherches doctorales. Les termes mobilisés dans un titre ou un résumé sont susceptibles de nous renseigner quant à la nature des notions qui sont travaillées dans un manuscrit. On pourra ainsi suivre la vitesse à laquelle un objet de recherche se popularise et identifier les institutions en pointe sur le sujet.
Il faut néanmoins nuancer cette affirmation en précisant qu’un.e doctorant.e peut effectuer des choix de rédaction qui amènent à expurger les techniques mobilisées du résumé de la thèse, pour ne les aborder que dans le corps du manuscrit. Auquel cas l’exploitation desdits manuscrits représente la seule approche viable pour un suivi fin de la diffusion d’une méthode ou d’une notion au sein de la communauté scientifique. Il convient néanmoins de garder à l’esprit que plusieurs termes peuvent être mobilisés pour désigner la même notion, selon les communautés scientifiques dans lesquelles ils sont utilisés, et que l’inverse est tout aussi vrai. Nous sommes partis du principe que ceci était tout particulièrement valable pour les disciplines relevant des sciences humaines et sociales. La polysémie est a priori moins marquée pour désigner des techniques ou une thématique de biologie moléculaire, par exemple. C’est ce raisonnement qui nous a amené à identifier une liste de mots-clés en biologie dont nous avons suivi la présence dans les résumés de thèse. Dans la figure suivante, plutôt que de représenter l’année d’apparition, nous prenons comme point de départ l’année de première apparition dans un résumé de thèse. Pour certains mots-clés, le nombre de thèses qui y sont consacrées croît de manière particulièrement rapide, tandis que pour d’autres, l’inverse semble se produire.
Pour nous amuser un peu, nous avons étendu l’analyse hors du seul périmètre de theses.fr, en téléchargeant les métadonnées de tous les documents présents dans l’archive généraliste HAL, et qui relevaient de la biologie. Ainsi, nous pouvons suivre la nature des documents dans lesquels un concept donné se retrouve : rapports, articles de conférence, articles de recherche dans des revues, recherches doctorales, chapitres d’ouvrage, etc. Cette démarche permet de suivre, d’une certaines manière, les trajectoires qu’emprunte un terme (et donc les notions, méthodes, etc. qui l’accompagne) à travers différents types de supports, qui constituent différents indices de la maturité de son développement au sein d’une communauté scientifique. On pourra par exemple identifier différentes phases, l’utilisation du terme dans des ouvrages spécialisés ou dans des chapitres dédiés intervenant probablement dans les dernières phases. Des différences seront probablement observées entre sciences humaines et sociales et sciences dures, qui n’entretiennent pas le même rapport aux livres et aux articles de recherche.