Le discernement, nouvelle donne dans l’enseignement de la recherche d’information

Dans un des avis du Conseil Economique, Social et Environnemental des Editions des Journaux officiels de janvier 2015 on peut retrouver celui portant sur les données numériques.

Il a comme angle d’attaque les données comme un enjeu d’éducation et de citoyenneté. Le numérique a impacté notre société dans notre vie quotidienne et dans les domaines de notre vie (Éducation,démocratie, prévention, santé, …)

Il faut aussi mesurer les opportunités et les risques induits dans nos vies comme le précise Eric Peres, auteur du rapport et secrétaire général de FO Cadres. (Il siège au CESE à la section de l’éducation, de la culture et de la communication) car le traitement de ces données numériques sont au coeur des transformations économiques et sociales.

Le Big Data que l’on traduit généralement par une exploitation de très grands volumes de données n’en est en fait qu’à ses débuts.

En effet,  l’UIT (Union Internationale des Télécommunications), une institution spécialisée des Nations Unies pour les technologies de l’information et de la communication (TIC), a publié des statistiques qui confirment l’adoption grandissante des TIC au courant des 15 dernières années, ouvrant alors la voie à de vastes perspectives pour le développement socio-économique. L’UIT avance ainsi qu’aujourd’hui plus de 7 milliards d’abonnements mobiles dans le monde ont été recensé, contre seulement 738 millions en l’an 2000.

Le nombre d’internautes quant à lui s’établit à 3,2 milliards dont 2 milliards qui vivent dans des pays en développement. Citoyens, entreprises participent aujourd’hui à cette mouvance qui va nécessiter de nouveaux espaces de recherche et de partage ainsi que de nouvelles compétences dans le monde de la recherche de l’information pertinente et du discernement, sûrement clé de voûte du Big Data (1).

Quant aux données générées par ces échanges et diverses manipulations et réécritures, l’humanité produirait autant d’informations en deux jours qu’elle ne l’a fait en deux millions d’années.

Des octets aux mégaoctets qui ont signalé l’émergence de données numériques extratextuelles et les gigaoctets témoignant du tournant du millénaire comme le précise Eric Sadin, il faut maintenant compter sur le téraoctet qui caractériserait notre période actuelle.

Pétaoctets sont aussi entreposés maintenant dans des fermes de données qui dépassent l’entendement humain.

L’exaoctet ou un milliard de gigaoctets est plus axé sur les volumes globaux administrés par de grandes entités comme le CERN devancé par le Zétaoctet, mesure astronomique plus destiné à circonscrire le volume de données de toute la planète. (3 zettaoctets auraient été produits en 2014)

internet in real time

L’Internet en temps réel à lui seul révèle l’évolution des données massives

Source : http://pennystocks.la/internet-in-real-time/ 

Les révélations de Snowden, les derniers évènements de janvier 2015 ont mis en avant une société d’hypersurveillance que je qualifierai aujourd’hui même de « Cyveillance » où il nous faudra apprendre à être tracés, exposés. Le projet de loi pour renforcer le renseignement nous aussi nous interpeller car il en va par exemple des risques en matière d’atteintes à la vie privée.

J’évoquais déjà en 2008 (2) dans un ouvrage la nécessité d’une culture informationnelle et la nécessaire modélisation des connaissances comme une urgence pour notre éducation au XXIème siècle.

Plus tôt, il y a 10 ans,  j’insistais aussi sur la nécessité de passer des TIC aux TIC. C’est à dire des Technologies de l’Information et de la Communication aux Technologies de l’Intelligence pour la Connaissance.

Tout juste membre de la Réserve Citoyenne de l’Education Nationale pour évoquer, présenter et mettre en garde nos jeunes sur les cyber-risques sur la toile, il me parait utile ici d’évoquer à nouveau les concepts qui gravitent autour de la donnée comme l’information, le document, la connaissance afin que chacun puisse mesurer à son niveau ce  que pourraient être demain les impacts de nos (méta)données sur nos vies devenues numériques voire algorithmiques. En effet, les développements des Sciences de l’Information et de la Communication, section à laquelle je suis rattaché pour mon domaine de recherche auront pleinement à participer au projet de rationalisation de nos sociétés.

Quelques rappels sur les différents concepts autour de la donnée

  • La donnée est le plus petit élément d’information, résultat d’une mesure brute et ponctuelle qui ne porte généralement pas d’information
  • La connaissance est un ensemble structuré d’informations fondé sur le raisonnement et susceptible de vérification. Les connaissances sont au sommet de la pyramide informationnelle
  • L’information est un ensemble cohérent de données reliées entre elles et permettant de créer un cadre global d’analyse
  • Il est donc un intermédiaire entre le document et l’information qui est la donnée.
  • Le Big Data est un ensemble volumineux de données difficiles à traiter avec les outils classiques de gestion de bases de données car les fonctions classiques d’un système d’information qui consistent à capturer, stocker, rechercher, partager, analyser et visualiser les données et ne sont plus adaptées. En revanche, le traitement de ces données massives offre des perspectives (corrélations inédites entre différentes données).
  • L’Open Data correspond aux données numériques mises à disposition par les institutions publiques ou d’origine privée (une collectivité) selon une méthodologie et une licence ouverte garantissant leur libre accès et leur réutilisation par tous, sans restriction technique, juridique ou financière. L’information publique est considérée comme un bien commun dont la diffusion est d’intérêt général.

La donnée n’est pas donnée

La « donnée » est devenue une valeur centrale de nos sociétés : manipulée à l’origine dans des « bases de données » où elle était cantonnée, elle a pris son autonomie et suscité des exploitations nouvelles, qu’il s’agisse de « données ouvertes » (open data) ou de « données massives » (Big data).

On parle même aujourd’hui de Lacs de données, véritables référentiels où les données sont conservées dans leur forme native avant d’être interrogées.

Un lac de données est un vaste référentiel où les données sont conservées dans leur forme native en attente d’être interrogées. L’implémentation d’un lac de données sous-tend les systèmes de Business Intelligence en temps réel, les efforts d’amélioration de l’expérience client, et l’accélération de la croissance et de la performance de l’activité. Selon le Gartner, « En 2020, on se servira de l’information pour réinventer 80% des processus métier et des produits de la décennie précédente, les digitaliser ou les éliminer ». Contrairement aux solutions de stockage traditionnelles où les données sont hébergées en silos, dans les lacs de données, tous les octets d’information sont conservés au même endroit, sous forme de données brutes, en prévision d’intégrations ou d’analyses (3).
data lakes
Nos jeunes trop habitués à la recherche sur Google risquent de ne pas discerner le grain de l’ivraie dans cette progression fulgurante du stockage des données. Le risque demeure aussi qu’ils se contentent(et c’est déjà fait) de ne chercher qu’à un endroit là où d’autres maîtriseront  la fouille de données dans les cimetières de pages Web voire encore dans le Web abyssal.
Faire preuve de discernement aujourd’hui c’est donc sortir des chantiers battus de Google !
Vers l’Infonomics, nouvelle Science de la donnée
Savoir collecter, analyser en temps réel, détecter des corrélationscorrèlations significatives et interpréter de manière automatique des phénomènes, voilà ce qui nous attend presque tous. Ces compétences sont à la base de l’Infonomics, nouvelle théorie et discipline émergente fournissant aux organisations une fondation et des méthodes pour quantifier les informations, valeur de l’actif et des pratiques formelles de gestion d’actifs d’information.
Le terme anglais « Infonomics », néologisme inventé par Gartner, issu de la contraction d’information et d’économie, considère les données de l’entreprise comme un actif et non comme une fin en soi. Le concept vise à offrir aux entreprises les moyens pour valoriser leurs données et les gérer comme un véritable actif, à l’aide de principes et de pratiques économiques et de gestion des ressources.
Nos vies comme je le signalais précédemment sont devenues numériques voire même algorithmiques et la capacité à acquérir et à traiter les données sur des comportements individuels et collectifs, les difficultés à saisir dans leur étendue les interactions sociales, l’action et les activités individuelles et collectives, sont autant de verrous puissants dans le développement de cette nouvelle science des données qu’il faudra aussi forcer.Toutes les données stockées par les entreprises ou les Etats représentent des informations stratégiques que seuls de puissants algorithmes peuvent croiser, décortiquer, utiliser jusqu’à prendre la posture d’un cerveau humain ?
Il nous appartiendra également de prendre garde de nos attitudes sur la toile et dans nos actes numériques car l’on peut déjà prédire nos comportements rien qu’en laissant parler nos données.Il en est de même de la quasi-absence de moyens d’analyse automatique et systématique de documents textuels (archives, textes publiés, entretiens, etc.), sonore (entretiens, documents radiophoniques, scènes, etc.) ou de données iconographiques (images, vidéo, films, etc.).Leurs développements bien que balbutiant (notamment dans le domaine du texte et des analyses sémantiques) ouvrent déjà des perspectives inédites de traitement des données acquises dans les processus d’enquête.

C’est probablement vers une quantification intégrale de nos vies que nous nous dirigeons avec l’exploitation de nos données.

(1) Big Data, Pierre Delort, Éditions PUF, collection Que sais-je ?, 2015
(2) Modélisation et construction des mondes de connaissances : Aspects constructivste, socioconstructiviste, cognitiviste et systémique. (ISBN 978-7637-8755-8) les Presses Universitaires de Laval au Québec (Collection Laboratoire de communautique appliquée dirigée par Pierre-Léonard Harvey).

(3)  http://www.journaldunet.com/solutions/expert/60943/les-lacs-de-donnees—tremplin-pour-l-innovation.shtml

 

 

Be Sociable, Share!

Commentaires fermés sur Le discernement, nouvelle donne dans l’enseignement de la recherche d’information

Filed under Big Data, Non classé

Comments are closed.