
Lexique et définitions du Big Data et du numérique
Le thème « Le numérique » du concours commun des Instituts d’Etudes Politiques 2019 va vous amener à vous questionner sur de nombreuses innovations et techniques qui font les gros titres de l’actualité (scandale de Cambridge Analytica par exemple). Parmi celles-ci, je vous propose de passer en revue un certain nombre de termes en lien avec le BIg Data.

Le Big Data
La traduction du terme Big Data est « Grosses Données ». Il n’existe pas à ce jour de définition officielle du Big Data. La commission générale de terminologie et de néologie a néanmoins proposé une définition. Celle-ci est : « données structurées ou non dont le très grand volume requiert des outils d’analyse adapté ». Au delà des données, lorsqu’on parle de Big Data, on évoque les algorithmes et les modèles créés à partir de celles ci.
Le Data Mining
Ce terme est moins connu que le terme de « Big Data ». Il s’agit de l’analyse tirée des Big data, à savoir le fait de transformer les données en informations, en modèles utiles via le croisement et l’analyse des données. Les big data sont donc la source, la matière première du data mining.
Le Deep learning
Si on traduit littéralement ce terme, on obtient l’ « apprentissage profond ». Il regroupe les dispositifs, méthodes et algorithmes d’apprentissage automatique. Autrement dit, un modèle ou algorithme est conçu pour s’améliorer de lui même en fonction des résultats et des cas d’usage qu’il rencontre. Par exemple, des programmes de reconnaissance d’images (identification des visages sur des photos) deviennent de plus en plus précis au fur et à mesure qu’ils analysent et identifient des images. Ces technologies sont utilisés dans de nombreux domaines, y compris l’intelligence artificielle.
L’IOT (« Internet of Things »)
L’internet des objets consiste en un réseau d’objets connectés capable d’acquérir et d’échanger des données au sein d’un ecosystème. On peut citer les capteurs, boitiers, caméras, bracelets connectés etc. Ce marché est en constant développement poussé le faible prix des capteurs, l’augmentation de la puissance internet etc. Il pose néanmoins de nombreux obstacles et questions (notamment la sécurité, l’utilisation des données, mais aussi la préservation de la vie privée).
Les Dark Data
Les dark data sont des données qui sont stockées par un grand nombre d’acteurs (entreprises, organisations…) , mais qui ne sont pas utilisées dans un but précis ou ne sont pas utiles. Les organisations ont tendance à les stocker pour les revendre, les utiliser éventuellement dans le futur etc. Elles sont un problème important notamment pour la préservation du secret et de la vie privée.
Y-a-t-il d’autres thèmes que vous souhaitez voir définir? Laissez moi vos questions en commentaires.








Les deux thèmes au programme de l’épreuve de questions contemporaines du concours commun des Instituts d’Études Politiques sont « le secret » et « le numérique« . Je vous propose de faire dans cet article un tour d’horizon de 5 erreurs à éviter dans votre dissertation sur le thème « le numérique ».
1) Erreur n°1 : Ne pas évoquer les aspects techniques de la « révolution » numérique.
Le niveau d’exigence du concours des Instituts d’Études Politiques demande aux candidats d’apporter une réflexion détaillée et en profondeur sur le thème abordé. La difficulté du thème « Le numérique » réside dans le fait qu’il est sujet à de nombreuses évolutions techniques très récentes et qui n’ont pas encore toutes été documentées par l’ensemble des disciplines académiques.
Sur ce thème, il sera donc nécessaire de détailler les principales innovations technologiques liées au numérique, en expliquant d’une part, leur fonctionnement de manière synthétique, et d’autre part les impacts concrets et réels qu’elles peuvent avoir.
Je vous conseille de préparer des fiches résumant ces deux aspects (expliquer la technologie en détail, et les impacts qu’elle engendre). Voici quelques exemples de fiches à réaliser :
le Big Data, l’intelligence artificielle (ou plutôt les intelligences artificielles), le deep learning, l’internet des objets et les objets connectés, le Cloud etc.
Si vous ne le faites pas, le jury risque de penser que vous réalisez une dissertation généraliste, portant sur les objets que vous n’avez pas vraiment étudié.
2) Erreur n°2 : Se focaliser uniquement sur les aspects techniques.
Un risque important du thème « Le numérique » concerne le fait de se focaliser exclusivement sur les innovations techniques et technologiques. Il convient de garder à l’esprit que l’épreuve du concours commun est une épreuve de questions contemporaines et non pas une épreuve de spécialité. Il est donc au moins aussi important de remettre les innovations techniques du numérique dans les grands enjeux et débats de société, que de se focaliser sur l’innovation étudiée en elle-même.
Pour faire clair, le jury du concours ne vous proposera pas un sujet sur le fonctionnement du Big Data. En revanche, il peut être amené à vous proposer un sujet qui devrait (si vous l’avez analysé correctement) vous amener à développer des réflexions sur notre liberté (de choix, de pensée…) à l’heure où des technologies (dont le big data) peuvent modéliser et prédire nos choix ou nos comportements.
La difficulté de l’épreuve provient du fait qu’il faut trouver le bon niveau de maille entre d’une part le fait de montrer au jury que vous maitrisez le fonctionnement des technologies et innovations du numérique (sans pour autant l’assommer de détails), et d’autre part le fait de montrer que vous savez replacer les impacts et enjeux dans une vision plus macro (les grands débats politiques et de société).
3) Erreur n°3 : avoir une vision manichéenne des évolutions engendrées par le numérique.
Le thème du numérique est sujet à de nombreux articles journalistiques, ou reportages. D’une manière générale, il vaut adopter une distance critique envers l’actualité de ce thème. On trouve en effet beaucoup d’articles pointant les dangers du numérique (je vous invite à faire une recherche Google sur les dangers du numérique par exemple). On en trouve également beaucoup sur les innovations technologiques et ce qu’elles apportent (en particulier de la part de fan, et d’entreprises « spécialisées » dans le numérique).
Je vous déconseille fortement d’exprimer un seul de ces points de vue dans votre copie le jour du concours. Vous risqueriez d’être fortement pénalisé (et à juste titre) par votre correcteur. On attends en effet du candidat qu’il prenne de la hauteur par rapport aux débats de la presse et de l’actualité, et qu’il puisse synthétiser différentes visions ou point du vue pour éventuellement développer une opinion propre.
Je vous conseille également de ne pas vous inspirer de ce clivage pour réaliser votre plan. C’est en effet le type de plan à éviter fortement puisque beaucoup de candidats, spécialement les candidats les moins bien préparés, utiliseront un plan de ce type, même s’il n’est pas adapté au sujet. Si vous souhaitez des conseils sur le plan Sciences Po, je vous recommande de lire mon article traitant de ce sujet.
4) Erreur n°4 : ne pas replacer les débats liés au numérique aux grands enjeux humains (éthiques, sociaux, économiques, philosophique ou politiques…)
L’épreuve de questions contemporaines n’est pas une épreuve d’actualité pure ou de spécialité. Un bon candidat devra être en capacité d’allier plusieurs qualités :
Les enjeux du thème du numérique sont à mon sens de plusieurs ordres :
5) Erreur n°5 : oublier l’actualité du thème du numérique.
J’ai répété plusieurs fois dans cet article qu’il faut se détacher de l’actualité, et surtout de ses débats polémiques. Il ne faut néanmoins pas l’occulter totalement. En effet, le thème du numérique étant relativement récent, il suscite des actualités importantes à prendre en compte. On peut citer par exemple la mise en place du Règlement Général sur la Protection des Données (RGPD) en mai dernier.
L’actualité est également un bon moyen de fournir des exemples illustrant certaines de vos idées et arguments. Si vous discutez par exemple de l’impact du numérique sur la valeur de l’égalité dans nos société, vous pouvez évoquer les débats d’actualité sur la neutralité du net aux USA.
Une caractéristique importante du thème du numérique, et qui peut vous permettre de sortir d’une réflexion articulée uniquement sur les aspects positifs vs les aspects négatifs du numérique, est également le sujet de la réglementation de la sphère du numérique. Le numérique (ses acteurs, ses technologies etc.) se sont développés en grande partie en dehors (voire en rejet) des lois et règlements, ce qui est à la source de nombreux des dangers du numérique.