Aller au contenu principal

Aujourd’hui, de plus en plus d’informations sont stockées dans des serveurs, via d’immenses ordinateurs connectés. Non seulement les informations que nous consignions auparavant sur du papier, mais aussi les traces de notre activité sur Internet : messages sur les réseaux sociaux, visites de sites, photographies partagées… On appelle toutes ces informations des données.

Fiche info, parue dans le Dossier de la SPME 2019

Le nombre de données créées et utilisées chaque année est de plus en plus important. On en crée sans s’en rendre compte, avec des téléphones qui comptent les pas ou quand on emprunte un vélo en libre-service. De nouveaux métiers sont apparus pour gérer toutes ces données, mais aussi pour les exploiter. On a en effet découvert qu’on pouvait apprendre beaucoup de leur étude. Ainsi, en 2008, des chercheurs ont analysé les recherches faites sur Google par un échantillon d’Américains et ont essayé de prédire quand la grippe allait arriver. Ils ont développé un algorithme, une formule informatique, grâce à laquelle ils ont pu comparer l’évolution de la grippe des années précédentes avec celle des recherches sur Google. Ils ont ainsi repéré quand les conditions semblaient identiques. Pendant plusieurs années, Google Flu Trends, le nom de l’algorithme, a permis de prévoir la grippe avant les médecins1.

Les algorithmes sont aujourd’hui présents partout. Beaucoup de décisions sont prises à partir de ces formules informatiques. Certaines permettent de découvrir le profil des internautes en fonction de leur activité en ligne, afin de leur proposer des publicités ciblées. D’autres sont utilisées par Netflix pour recommander de nouvelles séries à ses utilisateurs, adaptant même l’image de présentation à leur profil2. En France, des algorithmes développés par la gendarmerie nationale tentent de prédire où auront lieu les prochains cambriolages3 ou des vols de voitures4. Ce sont aussi des formules informatiques qui génèrent l’attribution des places dans les universités, grâce à l’application Parcoursup5.

Des algorithmes, qui apprennent des situations précédentes pour prévoir ce qui pourrait se passer, existent dans différents domaines : identification de personnes sur des photos, sur Facebook par exemple?6, ou détection de cellules malades sur des images d’IRM7.

De nombreuses découvertes ont été possibles grâce à ces immenses bases de données et à leur manipulation par des algorithmes. Ceux-ci sont souvent présentés comme une solution idéale et objective. Il faut néanmoins rester vigilant. Déjà certains algorithmes apprennent et décident à partir de situations existantes qui peuvent être biaisées. Ainsi, les algorithmes de Google proposent-ils des offres d’emploi. Mais une étude a montré que les postes les plus prestigieux étaient proposés aux hommes plutôt qu’aux femmes. Une situation logique, puisque ce sont actuellement les hommes qui occupent les fonctions d’encadrement, mais une situation de discrimination anormale, si l’on considère que tout le monde devrait avoir un accès égal à ces emplois. Les formules mathématiques font aussi des erreurs – on parle de faux positifs8 – souvent sans conséquences graves. Mais si un algorithme de détection des visages est utilisé par la police et se trompe, il faut être sûr qu’il ne soit pas le seul à décider de l’arrestation

  1. https://www.wired.com/2015/10/can-learn-epic-failure-google-flu-trends/
  2. https://www.numerama.com/pop-culture/433922-netflix-trompe-t-il-ses-utilisateurs-noirs-avec-ses-vignettes-de-films-personnalisees.html
  3. https://www.lesechos.fr/30/06/2018/lesechos.fr/0301881430259_quand-la-gendarmerie-utilise-les-algorithmes-pour-prevoir-les-cambriolages.htm
  4. https://agd.data.gouv.fr/2018/01/12/predire-les-vols-de-voitures/
  5. https://www.sciencesetavenir.fr/high-tech/informatique/bac-2018-l-algorithme-de-parcoursup-explique-par-les-deux-chercheurs-qui-l-ont-concu_124407
  6. https://gizmodo.com/facebooks-new-face-recognition-features-what-we-do-an-1823359911
  7. https://presse.inserm.fr/un-programme-informatique-capable-de-detecter-et-didentifier-automatiquement-des-lesions-cerebrales/31634/
  8. https://www.theguardian.com/uk-news/2014/dec/02/youre-the-bomb-are-you-at-risk-from-anti-terrorism-algorithms-automated-tracking-innocent-people

POUR ALLER PLUS LOIN

Ressources

Alexandre Léchenet, journaliste indépendant, spécialisé dans l’analyse des données

Vous aimerez aussi...