L’intérêt de l’éthique de la donnée pour le présent et pour l’avenir

Exercice d’illustration par l’exemple — Éthique de la donnée 2/3

8 min readNov 3, 2020

--

Suite de notre série d’articles relatifs au sujet de l’éthique des données, après le travail de définition, place aux illustrations! De fait, après avoir décortiqué et expliqué les concepts clés de ce sujet, ce deuxième chapitre visera à présenter des exemples concrets et actuels mettant en exergue l’intérêt, autre que théorique, de l’éthique des données pour la société dans son ensemble. Il s’agira de présenter des cas où l’éthique a été oubliée, négligée voire bafouée, afin de faire apparaitre, en creux, le rôle de garde-fou que doit incarner cette discipline dans la sphère numérique.

Ces articles sont tirés du livre-blanc à paraitre sur le sujet de l’éthique de la donnée, livre blanc rédigé par Pramana sur la base des travaux d’un groupe de travail organisé et dirigé lui aussi par Pramana dans le cadre de la chaire ESSEC « Stratégie & Gouvernance de l’Information ». Si vous souhaitez recevoir un exemplaire de cet ouvrage, nous vous invitons à nous le signaler via ce formulaire.

Les données personnelles : l’arbre qui cache la forêt

Un raccourci très courant fait par le grand public au sujet de l’éthique des données consiste à considérer que cette dernière ne s’applique qu’aux données à caractère personnel. Cette simplification, bien que compréhensible, est bien trop réductrice. Cependant, comment parler de Data Ethics sans aborder le sujet emblématique des données rattachées à l’identité et aux actions des personnes physiques. Il faut dire que ce sujet ne cesse de faire la une des gazettes, constituant un prétexte idéal pour servir les discours et les agendas de nombreuses personnalités, politiques notamment. Pourtant, si certains n’hésitent pas à instrumentaliser ce sujet pour servir leurs intérêts/idées, il est indubitable qu’en matière de données personnelles, l’éthique est bien trop souvent oubliée voire négligée. Nous pourrions énumérer quantité d’affaires qui ont défrayé la chronique ces dernières années, du fait de l’utilisation de données personnelles soit sans autorisation, soit à des fins non prévues au moment de leur recueil, entre autres ; pour illustrer ces dérives, nous pourrions évoquer l’épisode Cambridge Analytica, ou encore la polémique issue de la visualisation des données de l’application Strava et tant d’autres. De nombreux ouvrages et spécialistes ont déjà abordé ces sujets, ces scandales nés de l’absence, ou du contournement, des principes prônés par l’éthique des données. Ces problématiques ont encore une fois été mises sur le devant de la scène par le documentaire The Social Dilemma, diffusé sur Netflix depuis septembre 2020, traitant spécifiquement des réseaux sociaux, de leur utilisation des données et de leurs modèles économiques.

Un simple article ne saurait suffire à expliquer le seul sujet de l’éthique relative aux données personnelles (le sujet est développé plus en détails dans notre livre blanc, présentant l’intérêt notamment de l’anonymisation et/ou de la pseudonymisation des données), l’objectif de cette section est de mettre en exergue l’importance de l’existence et de l’application des principes dictés par l’éthique des données ; sans cela, l’organisation ou l’entreprise fautive s’expose à des sanctions tant de la part des autorités que de ses clients.

Toutefois, il serait dommageable de réduire le respect des Data Ethics à « la peur du gendarme », de la même façon qu’il serait terriblement simplificateur de circonscrire l’éthique des données aux seules données personnelles.

Quelques exemples moins connus de sujets adressés par l’éthique des données

Rendre les algorithmes plus transparents, un challenge plus que d’actualité

Les algorithmes sont devenus centraux dans nos vies aujourd’hui, que ce soit dans notre environnement professionnel mais également au sein de notre sphère privée. Ces nouvelles technologies sont incontournables et s’immiscent dans de nombreux domaines et sujets ; or, si les bénéfices qu’elles engendrent sont nombreux et patents, leur opacité est bien souvent pointée du doigt. De fait, les algorithmes sont fréquemment qualifiées de « boites-noires » dont on ne connait rien quant aux règles et aux mécanismes guidant leur fonctionnement. Or si ce manque de visibilité peut être toléré dans certaines situations anodines et aux enjeux limités, il suscite de plus en plus l’inquiétude voire la peur de citoyens dans de nombreux pays. Cela s’est vu avec le site Parcoursup pour lequel il était demandé plus de transparence quant à son fonctionnement ; nous pouvons donner l’exemple plus récent encore de la société Uber, là encore pour des raisons de transparence.

Ces deux exemples illustrent bien les attentes croissantes de la société d’une application de principes éthiques vis-à-vis des algorithmes : nous ne détaillerons pas plus le sujet de l’éthique algorithmique ici, mais si l’on devait retenir les deux exigences clés prônées par cette discipline, ce serait « Explicabilité » et « Interprétabilité ». De fait, ces deux principes sont complémentaires et sont incontournables pour tendre vers une plus grande transparence des algorithmes, notamment pour les technologies de deep-learning.

Les enjeux en matière de diversité, neutralité et inclusivité de l’Ethique des données

L’une des forces de l’Ethique des données repose dans sa pertinence pour répondre à de très nombreux enjeux de notre société contemporaine. C’est un euphémisme de rappeler que, en Europe et en Amérique du Nord, l’époque est marquée par une forte dynamique en faveur d’une protection accrue des minorités, de la promotion d’une plus grande diversité dans le monde de l’entreprise ou dans les institutions politiques ; notre société moderne est en quête d’objectivité et de fiabilité dans le partages d’informations utiles et disponibles pour tous. Or, sans prétendre qu’elle n’ait émergé pour répondre principalement à ces attentes, force est de constater que l’éthique des données constitue un levier des plus efficaces pour répondre aux défis que ces thèmes génèrent.

La lecture de notre livre blanc est d’autant plus utile pour en savoir plus sur l’éthique algorithmique, surtout que cette dernière ne se cantonne pas à des recommandations relatives à la transparence des algorithmes : l’éthique des algorithmes adresse de nombreux autres sujets tout aussi intéressants parmi lesquels l’attention portée à la non-reproduction des biais humains dans la logique algorithmique, la formation à l’éthique des concepteurs des algorithmes, l’éthique by design, etc. Nous recommandons également la lecture du rapport de Cédric Villani consacré à l’intelligence artificielle, rapport contenant des sections des plus instructives à propos de l’importance de l’éthique algorithmique pour que le Data Management soit davantage en conformité avec les enjeux d’inclusivité et de diversité, entre autres.

Quelques exemples valant mieux que mille discours, voici les situations et phénomènes que l’éthique des données vise à prévenir par ses recommandations :

  • La société Apple a été mise à l’index courant 2019 à propos du fonctionnement supposé sexiste de la carte de crédit « Apple Card » : selon plusieurs détenteurs de ladite carte, l’évaluation du risque-client serait bien plus défavorable pour les femmes que pour les hommes, un déséquilibre ne trouvant pas d’explication rationnelle, l’opacité de l’algorithme n’aidant pas. Cet évènement, symbolique à plus d’un titre, met en exergue deux thèmes majeurs de l’éthique des données : la reproduction des biais et préjugés humains dans la codification des algorithmes, ainsi que le phénomène de boite noire de ces technologies évoqué quelques lignes plus haut.
  • Plus récemment, c’est l’entreprise Twitter qui a été critiquée pour le fonctionnement jugé raciste de son algorithme de recadrage des photos : un certain nombre d’utilisateurs du réseau social estimaient que la technologie de retraitement des photos avait tendance à favoriser l’affichage des personnes blanches au détriment des autres couleurs de peau. Là encore, nous ne nous risquerons pas à affirmer s’il s’agit d’un bug technique ou de la reproduction des présupposés des développeurs, toutefois cet exemple doit nous servir à avoir à l’esprit que les technologies sont bien souvent le reflet de leurs créateurs et que, de ce fait, la solution peut passer par la sensibilisation et la formation de ces derniers aux enjeux éthiques.

Laissons le mot de la fin à Cathy O’Neil, mathématicienne, data scientist, militante pour l’encadrement et la transparence des algorithmes et auteur de l’ouvrage « Weapons of Math Destruction : « les algorithmes sont des opinions intégrées dans du code. […] Les algorithmes ne rendent pas les choses équitables si on les applique aveuglément, avec négligence. Ils reproduisent nos pratiques du passé, nos habitudes. […] Les algorithmes peuvent être interrogés et on peut les corriger, les améliorer. J’appelle ça un “audit algorithmique”. […] Nous, Data scientists, ne devons pas être les arbitres de la vérité ; nous devrions être les traducteurs des discussions d’ordre éthique prenant place dans la société. L’ère de la confiance absolue dans le Big Data doit prendre fin. »

Il va sans dire que les quelques exemples développés ci-dessous ne sauraient être exhaustifs : bien d’autres sujets et problématiques auraient mérité d’être mis en avant, mais choisir c’est renoncer. Le format plus long du livre blanc vous permettra de combler ce manque, cet article visant avant tout à amorcer l’intérêt de nos lecteurs pour le sujet si passionnant de l’éthique des données.

Conclure sur une note optimiste mais responsable

Pour conclure cet article, il nous parait bon de rappeler une nouvelle fois que le but et le propos de nos articles ne consistent pas à mettre à l’index les usages et technologies en lien avec les données ; au contraire, Pramana considère les données comme une ressource inestimable dont il serait absurde de ne pas tirer profit via le Data Mangement. Cela étant dit, une discipline aussi prometteuse et fertile implique de grandes responsabilités, sans quoi elle perdra tout crédit et tout avenir. Il est par conséquent indispensable de promouvoir et faire appliquer les principes et bonnes pratiques mises en avant par l’Ethique des données.

Dans notre prochain et dernier article, il sera question de présenter plusieurs initiatives très intéressantes visant à promouvoir l’opérationnalisation de l’éthique des données. Car après tout, la réussite d’une discipline s’observe par sa capacité à passer du champ théorique au champ pratique, en générant par là-même des bénéfices pour les acteurs la mettant en application.

Geoffroy Escard
Consultant Data
Pramana

--

--

Designing The Digital World — Data Governance, Enterprise Architecture — more on pramana.fr and on LinkedIn