Skip to main content

Importance de la source de données

Objectifs de formation

Une fois cette unité terminée, vous pourrez :

  • Présenter le contexte de vos données
  • Identifier les questions à poser sur vos données
  • Expliquer pourquoi la présence ou l’absence de personnes dans vos données a un impact sur vos analyses

Élimination des préjugés dans les données

De la même manière qu’essayer d’analyser des données erronées génère des résultats erronés, essayer de visualiser des données erronées générera également des tableaux de bord et des graphiques trompeurs. 

Dans votre engagement à ne pas nuire, vérifiez si vos données peuvent être biaisées ou issues de systèmes de collecte de données racistes ou oppressifs. Si les données sous-jacentes à la visualisation sont biaisées, cette dernière amplifiera le préjugé et les dommages qu’il génère.

Comment éliminer les préjugés de l’analyse des données ? En intégrant une perspective équitable dans un projet dès le départ. Demandez :

  • Qui sont les membres de l’équipe impliqués dans la création de l’analyse ?
  • L’équipe ou l’organisation est-elle diversifiée ?
  • Les questions de diversité, d’équité et d’inclusion (DEI) sont-elles primordiales ?
  • L’équipe/organisation est-elle habituée à traiter ces questions ?

Examinez attentivement comment une étude est conçue, comment les données sont collectées, et comment l’analyse de ces données est effectuée et les résultats communiqués. Il ne s’agit pas d’une solution magique, mais cette perspective plus large peut contribuer à éliminer les préjugés de la recherche, de l’analyse et de la communication des données.

Identification des préjugés dans les données

Un cadre performant pour traiter les données peut aider les analystes, les communicateurs et les chercheurs de données à identifier et à gérer les données potentiellement biaisées. Réfléchissez aux questions suivantes.

  • Comment ces données ont-elles été générées ?
  • Pourquoi ces données ont-elles été collectées ?
  • De quelles personnes ces données incluent-elles et excluent-elles les témoignages, les vies et les expériences ?
  • Dans quelle mesure ces données peuvent-elles être désagrégées selon l’ethnie, le genre, l’origine ethnique, etc. ?
  • Les données sont-elles représentatives de la démographie de la population ?
  • À qui la collecte ou la publication de ces données profite-t-elle et à qui pourrait-elle nuire ?

Les données, en particulier les données collectées sur les personnes, ne sont ni neutres ni objectives. Elles reflètent les préjugés conscients et inconscients et le point de vue des chercheurs ou des collecteurs de données. Ce point est important, car l’adoption d’une perspective DEI seule ne peut pas corriger des données ou des analyses biaisées. En tant que chercheur, analyste et communicateur de données, il est essentiel de tenir compte des causes profondes des disparités révélées dans les données et d’encadrer votre travail en gardant ces informations à l’esprit.

L’inclusivité comme priorité

Il est important de reconnaître qui est et n’est pas inclus dans vos données et visualisations. En tant que chercheur, pouvez-vous aider votre organisation à effectuer des sondages pour être plus inclusive ? Ce n’est pas parce qu’il peut s’avérer plus difficile d’obtenir des données sur certains groupes que vous ne devriez pas essayer de mieux comprendre leur vie.

Les groupes dont les données ne sont pas souvent collectées ou présentées sont ceux que la société considère comme moins importants. En parallèle, ce que vous ignorez peut révéler des indifférences et préjugés sociaux cachés. La cartographie nous en montre un excellent exemple : les cartes des États-Unis ne montrent souvent pas les territoires américains, effaçant ainsi des populations entières qui ne sont pas représentées au Congrès et qui sont majoritairement non blanches. 

En outre, de nombreux graphiques sur l’ethnie incluent des personnes Noires, Hispaniques/Latino-américaines et blanches, mais pas d’autres groupes raciaux ou ethniques. Cela s’explique souvent par des limitations de données telles que des échantillons de petite taille ou l’absence complète de données. En pensant aux groupes manquants et aux personnes représentées, soyez conscient de l’importance d’utiliser des données inclusives. 

Amélioration de l’inclusivité dans les données

Pour vous assurer que vos données sont aussi inclusives que possible, dirigez de manière empathique et avisée en tenant compte de tous les groupes de personnes et en suivant les directives ci-dessous.

Élimination des regroupements

Si l’échantillon est de petite taille, les populations sont parfois regroupées pour faciliter l’analyse. Par exemple, une carte montrant les ethnies et origines ethniques à travers les États-Unis pourrait inclure un groupe « Tous les autres », sans expliquer quels groupes ont été exclus. Cette approche peut avoir des effets néfastes sur les communautés regroupées. 

L’utilisation d’échantillons de petite taille pour des groupes déjà sous-représentés est un choix de la part des personnes privilégiées, et non des limites inhérentes aux petites populations. En pratique, cependant, des échantillons de petite taille sont parfois inévitables en raison de contraintes de temps ou de budget. Vous pouvez tout de même faire mieux en reconnaissant que le cumul de données peut masquer la variation au sein de certains groupes, ou que la petite taille des échantillons ne permet pas de mener des statistiques et des données scientifiques de manière objective et précise. En tant que producteur de données, c’est-à-dire quelqu’un qui conçoit et publie des sondages, vous devez également chercher à élargir le nombre de groupes dont les données sont collectées. Les chercheurs et les producteurs de données doivent s’efforcer de collecter des données qui reflètent la vie de tous, plutôt que de porter atteinte à des communautés déjà marginalisées. 

Inclusion de catégories de genre non binaires

Parfois, certaines populations sont totalement exclues de la collecte de données. De nombreux sondages majeurs réalisés à l’échelle nationale, par exemple, n’offrent pas les options de réponse « non binaire » ou « transgenre » pour les questions sur le genre. C’est l’occasion pour vous d’indiquer clairement à vos lecteurs quelles informations vous avez et n’avez pas dans vos données.

Sélection de menus déroulants de genre avec des options de réponse de genre douteuses : femme, homme, s/o, inconnu et entité fiscale.

Pointer du doigt l’absence de catégories non binaires peut inciter le prochain chercheur et communicateur de données à apporter les modifications nécessaires à ses futurs sondages et visualisations. Il est nécessaire que tout l’écosystème des producteurs, consommateurs et communicateurs de données travaille conjointement pour atteindre les objectifs d’inclusivité.

Alternatives à « autre »

Il est primordial de comprendre l’importance d’utiliser un langage inclusif lors de la segmentation des groupes. Quelle est la bonne approche pour analyser et présenter la catégorie « autre » ? Pouvez-vous utiliser un langage plus inclusif pour parler de ce groupe ? Tout d’abord, vous devez comprendre ce que la catégorie représente. Il peut s’agir d’un large éventail d’ethnies, d’origines ethniques, de religions, d’autres caractéristiques et leurs intersections. Bien que cette option soit utile pour les personnes qui ne se reconnaissent pas dans les catégories habituelles, vous devez vous demander si le regroupement de personnes ayant des caractéristiques et des expériences de vie aussi variées est réellement significatif. 

Voici six alternatives possibles à « autre » :

  • Autre ethnie
  • Groupes supplémentaires
  • Toute autre description de soi
  • Personnes s’identifiant à d’autres ethnies ou à plusieurs ethnies
  • Identité non répertoriée
  • Identité non répertoriée dans le sondage

Certains de ces termes sont assez longs et peuvent ne pas bien s’intégrer dans un tableau ou sous une barre de graphique. Ils sont cependant plus inclusifs et permettent d’éviter certains problèmes que nous avons mentionnés précédemment. Il est important de noter que ces options peuvent ne pas être disponibles dans un sondage et que les participants risquent alors de cocher « autre », car aucun des choix n’était adapté. 

Si vous pensez que c’est le cas pour votre sondage, vous pouvez inclure une simple remarque ou note de bas de page pour mentionner la différence entre les données brutes et votre présentation des résultats. Néanmoins, ces alternatives sont, au sens général, toujours applicables et exactes. Vous pouvez donc ajouter une remarque ou une note de bas de page distincte au graphique, au tableau ou au texte afin que le changement soit clair pour les lecteurs.

Explication en cas d’absence de groupes

Un graphique avec des catégories pour l’ethnie, le genre, l’âge, l’éducation et le revenu qui montrent le pourcentage de chômage en fonction des choix. Le graphique comporte également une fenêtre de message décrivant comment les limites de taille d’échantillon n’ont pas permis d’obtenir des estimations fiables. Le message indique : La taille de l’échantillon représentant les hommes amérindiens sans diplôme d’études secondaires est trop petite pour être fiable.

Dans les cas où des données ont été collectées sur un groupe spécifique mais que celui-ci n’a pas été présenté dans le graphique ou inclus dans l’analyse, soyez transparent sur vos méthodes en précisant quels groupes ont été inclus dans le jeu de données d’origine. Vous pouvez aussi préciser d’éventuelles divergences dans la recherche de données sans induire les lecteurs en erreur.

Ressources

Partagez vos commentaires sur Trailhead dans l'aide Salesforce.

Nous aimerions connaître votre expérience avec Trailhead. Vous pouvez désormais accéder au nouveau formulaire de commentaires à tout moment depuis le site d'aide Salesforce.

En savoir plus Continuer à partager vos commentaires