Pourquoi chaque organisation a besoin d’une stratégie en matière d’intégrité des données
- Courriel
-
Signet
-
Imprimer
Les organisations modernes génèrent des données à chaque achat, à chaque mention J’aime sur les médias sociaux et à chaque interaction avec un client, et lorsqu’elles sont bien gérées, ces données peuvent alimenter des banques de renseignements utiles qui favorisent la croissance.
Toutefois, comme les nutritionnistes, les professionnels des données s’entendent pour dire que si les intrants sont de mauvaise qualité, les extrants le seront aussi. Un sondage de 2023 a révélé que seulement 46 % des professionnels des données et des analyses ont évalué leur capacité à faire confiance aux données utilisées pour la prise de décision comme étant élevée ou très élevée, et que 70 % de ceux qui ont de la difficulté à faire confiance à leurs données ont indiqué que la qualité était leur plus grand problème1.
Qu’une organisation utilise des analyses prédictives, prescriptives ou simplement diagnostiques, l’efficacité de son programme de données dépend entièrement de la qualité de ses données. Les données doivent être fiables, exactes, complètes et cohérentes. Toutefois, l’établissement et le maintien de l’intégrité des données à une échelle adaptée au volume et à la vitesse considérables des données transférées aujourd’hui nécessitent une approche stratégique.
Préserver l’intégrité des données tout au long du processus
Chaque écosystème de données est unique, mais chaque élément de données dont une organisation tire parti passera par des étapes similaires tout au long de son cycle de vie, de la production à la collecte, en passant par l’interprétation et l’élimination. Les données sont fongibles. Elles passent d’un actif, d’une plateforme et d’un serveur à l’autre, traversant souvent les frontières d’un État, d’une province ou même d’un pays. Elles changent de forme en étant recueillies lors d’un appel et stockées dans un système de gestion des relations clientèle, puis transférées vers une plateforme d’analyse et communiquées dans une présentation PowerPoint. Et à chaque étape du processus, l’intégrité des données est compromise.
Le terme « intégrité » est dérivé d’un mot latin qui signifie « intact » ou « qui n’a pas été touché ». 2 L’intégrité des données décrit l’uniformité des données à mesure qu’elles évoluent dans le temps, les systèmes et les formats, en mettant l’accent sur le maintien de données non corrompues et lisibles, donc intactes.
La qualité des données est un concept distinct, mais important, qui décrit l’utilité des données aux fins prévues. Les données de bonne qualité sont uniques, exactes, cohérentes et à jour. Les données de mauvaise qualité peuvent être redondantes, inexactes, incohérentes, désuètes, et ce, en partie ou en totalité. Lorsque les données perdent leur intégrité, elles perdent nécessairement leur qualité, mais des données de mauvaise qualité peuvent tout de même préserver leur intégrité.
Il est donc essentiel d’assurer l’intégrité des données pour en garantir la qualité. Une stratégie rigoureuse en matière d’intégrité des données permettra de s’assurer que les données, peu importe leur qualité, demeurent intactes, afin que les experts en science des données et, de plus en plus, les outils utilisant l’intelligence artificielle générative produisent des renseignements exploitables et protègent l'organisation contre les risques de réputation et de réglementation liés à la perte de données. Plus simplement, les données doivent être disponibles, fiables, compréhensibles, originales, transparentes et intactes.
Menaces à l’intégrité des données
À l’ère de l’intelligence artificielle générative, les organisations font face à une multitude de défis en matière d’intégrité des données, y compris des attaques par rançongiciel, des virus et des bogues à l’ancienne et des malfaiteurs plus novateurs reposant sur l’intelligence artificielle.
Toutefois, certains des plus grands risques ne relèvent habituellement pas de la stratégie de cybersécurité d’une entité, et comprennent ce qui suit3,4 :
-
Erreur commise par l’utilisateur : Il peut arriver que les utilisateurs saisissent du texte dans la cellule d’une feuille de calcul en faisant une recherche, remplacent accidentellement le contenu d’un fichier, mettent fin à une migration de données trop tôt ou gèrent mal la collecte de données; il existe de nombreuses façons dont une erreur d’un utilisateur peut nuire à l’intégrité des données.
-
Problèmes de transfert : Il est facile de supposer que le transfert de données sur de longues distances est un processus aussi simple et exempt d’erreur que l’envoi d’un courriel. Mais il est possible qu’il manque des paquets de données, que les données reçues soient incomplètes et que des erreurs soient commises à l’occasion.
-
Incompatibilité du système : Plus le volume de données recueilli est élevé, plus les organisations doivent composer avec des systèmes qui n’emploient pas le même langage informatique. Les données envoyées à partir d’une ancienne base de données peuvent être enregistrées dans un format que le destinataire ne peut pas lire.
-
Problèmes de matériel et d’infrastructure : Le matériel et l’infrastructure anciens, endommagés ou mal entretenus peuvent corrompre les données à n’importe quelle étape de leur cycle de vie, de la collecte à l’élimination.
Quatre étapes clés pour assurer l’intégrité des données
Tout programme de données réussi repose sur une stratégie proactive en matière d’intégrité des données. Pour réussir, il faut assurer l’intégrité à chaque étape du cycle de vie, de la formation du personnel sur la saisie des données aux systèmes de test d’intrusion.
Chaque stratégie en matière d’intégrité des données, peu importe la maturité de l’infrastructure de données d’une entité, doit comprendre quatre éléments clés, dont la plupart peuvent maintenant être en grande partie automatisés3,4.
-
Validation : Un programme rigoureux de validation des données contribuera à assurer l’intégrité, la qualité et la transparence des données.
-
Vérification : En l’absence d’un système de vérification rigoureux et systématique, les erreurs peuvent proliférer dans l’ensemble de l’écosystème de données.
-
Sauvegarde : Les mesures de maintenance, de sauvegarde et de reprise doivent faire partie de votre stratégie de continuité des activités, mais aussi de votre stratégie en matière d’intégrité des données.
-
Sécurité : Harmonisez la stratégie en matière d’intégrité des données avec votre planification de la sécurité et effectuez des tests d’intrusion pour vous assurer que les systèmes sont protégés contre les malfaiteurs.
Qu’une organisation veuille générer des revenus à partir de données ou simplement éviter les nombreux pièges réglementaires et atteintes à sa réputation liés à une mauvaise gestion des données, l’intégrité doit être au cœur de sa stratégie, au lieu d’être prise en compte après coup.
1 Precisely, 2023 Data Integrity Trends and Insights (en anglais seulement), consulté en septembre 2024.
2 Leo W.J.C. Huberts, Integrity: What it is and Why it is Important (en anglais seulement), juillet 2018.
3 Kihara Kimachia, What Is Data Integrity & Why Is It Important? (Definition & Types) (en anglais seulement), TechRepublic, août 2023.
4 Keith D. Foote, Data Integrity vs. Data Quality (en anglais seulement), Dataversity, juillet 2023.
Pourquoi chaque organisation a besoin d’une stratégie en matière d’intégrité des données
Chef des TI, Marchés des capitaux, É.-U. et chef, Banque d’affaires et services bancaires aux sociétés et Bureau du chef de l’exploitation, Technologie
Kim s’est jointe à BMO en août 2021 après avoir occupé à RBC le poste de chef, groupe Technologie, canaux numéri…
Kim s’est jointe à BMO en août 2021 après avoir occupé à RBC le poste de chef, groupe Technologie, canaux numéri…
VOIR LE PROFIL COMPLET- Temps de lecture
- Écouter Arrêter
- Agrandir | Réduire le texte
Les organisations modernes génèrent des données à chaque achat, à chaque mention J’aime sur les médias sociaux et à chaque interaction avec un client, et lorsqu’elles sont bien gérées, ces données peuvent alimenter des banques de renseignements utiles qui favorisent la croissance.
Toutefois, comme les nutritionnistes, les professionnels des données s’entendent pour dire que si les intrants sont de mauvaise qualité, les extrants le seront aussi. Un sondage de 2023 a révélé que seulement 46 % des professionnels des données et des analyses ont évalué leur capacité à faire confiance aux données utilisées pour la prise de décision comme étant élevée ou très élevée, et que 70 % de ceux qui ont de la difficulté à faire confiance à leurs données ont indiqué que la qualité était leur plus grand problème1.
Qu’une organisation utilise des analyses prédictives, prescriptives ou simplement diagnostiques, l’efficacité de son programme de données dépend entièrement de la qualité de ses données. Les données doivent être fiables, exactes, complètes et cohérentes. Toutefois, l’établissement et le maintien de l’intégrité des données à une échelle adaptée au volume et à la vitesse considérables des données transférées aujourd’hui nécessitent une approche stratégique.
Préserver l’intégrité des données tout au long du processus
Chaque écosystème de données est unique, mais chaque élément de données dont une organisation tire parti passera par des étapes similaires tout au long de son cycle de vie, de la production à la collecte, en passant par l’interprétation et l’élimination. Les données sont fongibles. Elles passent d’un actif, d’une plateforme et d’un serveur à l’autre, traversant souvent les frontières d’un État, d’une province ou même d’un pays. Elles changent de forme en étant recueillies lors d’un appel et stockées dans un système de gestion des relations clientèle, puis transférées vers une plateforme d’analyse et communiquées dans une présentation PowerPoint. Et à chaque étape du processus, l’intégrité des données est compromise.
Le terme « intégrité » est dérivé d’un mot latin qui signifie « intact » ou « qui n’a pas été touché ». 2 L’intégrité des données décrit l’uniformité des données à mesure qu’elles évoluent dans le temps, les systèmes et les formats, en mettant l’accent sur le maintien de données non corrompues et lisibles, donc intactes.
La qualité des données est un concept distinct, mais important, qui décrit l’utilité des données aux fins prévues. Les données de bonne qualité sont uniques, exactes, cohérentes et à jour. Les données de mauvaise qualité peuvent être redondantes, inexactes, incohérentes, désuètes, et ce, en partie ou en totalité. Lorsque les données perdent leur intégrité, elles perdent nécessairement leur qualité, mais des données de mauvaise qualité peuvent tout de même préserver leur intégrité.
Il est donc essentiel d’assurer l’intégrité des données pour en garantir la qualité. Une stratégie rigoureuse en matière d’intégrité des données permettra de s’assurer que les données, peu importe leur qualité, demeurent intactes, afin que les experts en science des données et, de plus en plus, les outils utilisant l’intelligence artificielle générative produisent des renseignements exploitables et protègent l'organisation contre les risques de réputation et de réglementation liés à la perte de données. Plus simplement, les données doivent être disponibles, fiables, compréhensibles, originales, transparentes et intactes.
Menaces à l’intégrité des données
À l’ère de l’intelligence artificielle générative, les organisations font face à une multitude de défis en matière d’intégrité des données, y compris des attaques par rançongiciel, des virus et des bogues à l’ancienne et des malfaiteurs plus novateurs reposant sur l’intelligence artificielle.
Toutefois, certains des plus grands risques ne relèvent habituellement pas de la stratégie de cybersécurité d’une entité, et comprennent ce qui suit3,4 :
-
Erreur commise par l’utilisateur : Il peut arriver que les utilisateurs saisissent du texte dans la cellule d’une feuille de calcul en faisant une recherche, remplacent accidentellement le contenu d’un fichier, mettent fin à une migration de données trop tôt ou gèrent mal la collecte de données; il existe de nombreuses façons dont une erreur d’un utilisateur peut nuire à l’intégrité des données.
-
Problèmes de transfert : Il est facile de supposer que le transfert de données sur de longues distances est un processus aussi simple et exempt d’erreur que l’envoi d’un courriel. Mais il est possible qu’il manque des paquets de données, que les données reçues soient incomplètes et que des erreurs soient commises à l’occasion.
-
Incompatibilité du système : Plus le volume de données recueilli est élevé, plus les organisations doivent composer avec des systèmes qui n’emploient pas le même langage informatique. Les données envoyées à partir d’une ancienne base de données peuvent être enregistrées dans un format que le destinataire ne peut pas lire.
-
Problèmes de matériel et d’infrastructure : Le matériel et l’infrastructure anciens, endommagés ou mal entretenus peuvent corrompre les données à n’importe quelle étape de leur cycle de vie, de la collecte à l’élimination.
Quatre étapes clés pour assurer l’intégrité des données
Tout programme de données réussi repose sur une stratégie proactive en matière d’intégrité des données. Pour réussir, il faut assurer l’intégrité à chaque étape du cycle de vie, de la formation du personnel sur la saisie des données aux systèmes de test d’intrusion.
Chaque stratégie en matière d’intégrité des données, peu importe la maturité de l’infrastructure de données d’une entité, doit comprendre quatre éléments clés, dont la plupart peuvent maintenant être en grande partie automatisés3,4.
-
Validation : Un programme rigoureux de validation des données contribuera à assurer l’intégrité, la qualité et la transparence des données.
-
Vérification : En l’absence d’un système de vérification rigoureux et systématique, les erreurs peuvent proliférer dans l’ensemble de l’écosystème de données.
-
Sauvegarde : Les mesures de maintenance, de sauvegarde et de reprise doivent faire partie de votre stratégie de continuité des activités, mais aussi de votre stratégie en matière d’intégrité des données.
-
Sécurité : Harmonisez la stratégie en matière d’intégrité des données avec votre planification de la sécurité et effectuez des tests d’intrusion pour vous assurer que les systèmes sont protégés contre les malfaiteurs.
Qu’une organisation veuille générer des revenus à partir de données ou simplement éviter les nombreux pièges réglementaires et atteintes à sa réputation liés à une mauvaise gestion des données, l’intégrité doit être au cœur de sa stratégie, au lieu d’être prise en compte après coup.
1 Precisely, 2023 Data Integrity Trends and Insights (en anglais seulement), consulté en septembre 2024.
2 Leo W.J.C. Huberts, Integrity: What it is and Why it is Important (en anglais seulement), juillet 2018.
3 Kihara Kimachia, What Is Data Integrity & Why Is It Important? (Definition & Types) (en anglais seulement), TechRepublic, août 2023.
4 Keith D. Foote, Data Integrity vs. Data Quality (en anglais seulement), Dataversity, juillet 2023.
Autre contenu intéressant
Les cybercriminels ciblent votre argent à l’aide de l’intelligence artificielle
Géopolitique et intelligence artificielle générative : une tempête de cybersécurité se prépare-t-elle?
Comment la NASA et IBM utilisent les données géospatiales et l’intelligence artificielle pour analyser les risques climatiques
Comment les entreprises peuvent utiliser l’IA pour améliorer (mais non remplacer) le travail humain
Trésorerie nouvelle génération : Protéger son organisation contre une attaque à la cybersécurité
Infonuagique, données et zéro confiance : voilà les aspects de la cybersécurité privilégiés par les investisseurs de capital de risque
Effets de la crise de la COVID-19 sur le secteur des technologies et des logiciels
Technology and Software: How COVID Will Change Remote Work Forever