Blog

Comment Data Ladder aide les États à établir des correspondances de données précises pour les subventions SLDS

  • Les États américains intensifient leurs efforts en matière de données en déployant des systèmes de données longitudinales à l’échelle de l’État (SLDS) qui contiennent des informations sur les élèves des écoles publiques. Les dossiers sont collectés tout au long de la vie des étudiants, depuis leur entrée dans un établissement public jusqu’à leur entrée dans la vie active. Les données obtenues sont utilisées pour évaluer les progrès des élèves et identifier les domaines à améliorer dans l’écosystème de l’éducation en utilisant une approche scientifique basée sur les données.

Pour atteindre cet objectif, des subventions SLDS sont offertes aux États pour améliorer leurs systèmes de données existants ou pour déployer le SLDS. Dans les deux cas, l’État devra initier le processus en gérant et en mettant à jour ses données. Et c’est là que réside le cœur du défi.

Trois grands défis en matière de données auxquels les États sont confrontés avec le système SLDS

Les données longitudinales sont des données à long terme qui suivent la même entité ou, dans le cas présent, un étudiant, à différents moments dans le temps. Les institutions publiques et les systèmes éducatifs ont la responsabilité d’obtenir des données précises et pertinentes. Cependant, avec le temps, les données longitudinales peuvent devenir obsolètes, refléter des informations redondantes ou dupliquées, ce qui rend difficile l’utilisation efficace des données par les parties prenantes.

En un mot, les parties prenantes du système SLDS doivent se battre :

  1. Mauvaise qualité des données : Aujourd’hui encore, l’enregistrement des données se fait manuellement. Au cours de ce processus, il est tout à fait possible qu’un être humain se trompe d’orthographe, utilise des abréviations et des ponctuations non requises ou même saisisse des données dans un format qui lui est familier. En outre, le risque de double emploi est élevé, surtout si l’opérateur de saisie des données commet une erreur dans l’attribution du bon identifiant clé unique. Autant de problèmes apparemment mineurs qui deviennent de graves goulots d’étranglement. Les données de mauvaise qualité ne peuvent être ignorées.
  2. Difficulté de mise en correspondance des enregistrements entre les agences : Au cœur des défis de la SLDS se trouve la difficulté de relier les enregistrements ou de mettre en correspondance les données entre les agences. Les données longitudinales d’un individu sont enregistrées par les multiples agences, écoles, districts ou États dans lesquels il a vécu au cours de sa vie. Le SLDS exigera que toutes ces données correspondent exactement à la personne qu’elles représentent. C’est là que les problèmes de qualité des données rendront extrêmement difficile pour les parties prenantes concernées d’établir une correspondance précise. En fait, le personnel de la SLDS passe une grande partie de son temps à faire correspondre des enregistrements. Les États américains testent et emploient plusieurs méthodes pour surmonter ce problème. Certains États utilisent des outils commerciaux, d’autres créent leurs propres processus de rapprochement et d’autres encore utilisent une combinaison des deux. Malgré l’utilisation de plusieurs processus et outils, la plupart des États auraient eu du mal à établir des correspondances précises. Le SLDS exige qu’un État atteigne 95 % de précision dans la correspondance des données pour recevoir une subvention !
  3. La résolution d’identité reste un défi : La mauvaise résolution d’identité est la conséquence d’une mauvaise qualité des données et d’une mauvaise précision de la correspondance. Avec des budgets limités, les instituts gouvernementaux ne peuvent pas se permettre d’engager des spécialistes des données ou des solutions de données qui pourraient coûter des millions de dollars. C’est pourquoi ils doivent se contenter de membres d’une équipe restreinte qui s’appuient sur des processus manuels pour résoudre les problèmes de correspondance d’identité. Un temps considérable est perdu à identifier les informations et à les faire correspondre aux personnes concernées, ce qui laisse peu de place à l’analyse ou à l’établissement de rapports – deux objectifs fondamentaux du SLDS. Ajoutez à cela la duplication des dossiers provenant de multiples agences et vous obtenez une crise de la gestion des données.

Quel est le rôle de Data Ladder dans le couplage d’enregistrements et comment cela aide-t-il les États avec les subventions SLDS ?

Data Ladder est une solution de qualité des données à l’échelle de l’entreprise qui offre comme services de base la préparation, le nettoyage et la comparaison des données. Nous avons travaillé avec le ministère de l’Éducation de plusieurs États qui avaient besoin d’un outil de rapprochement des données pour les aider à atteindre le taux de rapprochement de 95 % nécessaire pour obtenir la subvention SLDS.

Le rapprochement des données repose sur des informations exactes. Si les ensembles de données présentent des informations erronées, incomplètes ou incorrectes, il sera impossible d’obtenir des correspondances de données précises. Par conséquent, le point de départ de toute activité de rapprochement de données ne réside pas dans le rapprochement lui-même, mais dans la garantie que la qualité des données est à la hauteur. À cette fin, DataMatch Enterprise, le produit phare de Data Ladder, guide l’utilisateur à travers un module étape par étape qui commence par l’intégration de la source de données, suivie de la préparation des données, du nettoyage des données, du rapprochement des données et enfin de la fusion des données.

Grâce à Data Ladder, les chefs de projet des départements d’État ont pu :

  1. Déduplication des données redondantes et dupliquées entre les sources de données : Les données interagences sont forcément redondantes et dupliquées, d’autant plus que les lois sur la confidentialité des données empêchent le partage d’identifiants uniques tels que les SSN pour identifier les individus. Les agences n’ont donc pas d’autre choix que de créer leurs propres identifiants uniques, ce qui entraîne une duplication des informations si une autre agence dispose des mêmes informations sur l’individu. De plus, les erreurs humaines dans la saisie des données peuvent accidentellement provoquer des doublons qui sont difficiles à repérer avec des algorithmes de correspondance déterministes. Le logiciel phare de Data Ladder, DataMatch Enterprise, utilise quatre types d’algorithmes différents en combinaison avec son algorithme propriétaire pour obtenir un taux de correspondance de 96 % – le plus élevé du secteur.
  2. Problèmes de qualité des données et normalisation des données : La qualité des données reste un défi permanent, chaque nouveau projet devant être nettoyé avant de pouvoir être mis en correspondance. Les États ont donc besoin d’une solution rapide qui permette un nettoyage régulier des données sans impliquer le personnel. Lors de l’intégration, le logiciel DME analyse automatiquement les données et met en évidence la santé des données. L’utilisateur est ensuite invité à utiliser des règles commerciales prédéfinies pour nettoyer ses données. Il peut s’agir d’une action de base comme la mise en majuscule de la première lettre d’un nom ou d’une étape avancée comme la définition de règles de gestion pour trier les données. Data Ladder permet aux utilisateurs de normaliser les données à travers des sources de données intégrées en quelques clics seulement.
  3. Obtenez le plus haut taux de correspondance des données : Lors d’une expérience menée par l’État du Connecticut pour déterminer si le NSC ou l’outil d’un fournisseur commercial offrait des taux de correspondance plus élevés, Data Ladder a obtenu un taux de correspondance de 100 % – plus élevé que celui du NSC. Dans un autre échantillon, un État a manqué près de la moitié des correspondances avec son algorithme de correspondance interne. Avec Data Ladder, l’échantillon a connu une augmentation de 20 % de la concordance des données. Un taux de correspondance élevé reflète l’exactitude des données, qui est l’indicateur clé de l’efficacité du programme SLDS. Sans une concordance précise des données, la SLDS ne sera pas en mesure de tirer des enseignements précis, qui sont importants pour identifier les lacunes à combler et les améliorations à mettre en œuvre.

Lisez ce livre blanc pour voir comment Data Ladder aide à relier les informations sur les étudiants à travers plusieurs bases de données, à améliorer le PSIS dans le suivi des expériences éducatives et à évaluer l’impact de l’éducation secondaire et postsecondaire des étudiants sur leurs expériences dans le monde du travail.

Pour qu’un État puisse déployer un programme SLDS réussi, il est impératif qu’il dispose du bon outil pour faire le travail sans coûter des millions de dollars. Data Ladder est la seule solution de qualité des données abordable et la plus précise de l’industrie en matière de correspondance des données. Dire qu’il est au cœur d’un déploiement réussi de SLDS, c’est dire la réalité.

In this blog, you will find:

Try data matching today

No credit card required

« * » indique les champs nécessaires

Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Hidden
Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.

Want to know more?

Check out DME resources

Merging Data from Multiple Sources – Challenges and Solutions

Aïe ! Nous n’avons pas retrouvé votre formulaire.