
Si l’on considère les opportunités potentielles pour les soins de santé, on estime que le secteur a accumulé des données en termes de téraoctets et qu’il se rapproche de la catégorie des pétaoctets. Il s’agit d’une opportunité exceptionnelle ! Dans un article intitulé Big Data for Healthcare : Pourquoi collectons-nous toutes ces données ? High Tech Answers a découvert qu’en moins d’un an, les National Institutes of Health (NIH) ont reçu 200 millions de dollars de financement pour le projet international 1000 génomes. À partir de là, les chercheurs ont pu valider une découverte scientifique liée à la maladie d’Alzheimer. Dans leur article, ils déclarent que :
« Ce projet de « big data » devrait contenir le plus grand ensemble de données au monde sur la variation génétique humaine, et vise à séquencer le génome entier de 2 600 personnes du monde entier. »
Une nouvelle preuve de cette nouvelle frontière passionnante nous vient du MIT. En 2012, le MIT a lancé une initiative de big data appelée bigdata@CSAIL. Les chercheurs associés au projet développent de nouvelles techniques de traitement des données médicales, afin de les rendre plus accessibles aux médecins et aux patients et de trouver des corrélations qui pourraient améliorer le diagnostic ou le choix des thérapies.
John Guttag, titulaire de la chaire Dugald C. Jackson en EECS, dirige le groupe Data-Driven Medicine de la CSAIL. Le groupe étudie notamment les techniques de détection et de prévision des infections nosocomiales. Grâce à leurs efforts, un chercheur a utilisé des techniques d’apprentissage automatique pour passer au peigne fin les données afin de trouver des patients présentant un risque élevé d’infection par le méchant microbe intestinal Clostridium difficile. Ce microbe, communément appelé C-Diff, est fréquent dans les hôpitaux et les environnements de soins, où les patients sont susceptibles d’être infectés. Elle est persistante et préoccupante dans son contrôle.
Ces seuls faits indiquent clairement la valeur et les perspectives d’avenir d’une relation harmonieuse entre les soins de santé, le nettoyage des données et le big data. La vision claire à laquelle nous sommes confrontés n’est pas « pouvons-nous » mais « comment » faire progresser les soins de santé en utilisant stratégiquement les techniques de nettoyage des données et de couplage des enregistrements. Nos possibilités d’améliorer les résultats cliniques et de renforcer les positions fiscales sont infinies et abondantes.

































