L’institut de recherche analyse des données génomiques pour développer la médecine de précision afin de prévoir et empêcher les maladies
Cloudera, le fournisseur mondial de la plate-forme de machine learning et d’analytics avancé reposant sur les toutes dernières technologies open source, annonce qu’Inova Translational Medicine Institute (ITMI), un institut mondial de recherche médicale, a choisi Cloudera Enterprise pour analyser des ensembles massifs de données cliniques et génomiques en toute sécurité, à des vitesses et des échelles sans précédent, afin d’accélérer les innovations dans le domaine de la recherche en médecine translationnelle.
Au Centre Inova de santé personnalisée (ICPH), l’équipe de scientifiques, de chercheurs, d’analystes et de collaborateurs d’ITMI applique des algorithmes de machine learning à des téraoctets d’informations cliniques et génomiques afin d’identifier des liens génétiques avec des maladies. Ils font des découvertes à partir des données et, en collaboration avec les médecins traitants, développent des plans de traitement personnalisés pour les patients. Cette approche, appelée également médecine de précision, a le pouvoir d’aider les patients à vivre plus longtemps en meilleure santé.
La génétique joue un rôle dans la majorité des principales causes de décès aux États-Unis, y compris les maladies cardiaques, le cancer et le diabète. L’Institut collecte des données cliniques auprès de milliers de patients d’Inova nés dans plus de 110 pays différents. L’ADN unique d’une personne contient six milliards d’informations. La cartographie des codes de l’ADN en séquences génomiques permet aux scientifiques de déterminer la cause des maladies et découvrir des traitements transformateurs. Dans le cadre de ce processus, ITMI constitue également ce qui devrait être l’une des bases de données de séquences génomiques les plus vastes au monde, reliée à des informations sur les patients dans un système de santé.
« Le défi pour les chercheurs et les scientifiques d’ITMI consistait à analyser notre collection massive et complexe de données brutes plus rapidement et plus efficacement, et traduire les connaissances tirées en soins aux patients. Nous sommes désormais en mesure d’obtenir des réponses au bout de quelques minutes ou de quelques secondes, et pouvons trouver des corrélations qu’il nous était impossible de détecter auparavant, » déclare Aaron Black, chief data officer d’ITMI. « Nos chercheurs consacraient 80 % de leur temps à manipuler des données et seulement un temps infime à les analyser. Nous sommes en train d’inverser cela. Nous pouvons désormais accélérer le rythme des découvertes génomiques et changer radicalement notre façon d’interagir avec nos équipes de recherche. Nous estimons que cela améliorera notre capacité à fournir les bons traitements aux bons patients et, finalement, améliorer les chances de guérison. Cloudera a rendu tout cela possible. »
La plate-forme Cloudera a permis à ITMI d’optimiser ses analyses de données génomiques pour la recherche. L’analyse des données génomiques permet à un scientifique de bioinformatique d’étudier les corrélations génomiques chez des patients atteints d’arthrite, de maladies auto-immunes ou de cancer. Compte tenu de la taille massive des génomes entiers, ce processus pouvait auparavant prendre deux mois. À l’aide de Cloudera, ITMI est en mesure d’effectuer une analyse de données de bout en bout en une semaine. À l’avenir, ITMI compte mener à bien cette analyse de données en quelques heures seulement.
En collaboration avec Cloudera, ITMI a développé une infrastructure de bioinformatique de haut niveau pour sa collection croissante de données génomiques associées à des dossiers cliniques. L’infrastructure est conçue pour stocker et traiter cette convergence de données biologiques, à des vitesses et à des échelles parées pour le futur.
Un génome comprend plus de trois milliards de paires de bases d’ADN. ITMI étudie actuellement environ 9 000 génomes entièrement séquencés, et compte en étudier 15 000 à l’avenir. La base de données analytique de Cloudera reposant sur Apache Impala (en incubation) dote le big data d’analyses SQL haute performance. La flexibilité, l’évolutivité et la vitesse offertes par Cloudera ont permis à l’équipe d’ITMI d’effectuer plusieurs analyses haute performance simultanées sur des données génomiques recueillies auprès de mères, de pères et de nourrissons inscrits à diverses études familiales. Par exemple, ITMI a pu tirer parti de son expertise en matière d’analyse clinique et génomique pour découvrir des anomalies congénitales précédemment non diagnostiquées chez des nourrissons. Il s’agit d’un processus long et itératif, mais avec des outils tels que Cloudera, ITMI prévoit d’accélérer ces découvertes pour aider ces familles.
« L’architecture unique d’Inova pour le big data est bien adaptée à la diversité de sa communauté de patients et ses innovations. Cloudera est fier de collaborer avec ce pionnier de la génétique clinique qui fait avancer la recherche génomique et la santé personnalisée, » ajoute Shawn Dolley, industry leader, health and life science, chez Cloudera. « ITMI fait progresser la façon dont les chercheurs et les cliniciens consomment et traitent les données génomiques et moléculaires. La combinaison des données cliniques et génétiques associée au machine learning transformera les décisions en matière de soins des patients, de prévention des maladies et de santé publique de précision.»