Cloudera, fournisseur de la plate-forme de gestion et d’analyse des données la plus rapide, la plus facile à utiliser et la plus sécurisée reposant sur Apache Hadoop et les nouvelles technologies open source, annonce la disponibilité d’une solution testée conjointement avec Intel visant à développer les capacités du Machine Learning et de l’intelligence artificielle. Les tests réalisés sur Cloudera avec Apache Spark et la nouvelle bibliothèque Intel® Math Kernel Library (Intel® MKL), démontrent que l’offre combinée peut faire progresser les performances du Machine Learning sur de grands ensembles de données en moins de temps et avec moins de matériel. Les entreprises pourront ainsi accélérer leurs investissements dans l’analyse prédictive de nouvelle génération.
Cloudera est le leader du développement, de la formation et des services pour Apache Spark. Apache Spark fait progresser les techniques de Machine Learning sur des systèmes distribués grâce à des outils familiers appliqués à des échelles impressionnantes. En unissant leurs forces, Cloudera et Intel poursuivent une mission conjointe d’excellence dans le domaine de la gestion du big data, afin d’obtenir de meilleurs résultats en rendant le Machine Learning plus intelligent et plus facile à implémenter. En combinant Spark, la bibliothèque Intel® MKL et l’architecture optimisée des processeurs Intel, le traitement par le Machine Learning est en mesure d’évoluer rapidement. Les solutions de Machine Learning peuvent améliorer leur précision à mesure qu’elles ont accès à plus de données, notamment pour la maintenance prédictive, les moteurs de recommandations, la santé et la surveillance proactive, et la détection des risques et des fraudes.
« Il devient urgent d’implémenter des modèles de Machine Learning plus riches pour analyser et résoudre les problèmes métiers les plus pressants, et contribuer à la société de manière plus significative, » déclare Amr Awadallah, chief technical officer chez Cloudera. « Parmi notre base d’utilisateurs, le Machine Learning est une pratique de plus en plus courante. Lors d’une récente enquête sur son adoption, nous avons constaté que plus de 30 % des entreprises interrogées utilisent Spark pour le Machine Learning. Grâce aux progrès constants de Spark et notre collaboration avec Intel pour exploiter la bibliothèque Intel® MKL, nous estimons que Cloudera continuera de faire progresser l’utilisation de Spark Apache pour le Machine Learning dans tous les secteurs. »
Les résultats du benchmark publiés aujourd’hui, entre la solution développée conjointement et OpenBLAS et F2J BLAS, prouvent que Cloudera et Intel ont dépassé les principales bibliothèques d’accélération matérielle à chaque itération des tests, dégageant des performances exploitables avec moins d’investissements en infrastructure.
Le Machine Learning permet aux clients de Cloudera de répondre aux exigences de prédictions à partir d’ensembles de données beaucoup plus vastes. Transamerica, par exemple, utilise Cloudera pour tester et valider des modèles de données beaucoup plus rapidement.
« En tant que collaborateurs à long terme investis mutuellement dans nos technologies, l’intelligence artificielle était l’étape logique suivante. Nous pensons que le potentiel de l’intelligence artificielle est inexploité, en dépit des avancées technologiques massives et d’une implémentation croissante ces dernières années, » ajoute Michael Greene, vice president and general manager of the System Technologies and Optimization chez Intel Corporation. « Cloudera, Intel et notre écosystème, vont exploiter toute la puissance de l’intelligence artificielle pour la rendre plus rapide, plus exhaustive et encore plus intelligente. »
Accès au benchmark.