Cloudera Data Science Workbench enfin disponible !

L’outil se dote de capacités de Deep Learning et compte parmi ses 1ers clients l’Office of National Statistics du Royaume-Uni

Cloudera, fournisseur de la plate-forme de gestion et d’analyse des données la plus rapide, la plus facile à utiliser et la plus sécurisée reposant sur Apache Hadoop et les nouvelles technologies open source, annonce la disponibilité de Cloudera Data Science Workbench, son outil en « libre-service » pour les Data Scientists. Annoncé en version bêta durant le salon Strata+Hadoop World San Jose 2017, la solution met la Data Science à portée des entreprises, pour une utilisation rapide, simple, en libre-service, et en toute sécurité.

« Nous entrons dans l’âge d’or du Machine Learning, où tout tourne autour de la donnée. Malgré cela, les Data Scientists rencontrent toujours autant de difficultés à créer et tester de nouveaux projets d’Analytics aussi rapidement qu’ils le souhaitent, en particulier dans les environnements à grande échelle, » déclare Charles Zedlewski, senior vice president, Products, chez Cloudera. « Data Science Workbench est un outil en libre-service qui permet d’accélérer le développement, l’adaptation et le déploiement de solutions de Machine Learning à l’aide des technologies les plus puissantes. Cela signifie que les Data Scientists ont désormais la possibilité de collaborer, de partager et de gérer leurs données de la manière qui convient le mieux à leurs besoins et à ceux de leur entreprise, facilitant et accélérant la mise en production. »

Avec Python, R et Scala directement intégrés au navigateur web, Cloudera Data Science Workbench autonomise la Data Science. Il permet aux utilisateurs de télécharger et d’utiliser les frameworks et les bibliothèques les plus modernes pour des projets personnalisés. Cloudera Data Science Workbench est à la fois sécurisé et conforme. Il prend en charge l’authentification, l’autorisation, le chiffrement et la gouvernance de Hadoop. L’Office of National Statistics (ONS), le plus grand émetteur indépendant de statistiques officielles au Royaume-Uni, compte utiliser Cloudera Data Science Workbench pour créer des études statistiques répétables, précises et transférables.

« Nous avons réduit les délais de développement de modèles et bénéficions d’une meilleure visibilité au niveau du suivi des progrès et des résultats, » explique Simon Sandford-Taylor, Chief Technology Officer chez l’Office of National Statistics. « Nous pensons que Cloudera Data Science Workbench devrait nous permettre d’accélérer notre calendrier de publication et d’en tirer de meilleures pratiques. »

Cloudera Workbench Data Science s’intègre facilement à de nombreux frameworks de Deep Learning, dont BigDL, une bibliothèque de Deep Learning d’Intel en open source pour Apache Spark. Entièrement conçu pour fonctionner sur une infrastructure Spark/Hadoop distribuée, et optimisée pour les processeurs Intel® Xeon® (exploitant la bibliothèque Intel® Math Kernel), BigDL s’intègre directement à Cloudera Data Science Workbench.

« Les utilisateurs en entreprise ont besoin d’une plate-forme cohérente pour étendre leurs solutions d’analyse et maximiser leurs investissements. L’intégration native de BigDL avec Apache Spark rapproche le monde du deep learning de l’écosystème Apache Spark, et apporte une plus grande valeur aux clients, » ajoute Michael Greene, vice president and general manager, System Technologies and Optimization, Software and Services Group, Intel Corporation. « Le framework BigDL permettra aux clients de mieux utiliser les investissements existants pour développer leurs moyens d’analyse grâce à des performances optimisées sur l’architecture Intel®. »

L’intégration de BigDL dans Data Science Workbench offre l’avantage de pouvoir utiliser des bibliothèques et des tactiques de Deep Learning avec l’architecture du processeur sans recourir à du matériel ou un environnement distinct supplémentaire. Cette combinaison fournit un moyen pratique de créer des conduits de données Spark de manière native, et de les intégrer à la bibliothèque de Deep Learning (BigDL) et à d’autres composants Spark/Hadoop dans Cloudera Data Science Workbench.

Corinne
Depuis plus de 25 ans dans le métier de la communication et du marketing, Corinne a démarré sa carrière à la télévision avant de rejoindre une agence événementielle. Curieuse dans l’âme, elle poursuit sa carrière dans l’IT et intègre une société de conseil en éditique puis entre chez un éditeur de logiciels leader sur son marché, SEFAS. Elle est ensuite nommée Directrice Communication chez MGI Digital Graphic, constructeur de matériel d’impression numérique et de finition international coté en bourse. Revenue en 2008 chez SEFAS au poste de Directrice Marketing et Communication groupe, elle gère une équipe répartie sur 3 géographies (France, Etats-Unis et Angleterre), crée le groupe utilisateurs de l’entreprise et lance un projet de certification ISO 9001, ISO 14001 et ISO 26000 couronné de succès. Pendant 7 ans membre du conseil d’administration de l’association professionnelle Xplor France et 2 ans sa Présidente, Corinne a créé dès 2010 TiKibuzz, son agence de marketing et de communication. Elle devient Directrice de la Communication en charge des Relations Presse, du Lobbying et du marketing digital chez DOCAPOST, groupe La Poste, durant 3 ans avant de rejoindre la start-up FINTECH Limonetik, en 2013. C'est cette même année qu'elle crée votre média professionnel, DOCaufutur, l'avenir du document.

More from author

Restez connectez !

Nous diffusons une Newsletter mensuelle incluant des dossiers thématiques, interviewes et investigations réalisées par nos journalistes indépendants.
Vous souhaitez recevoir notre lettre d’informations?