Cloudera lance Altus pour simplifier la gestion du Big Data dans le Cloud

13Le service managé pour les Data Engineers offre une toute nouvelle expérience et réduit les risques liés à la migration vers le Cloud

Cloudera, le fournisseur de la plate-forme de machine learning et d’analytics avancée, lance Cloudera Altus, une plate-forme PaaS facilitant l’utilisation d’applications de traitement de données à grande échelle dans le Cloud public. Le service Altus permet aux Data Engineers de tirer parti d’une infrastructure à la demande pour accélérer la création et l’utilisation de pipelines de données élastiques, alimentant des applications sophistiquées de traitement de données.

Les applications de data engineering, telles qu’ETL (extraction-chargement) et le scoring par lot, représentent souvent des charges de traitement volumineuses qui sont exécutées à des périodes fixes, et permettent aux entreprises d’extraire des informations critiques à partir de données brutes. Les entreprises peuvent ainsi bénéficier d’importants avantages, en matière de flexibilité et d’efficacité, de l’exploitation de ces pipelines sur des infrastructures élastiques. Elles souhaitent par ailleurs utiliser des infrastructures dans le Cloud en parallèle de leurs outils et technologies habituelles de traitement de données à grande échelle.

Le service Cloudera Altus Data Engineering simplifie le développement et l’exploitation de pipelines de données élastiques, et permet aux Data Engineers de se concentrer sur leurs travaux sans avoir à s’occuper de la gestion et de l’exploitation de l’infrastructure, qui peuvent être à la fois fastidieuses et complexes. Altus réduit également les risques associés à la migration vers le Cloud. Il fournit aux utilisateurs des outils familiers rassemblés dans une plate-forme ouverte de haut niveau, qui unifie le stockage, les métadonnées, la sécurité et l’administration pour différentes applications data engineering.

« Les charges de traitement de l’ingénierie de données sont fondamentales pour les applications modernes de traitement de données, » déclare Charles Zedlewski, senior vice president of Products chez Cloudera. « Altus simplifie le processus de développement et d’exécution de pipelines de données élastiques, tout en préservant la portabilité et en facilitant l’intégration d’éléments data engineering dans des applications plus complexes d’informatique décisionnelle, de science des données et de temps réel. »

Cloudera facilite le déploiement économique de ces charges de traitement auprès de prestataires de Cloud, tels qu’Amazon Web Services (AWS), grâce à l’élasticité du Cloud, à des options de stockage et de traitement à faible coût, et de provisionnement rapide, pour proposer un service de données moderne capable de s’attaquer aux problèmes métiers les plus difficiles. Les hébergeurs d’objets dans le Cloud tels qu’Amazon Simple Storage Service (Amazon S3) sont de plus en plus populaires en raison de leur résilience, leur évolutivité et leur coût relativement faible.

Selon IDC, les déploiements dans les Clouds publics représentent désormais 12 % du marché mondial des logiciels d’analyse métier et devraient continuer de s’étendre à un rythme annuel de 25 % jusqu’en 2020[1]. Le Cloud est l’un des environnements de déploiement qui se développe le plus rapidement pour les clients de Cloudera. Altus facilite plus que jamais la migration des charges de traitement de data engineering dans le Cloud.

Fonctionnalités et avantages d’Altus :

  • Service managé pour les pipelines de données élastiques – Cloudera Altus est une PaaS qui permet aux Data Engineers de provisionner facilement et rapidement les capacités d’Apache Spark, d’Apache Hive, de Hive sur Spark et de MapReduce2 sur une infrastructure native dans le Cloud. Altus comporte des environnements et des paramètres intelligents de cluster par défaut, qui réduisent considérablement les délais de déploiement de clusters et leur exploitation, et automatisent des processus tels que le provisionnement, la configuration et la suppression des clusters.
  • Orientation des charges de traitement – Cloudera Altus se focalise sur les pipelines de données plutôt que sur des clusters ou des infrastructures, afin que les utilisateurs puissent facilement soumettre, cloner et analyser des pipelines en n’accordant que peu d’attention à l’infrastructure sous-jacente.
  • Pas de silos de données – Le service Altus Data Engineering permet aux Data Engineers de lire et d’écrire directement dans le stockage d’objets dans le Cloud, comme le fait le reste de la plate-forme Cloudera. Ces données sont immédiatement disponibles pour d’autres charges de traitement de Cloudera, sans nécessiter de réplication de données, d’ETL ou de changements de formats de fichiers. Les utilisateurs peuvent ainsi plus facilement intégrer l’ingénierie de données dans leurs applications de base de données, d’informatique décisionnelle et de temps réel.
  • Rétrocompatibilité et portabilité de la plate-forme – Altus prend en charge différentes versions de CDH, la plate-forme open source la plus utilisée sur le marché. Les utilisateurs peuvent facilement faire migrer des charges de traitement vers et depuis le Cloud sans avoir besoin de modifier leurs applications. CDH étant rétrocompatible avec ses versions mineures, les clients peuvent exploiter les toutes dernières innovations de la communauté open source Apache sans que leurs applications ne soient affectées par les changements de versions.
  • Gestion intégrée des charges de traitement – Altus automatise et simplifie les problèmes opérationnels courants liés aux pipelines de données élastiques grâce à la gestion des charges de traitement. Les utilisateurs peuvent analyser les erreurs avec ou sans cluster, et infrastructure de traitement. La gestion des charges de traitement d’Altus détecte également les écarts de performance significatifs et propose une analyse des causes profondes. Les clients peuvent ainsi gérer leurs pipelines de données avec une plus grande fiabilité et à moindre coût.

La version initiale de Cloudera Altus prend en charge Apache Spark, Apache Hive sur MapReduce2 et Hive sur Spark. Elle est disponible dès aujourd’hui dans la plupart des régions d’Amazon Web Services (AWS). Cloudera envisage d’étendre Altus pour prendre en charge d’autres Clouds publics tels que Microsoft Azure, etc. Pour obtenir plus d’informations ou examiner l’architecture, veuillez consulter www.cloudera.com/altus.

451 Research

« Les données et les analyses, en particulier dans le Cloud, continuent d’être l’un des domaines de croissance et d’investissement le plus important pour de nombreuses entreprises. Mais les entreprises sont également confrontées à des défis liés à la gestion des clusters, au traitement des données et à la migration vers le Cloud, ce qui est justement le domaine de prédilection d’Altus. »
— James Curtis, senior analyst, data platforms and analytics

Amazon Web Services

« Les clients choisissent de plus en plus souvent AWS pour leurs charges de traitement à grande échelle. Le service Altus sur AWS permet aux clients de Cloudera de profiter du Cloud pour les traitements de données à la demande et l’optimisation des coûts grâce aux instances Spot d’Amazon Elastic Compute Cloud (Amazon EC2). »
— Ken Chestnut, global segment lead

CyberZ

« Altus nous permet de provisionner et de déployer rapidement et facilement des clusters pour l’ingénierie de données sur AWS, et permet à nos développeurs ETL d’exécuter leurs charges de travail critiques sans avoir à se soucier de la gestion et de l’exploitation des clusters. Nous sommes également ravis de pouvoir utiliser la même pile technologique dans le Cloud que celle déployée sur site pour faciliter la migration dans le Cloud. »
— Takahiro Moteki, Big Data Architect de F.O.X

Talend

« Nous sommes ravis d’être le premier prestataire à proposer l’intégration de Cloudera Altus et permettre à nos clients de déployer des projets de Big Data nettement plus rapidement en y consacrant moins de ressources. Grâce à Cloudera, nous donnons aux entreprises la possibilité d’intégrer le Big Data de manière transparente sur site ou dans le Cloud, afin qu’elles puissent gérer leurs activités sur leur infrastructure hybride sur site/dans le Cloud.
— Ciaran Dynes, VP Products

Corinne
Depuis plus de 25 ans dans le métier de la communication et du marketing, Corinne a démarré sa carrière à la télévision avant de rejoindre une agence événementielle. Curieuse dans l’âme, elle poursuit sa carrière dans l’IT et intègre une société de conseil en éditique puis entre chez un éditeur de logiciels leader sur son marché, SEFAS. Elle est ensuite nommée Directrice Communication chez MGI Digital Graphic, constructeur de matériel d’impression numérique et de finition international coté en bourse. Revenue en 2008 chez SEFAS au poste de Directrice Marketing et Communication groupe, elle gère une équipe répartie sur 3 géographies (France, Etats-Unis et Angleterre), crée le groupe utilisateurs de l’entreprise et lance un projet de certification ISO 9001, ISO 14001 et ISO 26000 couronné de succès. Pendant 7 ans membre du conseil d’administration de l’association professionnelle Xplor France et 2 ans sa Présidente, Corinne a créé dès 2010 TiKibuzz, son agence de marketing et de communication. Elle devient Directrice de la Communication en charge des Relations Presse, du Lobbying et du marketing digital chez DOCAPOST, groupe La Poste, durant 3 ans avant de rejoindre la start-up FINTECH Limonetik, en 2013. C'est cette même année qu'elle crée votre média professionnel, DOCaufutur, l'avenir du document.

More from author

Restez connectez !

Nous diffusons une Newsletter mensuelle incluant des dossiers thématiques, interviewes et investigations réalisées par nos journalistes indépendants.
Vous souhaitez recevoir notre lettre d’informations?