Comment tirer parti du paysage des données de demain ?

Cropped Favicon Economi Matin.jpg
Par Edouard Beaucourt Modifié le 15 juin 2016 à 14h38
Tirer Parti Du Paysage Des Donnees De Demain
@pixabay - © Economie Matin
2,6 MILLIARDS €En France, le cloud représente 2,6 milliards d'euros

L'Economist Intelligence Unit a découvert récemment que la majorité des dirigeants d'entreprises estiment que les données sont « essentielles » à la rentabilité de leur entreprise. Il n'est donc pas surprenant que la plupart des entreprises modernes cherchent à capturer et analyser des données.

Mais comment y parvenir ? Un large éventail de technologies et de types de déploiements est à leur disposition. Des entrepôts de données et écosystèmes Hadoop aux déploiements dans le Cloud, sur site et hybrides, le paysage des données est diversifié et il évolue rapidement.

Lorsque l’on évalue et sélectionne des outils de gestion des données pour son entreprise, il est important de comprendre les grandes tendances du marché. Cela permettra de garantir l'évolutivité des systèmes tout en tirant parti des innovations d'aujourd'hui dans le domaine de la gestion des données.

Voici trois tendances nouvelles dont une entreprise doit tenir compte lors du développement d'une stratégie de données :

1. Le centre de gravité des données se déplace vers le Cloud.

Le « Cloud » se propage dans le secteur des technologies depuis quelque temps, mais la révolution du Cloud n'a atteint les données que depuis peu. Des plateformes telles qu'Amazon Web Services, Microsoft Azure et Google Cloud Platform permettent aux entreprises de capturer et stocker aisément leurs données dans des bases de données Cloud et dans des écosystèmes Hadoop.

Si l'on prend Tableau comme exemple, nous avons constaté une augmentation de 28 % de l'utilisation de données hébergées dans le Cloud dans Tableau Online au cours des 15 derniers mois. À la fin du premier trimestre de 2016, près de 70 % des données de nos clients étaient hébergées dans le Cloud.

La gravité des données indique leur force d'attraction sur les services et applications. Si les données résident dans le Cloud, par exemple, les utilisateurs souhaiteront sans doute que leurs outils de gestion des données (du traitement aux analyses) s'exécutent également dans le Cloud. Le centre de gravité des données est maintenant directement focalisé sur le Cloud, et cette focalisation ne fera que s'amplifier à l'avenir. Il est recommandé aux entreprises créant des écosystèmes de données de concentrer leurs efforts sur des flux de travail Cloud pour faire en sorte que leurs systèmes puissent faire face à ce changement de gravité des données.

2. Dans ce déplacement vers le Cloud, les technologies de données hybrides sont déterminantes pour les activités des entreprises.

En déplaçant leurs activités dans le Cloud, les entreprises établies réalisent souvent que certaines de leurs données doivent rester sur site. Les exigences en matière de sécurité et de confidentialité, par exemple, devront sans doute être stockées derrière des pare-feu d'entreprise. Il peut arriver aussi que le déplacement vers le Cloud soit un processus lent et incrémentiel prenant plusieurs mois, voire des années. De tels scénarios révèlent le besoin de solutions hybrides.

Des bases de données hybrides peuvent être déployées à la fois dans le Cloud et sur le site de l'entreprise. S'il est impossible de déplacer toutes ses données dans le Cloud ou si un déplacement incrémentiel est préféré, les options hybrides offrent alors la flexibilité nécessaire pour faire le lien entre les données hébergées dans le Cloud et celles qui sont sur site.

Pour revenir à l’exemple précédent, les bases de données hybrides les plus utilisées dans Tableau Online sont SQL Server, MySQL et PostgreSQL. Au premier trimestre de 2016, ces trois bases de données représentaient plus de la moitié de toutes les sources de données utilisées par nos clients.

Incontestablement, les produits natifs du Cloud tels que Redshift et BigQuery gagnent de plus en plus de parts de marché. Il est cependant encore trop tôt pour voir émerger un vainqueur parmi toutes ces technologies. En dépit de la croissance constante, les sources de données natives du Cloud ne représentent qu'un quart de toutes les connexions utilisées dans Tableau Online. Les sources hybrides, en revanche, ne sont jamais descendues en-deçà de 60 %.

Gartner a récemment annoncé que ces solutions hybrides deviendraient la norme d'ici 2018. Pour les entreprises opérant une transition vers le Cloud, la technologie hybride est déjà la norme.

3. Le stockage de données se développe au-delà de nos concepts de bases de données traditionnels.

Avec l'avènement de l'Internet des Objets (ou IoT, Internet of Things), les données proviennent dorénavant de partout. Par conséquent, le paysage de capture et de stockage s'est étendu pour répondre aux exigences de flux de données nouveaux et variables.

Les outils de données hébergés dans le Cloud en particulier favorisent cette expansion avec des produits offerts « en tant que service ». Les nouveaux-venus tels que Snowflake repensent la mise à disposition de bases de données, tandis que les solutions hébergées telles qu'Amazon Elastic MapReduce ont étendu les fonctionnalités des écosystèmes Hadoop traditionnels.

Pour reprendre le même outil d'analyse dans le Cloud en tant qu'exemple, plus de 40 types de sources de données sont représentés dans Tableau Online. Même lorsque les sources basées sur des fichiers telles qu'Excel et les applications Web telles que Google Analytics sont exclues, 32 types distincts de bases de données et d'écosystèmes Hadoop sont représentés. Cette diversité illustre la gamme vaste et variée d'outils de données disponibles aujourd'hui.

Et cette gamme n'a pas fini de grandir ! D'après une étude de Gartner, les bouleversements accélèrent l'innovation dans les outils d'entreposage conçus explicitement pour l'analyse de données. Par conséquent, les entreprises doivent connecter leurs outils d'analyse pas seulement à une, mais à plusieurs sources de données réparties dans des bases de données, des écosystèmes Hadoop et des applications Web.

Pour tirer parti de ce rythme effréné d'innovation que connaissent les données, créer un flux de données qui donne la priorité à la flexibilité et au choix avant tout est un point essentiel.

Remarque :
Les informations contenues dans cet article sont basées sur des données anonymes d'utilisation de Tableau Online. Elles excluent les sources de données basées sur des fichiers de type Excel et les applications Web d'entreprises telles que Salesforce.com et Google Analytics. Étant donné que nous représentons un outil hébergé dans le Cloud, les tendances risquent de représenter un parti pris en faveur du Cloud. Cela dit, les données sont un indicateur précis de tendances plus larges sur le marché.

Une réaction ? Laissez un commentaire

Vous avez aimé cet article ? Abonnez-vous à notre Newsletter gratuite pour des articles captivants, du contenu exclusif et les dernières actualités.

Cropped Favicon Economi Matin.jpg

Edouard Beaucourt est Directeur Régional France, Suisse Romande et Afrique du Nord chez Tableau Software, acteur mondial dans le domaine des logiciels d’analyse de données simples d’utilisation.