• コラボレーター
  • SELECK編集部
  • 舟迫 鈴

データ戦略のための3つのトレンド データまわりの急激な環境変化とは

エコノミスト誌 (The Economist) による最近のレポートによれば、ビジネスリーダーの大多数が、組織の収益性向上にデータが「不可欠」であると考えています。

実際に 近年では、データを取り巻く環境も急速に変化しており、データウェアハウスや Hadoop エコシステムから、クラウド、オンプレミス、ハイブリッド型などのテクノロジーが展開されています。

今回は、企業がデータ戦略を策定する際に考慮するべき、3 つの新たなトレンドを紹介します。

1. データグラビティの中心が「クラウド」に移行しつつある

このところ「クラウド」がテクノロジー業界を席巻しています。 しかし、クラウド革命が「データ」にまで及んできたのは最近のことです。Amazon Web Services、Microsoft Azure、Google Cloud Platformのようなプラットフォームの登場によって、企業がデータを収集して、クラウドデータベースやHadoopエコシステムに保存することが容易になりました。

Tableauを例に挙げると、Tableau Onlineでは、過去15か月間にクラウドでホストされるデータの使用が28%増加しています。 2016 年の第一四半期には、Tableauのお客様のデータの70%近くがクラウドでホストされていました。

データグラビティとは、データが活用する「アプリケーション」にも影響を与えるさまを言います。 例えば、自社のデータがクラウドにあれば、データの処理や分析を行うツールも、同じくクラウドで実行したくなるといったことです。

データグラビティの中心は今やクラウドにあるため、データエコシステムを構築する企業は、クラウドでのワークフローに注力する必要があります。

2. クラウドへの移行において、ハイブリッド型データテクノロジーが不可欠

企業が業務をクラウドに移行する際、オンプレミスで保管しなければならないデータを抱えていることがよくあります。 例えば、セキュリティやプライバシーの要件により、企業のファイアウォールの内側にデータを保存しなければならない場合があります。 また、業務をクラウドに移行するのは、数か月、数年単位で時間がかかる場合があります。 そのため、ハイブリッド型ソリューションの需要が高まっています。

ハイブリッド型データベースは、クラウドとオンプレミスネットワークの両方に展開することができます。

例えば、Tableau Onlineで使用されている最も一般的なハイブリッド型データベースには、SQL Server、MySQL、PostgreSQLがあります。 2016年の第一四半期では、これら3つのデータベースが、Tableauのお客様の使用するすべてのデータソースのうちの半分以上を占めていました。

RedshiftやBigQueryのようなクラウドネイティブの製品が市場シェアを伸ばしていることは間違いありません。 しかし、クラウドでの優位性を確立したというには、まだ時期尚早でしょう。成長は続いていますが、クラウドネイティブのデータソースは、Tableau Onlineで使用される接続全体では四分の一を占めているに過ぎません。これに対して、ハイブリッド型のソースは、60% を下回ったことはありません。

Gartner(ガートナー)社が最近発表した予測では、こうしたハイブリッド型の製品やサービスは、2018 年には標準になるとされています。 クラウドへの移行を進めている企業では、ハイブリッドは既に標準となっています。

3. 従来のデータベースの概念を超えたデータストレージが広がりつつある

モノのインターネット (IoT) が出現したことで、今ではあらゆるモノや場所からデータが流れるようになっています。その結果、多様に変化するデータストリームの要件に対応するため、データの収集および保存の環境がその幅を広げています。

特に、クラウドベースのデータツールは、「as a Service 型」の製品によって、この広がりをリードしています。 新たに登場したSnowflakeなどでは、データベースの提供方法が見直されており、Amazon Elastic MapReduce のようなホスト型のソリューションでは、従来のHadoopエコシステムの機能が拡張されています。

再びTableauのクラウド分析ツールの例を見ると、Tableau Onlineでは、40種類以上のデータソースが使用されています。 Excelのような「ファイルベースのソース」や、 Googleアナリティクスのような 「Webアプリケーション」を除いても、32種類のデータベースおよびHadoopエコシステムが見られます。この種類の多さは、利用可能なデータツールの幅広い多様性を示すものです。

今後も、データに関する製品やサービスは増加していくでしょう。 Gartner(ガートナー)社は、このような乱立状態が、データ分析を目的とした、データウェアハウスツールのイノベーションを加速させていると見ています。

そのため、分析ツールは「単一」のデータソースではなく、データベース、Hadoopエコシステム、Webアプリケーションなどの幅広い複数のデータソースに接続できる必要があります。

データ環境において、猛スピードで進むイノベーションのメリットを享受するには、何よりも「柔軟性」や「選択肢の幅広さ」を重視したデータワークフローを構築する必要があると考えています。

注: この記事のデータは、Tableau Online の匿名での使用から抽出したものです。 Excelなどのファイルベースのデータソース、および Salesforce.comやGoogle アナリティクスといったビジネスに特化した Webアプリケーションは除外しています。 クラウドベースのツールについては、全体的にクラウドに偏った傾向が出ている可能性があります。 それを考慮しても、データは、広く市場を捉えたトレンドを正確に示すものとなっています。

;