Yuya Karubeさん
  • コラボレーター
  • SELECK(How to)
  • Yuya Karube

新規Webサービスにおけるアクセス解析入門・その2:BigQuery・Re:Dash編【SELECKの事例を公開】

  • -
  • このエントリーをはてなブックマークに追加
    -
  • tweet

新規サービスのアクセス解析入門、その1では、SELECKチームが実際にUser Insightを導入した事例を紹介しました。今回はその次のステップとしてGoogle BigQueryと、ダッシュボードツールのRe:dashの活用についてまとめます。

Re:dash

各社のビッグデータ解析事情

Google BigQueryは、大量のデータ解析を可能にするソリューションです。Google BigQueryで13万人超の登録者の行動を解析し「在宅ワークを当たり前に」の記事で述べられている通り、データを貯めておくコストが比較的安いということが特徴です。

日々大量の解析クエリを発行するわけではない我々にとって、データを貯めておくコストが安く、解析ごとに課金されていく仕組みが丁度よかったのです。

ビッグデータの保存・解析にはTreasure Dataも人気があります。「50億分の1」アクセスも取りこぼせない!マクロミル流・ビックデータ解析術では、月間50億アクセスにも及ぶWebサービスの事例が紹介されています。

SELECKチームはデータ解析のノウハウを作っていく段階なので、トライ・アンド・エラーを繰り返せるようにコストが安いBigQueryを導入しました。

マスタデータを合わせて解析できる

BigQueryに保存しているデータは主に2つあり、それぞれ別の方法でBigQueryに転送しています。

  • サーバーのアクセスログ・コンバージョンログをfluentdで転送
  • MySQLのマスタデータをバッチ処理でBigQueryに転送

アクセスログにマスタデータを掛け合わせることで、アクセス解析ツール以上の効果を発揮します。SELECKでは、「PVの多い記事はどのようなタグが付いているのか」「どの記事がユーザー登録の起点になりやすいのか」といった、記事の性質を確認するために活用しています。

Google BigQuery

非エンジニアもSQLを書ける環境を整える

また、BigQueryにマスタデータを同期するメリットはもう一つあり、簡単なSQLさえ書ければユーザー情報を取得する事が容易になります。今までは安全性や構築コストの問題から、ビジネスサイドが直接データベースに触れる環境を用意していませんでした。BigQueryならWeb上からクエリを実行でき、誤ってデータを削除される心配もないので、データベースを簡単に開放できます。

それ以前は、例えば「メールマガジン送信用のメールアドレスを取得したい」という要望にもエンジニアが対応する必要がありました。しかしBigQuery導入後は、ビジネスサイドの人がものの数分で情報を取得出来るようになりました。

1点、BigQuery導入時に気をつけておいたほうが良いポイントが、テーブル名をpv_20160120のような形式に統一することです。日付部分に-_を入れてしまうと、後々テーブルを集約したQueryを書くときに苦労します。monthlyのテーブルであれば、pv_20160101のように01を付けてテーブルを作成すると良いでしょう。

Google BigQuery

データの保存の後は可視化を

BigQueryのようなデータ蓄積ツールを導入した後は、それを可視化するダッシュボードツールの導入をオススメします。

データの可視化には1日90分に集中する大量アクセスをさばく! スマホゲームのレスポンス高速化の手法とはの記事で紹介したKibanaや、WEBサイトの数値データを自動で集計・グラフ化!意思決定を加速させた仕組みとはで紹介したTableauなどがあります。

▼BIツール「Tableau」

Tableau

株式会社マナボの事例記事では、OSSのダッシュボードツールRe:dashが紹介されています。SELECKでは、この取材に行った翌日にRe:dashの環境を構築して活用をはじめました。

▼実際にSELECKで使っているRe:dashのダッシュボード

Re:dash

Re:dashの導入は簡単

Re:dashは、AWSやGoogle Cloud Platform(GCP)などの任意のサーバー上に構築できます。弊社ではメインのデータソースとしてBigQueryを使うことを想定していたので、GCPのGoogle Compute Engine上に構築しました。専用のイメージが公開されているため、難しい設定はなく手順に従うだけで完了しました。

Re:dashのページ上でQueryを登録でき、Queryの実行タイミング(更新タイミング)を指定することでダッシュボード化が出来ます。グラフの種類もいくつも選択できるため、PVの推移や人気記事のランキングなどサービスに合わせたグラフを作れます。

▼Queryを書くだけで、さまざまなグラフを作成できる

Re:dash

まとめ

2回にわたってSELECKチームのアクセス解析の遷移を書きました。リリース当初よりはノウハウが溜まってきましたが、まだまだBigQueryもダッシュボードも活用の余地が残されていると思います。まだアクセス解析を初められていないチームがありましたら、各社の事例を参考に始めてみてはどうでしょうか?

  • -
  • このエントリーをはてなブックマークに追加
    -
  • tweet