• データ&ストーリー LLC
  • 代表
  • 柏木 吉基

データ分析の前に、見るべきものとは?エグゼクティブを説き伏せる、データ分析術

〜「主観的な提案は一蹴される」環境で、徹底的にデータに基づいた提案を作ってきた柏木 吉基さんの、データ分析術に迫る〜

ビッグデータ、IoTなどにより、世の中に流通するデータ量は飛躍的に増えた。その結果、データをビジネスに活かせるかどうかが、成果に大きな差を生むようになった。

今や、データ分析が専業ではない普通のビジネスパーソンにも、データ分析の技術が求められつつある。

日産のカルロス・ゴーンCEOを始め、多くの外国人役員の元でビジネス改革、社内変革を手がけ、独立後は様々な会社へデータ分析の研修を提供する、データ&ストーリー LLC代表の柏木 吉基さん。

柏木さんは、「主観的な提案は一蹴された」という日産在籍時から、徹底的にデータに基づいた提案を続けてきた。

今回は、「データ分析は、データをこねくり回す力より、目的や仮説を考える力が重要」と語る柏木さんのデータ分析術について、詳しく伺った。

「データ」と「ロジック」が伴わない提案は一蹴!

2004年から日産で海外マーケティング&セールス、社内改革などを手がけました。2014年に退職をし、今は独立して様々な会社にデータ分析活用のための研修を提供しています。

日産は、完全に外資系の会社です。勘や経験から行う提案は「主観的」と判断され、エグゼクティブには容赦なく一蹴されます

日産の社内では、データとロジックを徹底的に見る文化があり、常に新しいことをしようという姿勢で、そのためのアイデアはウェルカムでしたね。そういった環境だったからこそ、データ分析の力が鍛えられたのかもしれません。

ある時、世界中のパートナーに対する評価制度を統一するという提案をしました。提案前は、世界の各拠点で評価の方法がバラバラで、組織が縦割りになっていたんです。アフリカに優秀な人材がいたとしても、中南米に送り込むことができないような状態でしたね。

その状況をデータを元に分析し、同じような指標で評価をして人材の共通化が図れるような制度をゴーンCEOに提案したところ、実行させてもらえることになりました。しっかりとデータとロジックをもとに提案すれば、受け入れてもらえるチャレンジングな環境でしたね。

データ分析によくある誤解とは?

今では、多くの企業に研修をさせていただいているのですが、データ分析に対する誤解が多いと感じています。「データ分析をしてください」と言うと、何も考えずにいきなり様々なデータを見始める人がほとんどです。過去数年分の会社の売上推移を棒グラフにする、前年比の伸びを折れ線グラフにする、といったことを始めます。

目の前にあるデータに、統計学や分析ツールといった新しいフィルターを通すと、今まで見えてなかったことが次から次に見えてくると思っている人が多くて。「データから答えが見える」と、誤解しているんです

この方法では99.9%何も見えてきません。その理由は、何かしらの結果を示すデータをいくら眺めていても、「データが分析者の知りたい答えを勝手に表してくれることはない」からです。

データ分析は、結果の裏側に潜む様々な問題の原因を探り、解決策を出すために行うものです。結果のデータを眺めるだけでは、何も答えは出てきません。あるべきプロセスは逆です。

仮説を立てた上で、その仮説の正当性を検証するためにデータを活用します。つまり、「仮説からデータ」という流れが正しいんです

▼データ分析の順序


「今はビッグデータだから仮説なんて立てる必要ない」という論調も稀に目にしますが、それが「データサイエンティスト」の世界の話であって、一般実務家には当てはまりません。

また、データ分析というと、データサイエンティストが高度な分析手法を用いて行うものだという誤解も多いです。実際はそうではなく、私が実践してきたデータ分析は、考え方さえ身につけてしまえば、エクセルの簡単な関数を使えばこと足りる領域です。

仮説を立てる前に、徹底的に目的を考える

では、仮説を立てるためにすべきことは何でしょうか。当たり前のように聞こえるかもしれませんが、まずはデータ分析の目的を徹底的に考え、言語化することです

目的とは、「あなたはデータ分析をして何が知りたいの?」ということです。1秒以内に答えられなければ、データ分析の手を動かさずに、再度目的を考えたほうが良いと思います。

例を挙げると、過去に手掛けたプロジェクトに、「新潟県の燕市が観光新興をしたい」という話がありました。このプロジェクトでも、まずは目的を徹底的に考えました。

燕市の観光振興をしたい、というのは「それって具体的にどういうことなんだっけ?」と目的を何度も掘り下げて考え、具体化していきました。観光振興しているとはどういう状態なのか、観光振興で喜ぶ人は誰なのかと。


観光には、行政、観光地のお土産屋さん、観光客、などの様々な主体が関係しますが、最終的には観光振興とは「観光客の満足度を上げること」とプロジェクト内で定義しました。そして、目的を「観光客の満足度を上げるためにはどうすべきか知りたい」と設定しました。

「観光振興をするためにどうすべきか知りたい」と「観光客の満足度を上げるためにどうすべきか知りたい」では、出てくる仮説が全く変わりますよね

仮説をデータで検証し、間違った仮説を排除していく

目的を設定したあとも、いきなりデータを眺めるのではなく、まずは仮説を立ててからデータを確認します。観光振興の例で言うと、観光客の満足度を上げるためにいくつかの仮説を立てました。

例えば、「観光客は東京近郊から新潟までわざわざ新幹線で来るので、主要な観光地が一度に効率的に回れると満足度が上がるのではないか」という仮説です。

ここでやっとデータの出番です。この仮説が正しいのか、周辺の自治体である新潟市、長岡市、三条市などから、観光客数トップスリーの観光地を調査しました。観光地にどのくらいの観光客が訪れているかは、オープンデータで取れます。

そこから地図を用意して、各自治体のトップスリーの観光地を定規で結び三角形を作りました。この三角形の辺の和が長ければ長いほど観光地が分散していて、短ければ密集しているということです。

▼トップスリーの観光地の距離と観光客数の関係


結論としては、主要観光地が密集している自治体に観光客がたくさん来ているとは限りませんでした。

データで確かめずに、勘を頼りにプロジェクトを進めていたら、行政サービスの一つとして、遠い観光地をつなぐバスを運行させていたかもしれません。それってすごく税金の無駄になってしまいますよね。

いくつもの仮説をデータで検証することで、結論に辿り着く

その後、いくつかの仮説をデータで確認しながら、最終的には「自分たちの自治体だけではなく、周辺の自治体の観光地と補完関係を作れたら、観光客の満足度が上がる」という仮説を立て、燕市に提案しました。

自治体の人は、自分たちの自治体にいかに人を呼び込むかということを考えています。ただ、観光客からすると、この観光地がどこの自治体なのかというのは関係ありません。そこで、周辺の自治体の主要観光地とセットで回っているのではないかと考えたんです。

そして実際に、周辺自治体のデータを見ると、自治体ごとに力を入れているカテゴリーが違いました。


このデータを見たことで、「周辺の自治体と、観光の目的やカテゴリーにおいて補完関係を作れたら、観光客の満足度が上がる」という仮説に確信が持てました。

高度なデータ分析手法も、ロジカルシンキングが無ければ動かない

このように、データ分析には、データをこねくり回す力より、目的や仮説を考える力が必要です。つまりロジカルに物事を突き詰める、ロジカルシンキングが重要です。データ分析を行う上で、ロジカルシンキングはいわばOSです。分析手法やデータはあくまでもアプリケーションでしかなくて、OSが入っていないと動かないんです。


データサイエンティストのような専門的な方々だけでなく、普通のビジネスマンがデータ分析をするためのソフトスキルを、今後も広めていきたいと思います。(了)

;