データ分析とは何か

データ分析は、統計解析統計的推定または統計的仮説検定を用いてデータを解釈することなどの手法を用いて、ビジネスにおける意思決定や効率化を支援するとりくみです。デジタルデータコンピューターで処理可能な0と1の系列に変換された映像・音・数値・テキストなどのデータは単なる0と1の記号の羅列にすぎないため、そのままではビジネスの役に立ちません。データを現実社会の事象と対応させて、ビジネスへの影響を示唆し、効果的な戦略につなげるしくみが必要です。これは、観測されたデータにもとづいて、現実の事象の分析モデルを作ることにより達成されます。

データ分析が必要とされる背景

近年、データを扱うコストは急速に下がり続けています。

データを収集するIoTセンサネットワークに接続して検出した情報を収集・管理できるセンサの価格はここ10年で50%以下に下落しました。クラウド技術インターネットなどの通信ネットワークを通じて、計算資源を遠隔からサービスとして利用する技術の進展は、信頼性の高いストレージデータを長期間保存しておくための装置。遠隔のストレージにデータを保管するサービスをオンラインストレージというの利用を容易にし、データ蓄積のコストを押し下げています。インターネットを通じたデータ転送のMbps1秒間に10の6乗ビットのデータ転送ができる通信速度あたりの価格は毎年30%以上の割合で下降しています。データを処理する計算機の価格はここ10年で7割以下になりました。

こうした変化は、デジタルデータを活用する企業戦略のパフォーマンスを高めます。米国のGAFAGoogle(持株会社Alphabet)、Amazon、Facebook(現Meta)、Appleの4社の総称によるビッグデータ高ボリューム、高速度、高バラエティのいずれかをもつ情報資産。新しい形の処理を必要とし、意思決定の高度化、見識の発見、プロセスの最適化に寄与する収集・蓄積の寡占は2018年頃にはすでに問題視されていました。またユニコーン企業創業10年以内で10億ドル以上の評価額が付けられている非上場のベンチャー企業のほとんどはデジタルデータの活用により価値を生む業種に属します。国内でも、顧客トランザクション顧客との取引データやセンサデータの活用割合が5年前の倍以上に増えています。※1 また、社会インフラが未成熟な新興国でも、スマートフォンを介したインターネットサービスの利用が広がっています。そしてパーソナルデータ個人に関する情報のデータ。必ずしも個人を識別できないものも含むを活用する新たなデジタルサービスの出現と利用者の爆発的な増加が見られます。

データ活用の急速な広がりとともに、データをビジネスに役立てるための分析を必要とする場面も増えています。

PoC(Proof of Concept)

データ分析で何をするか

活用判断

データから抽出された情報をどう活用するかはヒトの判断に委ねられています。この判断は容易ではありません。例えば、99.9%の高い精度で予測できるモデルがあるとして、予測結果をそのまま業務上の判断に使えるでしょうか? 仮にこれが、歩行者の存在を判定する画像認識モデルだったとします。このモデルを自動運転車に搭載すると、1000人にひとりの歩行者を轢きながら走行を続ける危険な車両ができてしまいます。これはロッタリー・パラドックス※2と呼ばれる問題の例で、モデルの予測を業務上の判断にとり入れる際に避けて通れない課題です。このパラドックスの満足な解決は知られていません。

PoC(Proof of Concept)

実務上は、モデルのアウトプットの固定的な運用方法を設計し、運用方法の是非について合意を形成するプロセスを経て、業務に導入することが行われます。合意形成を容易にするために、多くのケースでは、PoC(Proof of Concept)新しいアイディアなどの実証を目的に、事前に実現可能性や事業効果を検証することと呼ばれるビジネス効果のデモンストレーションが行われます。デモンストレーションには机上シミュレーションや実証実験といった手段が使われます。机上シミュレーションでは、実運用時の条件を適切に反映すべきです。また、実証実験では、ビジネスインパクトのモニタリング方法を十分に検討してから走り始めるべきです。

ゴール設定

データ分析のプロジェクトは、異なる文化と思惑を持つ多様なステークホルダーが密に連携して、不確実性の高い試行をくり返していく困難な営みです。座組みによりますが、データの保有者、既存システムの運営者、業務プロセスの実施者、システム開発の受注者、ITコンサルタント、分析業者、要素技術の研究機関、など多様な人々が参画する可能性があります。プロジェクトが迷走しないために、参画者のあいだでゴールの目線合わせができていることは重要です。ゴール設定にあたり、ビジネス課題が発生するしくみの仮説を立て、優先度の高い問題の解決を目標とすべきです。また、現実的な設定にするためにクライアントの期待値コントロール期待値マネジメント。クライアントの期待値を事前に下げることも同時に行います。

ビジネス・インパクト

収益インパクトを定量目標にできれば理想です。しかし、すくなくとも企業グループの内製エンジニア集団としての実践においては、明確なインパクトを算定できない分析案件がかなりの割合を占めます。そのような案件では、根拠のない精度目標をゴールとして分析が進んでしまい、導入を判断するタイミングになってから初めて課題設定の悪さがあらわになることもあります。

明確なインパクトの算定が難しい理由として、下記の3つが考えられます。

取り組みの効果に至るまでに、他の取り組みを必要とする。
多くのビジネス課題は複数の原因が複雑に絡まりあって発生しています。ひとつの原因を改善しても、本来の課題は解決できないことがあります。こうしたケースでは、課題解決に至るまでの長期的なロードマップを描く必要があります。現在の取り組みをロードマップの中に位置づけ、課題解決に向けた前進を評価します。
取り組みの効果に、観測できない内部要因が影響する。
組織の意思決定は、様々な情報を考慮して総合的に行われます。情報のひとつでしかない分析結果が、最終的な意思決定の内容や質にどう貢献するかを見積もることは困難です。こうしたケースでは、ユーザの声やアンケート結果などの定性的な効果指標を使う対処が考えられます。
取り組みの効果に、不確定な外部要因が影響する。
ビジネス環境の変化に適応するための分析では、収益インパクトを算定できないことがあります。特に、BtoBビジネスのための分析の多くでは、ABテスト的な検証が実施できません。また、よほど条件が揃わない限り収益変化への寄与も推定できません。こうしたケースでは、組織の改善に着目した効果評価を行う対処が考えられます。

組織の改善

分析のアウトプットを業務に導入する際には、意思決定フローの変更が発生します。これは多かれ少なかれ組織の変更を意味します。経営学者のH.Mendelsonは情報化時代における組織は以下の5つの原則に基づくべきだとしています。※3

情報認識
組織の外部環境についての認識を促進する。(マーケット、新技術、顧客の嗜好変化など)
意思決定アーキテクチャ
意志決定権を適切な知識と同じ場所に割り当てる。(適切なインセンティブとともに権限を非中央集権化するなど)
知識の透明性
組織内における知識や情報の拡散を改善する慣行、技術、システムがある。
アクティビティフォーカス
より絞り込まれた活動に専念することで、複雑さや情報負荷を軽減する。
情報化時代のネットワーク
コア領域以外の活動は、パートナー企業のネットワークに委託する。

Mendelsonは、特に変化の激しい事業領域において、これらの能力が高い組織は収益性と成長性が高いと主張しています。分析施策の定量評価が難しいケースでは、これらの能力の改善を目標とする対処も考えられます。

まとめ

この記事では、データ分析に興味のあるビジネスパーソンの方を対象に、活用判断や目標設定にまつわる問題をお話ししました。これらは、私たち分析者にとっても、正解のない難しい問いです。これらの問題提起が企画を練るヒントやきっかけになれば幸いです。

この記事の後半では、実現可能性の問題を考えます。Insight Edgeへご相談に来てくださるビジネスパーソンの多くは、分析技術に過剰な期待か、逆に不信感をお持ちです。現代の分析技術の限界はどの辺りにあるのか、また、分析前提に応じてどのような手法の選択が適切か、といった問題についてお話しします。