最新情報
2025.10.12

Ride the WAVE 2025 -初心者のためのデータ分析ワークショップ-③(9月30日:複数の要因から本当の原因を見つけよう【重回帰分析】)

Ride the WAVE 2025 ~初心者のためのデータ分析ワークショップ~

第3回を9月30日(火)にクロスパルにいがたの交流ホールにて開催しました!内容の一部をご紹介します。

 

 

「データがない」から「今あるデータで何ができるか」へ

ワークショップは、93日開催の第1回の振り返りからスタートしました。参加者の皆様からは、学んだことを自社でどのように活かしたかについて発表がありました。

参加者からの「分析用のデータが不足している」という悩みに対し、講師である株式会社博報堂コンサルティングの森泰規氏は次のようにアドバイスしました。 【『データが集まるのを待つより、今あるもので何ができるか』へと発想を転換することが重要で、サンプル数が少なくても分析は可能】 データの不足に目を向けるのではなく、今あるものに注力する大切さを説く言葉が、非常に印象的でした。 続いて、前回ワークショップの補足として、分析ツール、サンプルデータサイズ、無作為抽出について説明がありました。

 

 

実践演習で「仮説発見」のプロセスを体感

1回の記念講演で米倉誠一郎教授が紹介した「新規顧客の獲得は既存顧客の5倍の労力がかかる」という定説に触れ、「これをどう解釈するかは一概には言えない」と前置きした上で、具体的な演習に移りました。

ある水族館のサンプルデータを題材に、どのような分析計画を立てるか、各グループで議論。参加者からは「気温のデータが欠けている」「月ごとに見てはどうか」など、活発な意見が出ました。

その後、森氏からサンプルデータの現象を確認した上で、その現象をどう考え、目的をどう設定するかという具体的なお話がありました。そして、分析プロセスモデル「CRISP-DM」を基に分析計画の立て方を紐解いていきました。さらに、分析ツール「Orange Data Mining」を使い、来場者の分布をグラフで見て値の出現を確認し、推測を立てる演習も行いました。

 

 

予測モデルの罠?「重回帰分析」を学ぶ

次に、不動産価格のサンプルデータを用いて、【重回帰分析】の説明が行われました。重回帰分析とは、複数の説明変数と目的変数の関係を分析するための統計的手法のことです。

注意点として、説明変数同士の相関が強すぎると分析結果が歪んでしまう「多重共線性」についても解説がありました。さらに、プレミアリーグの架空データを用いて観客動員数を考察。このケースでは、予測精度が高くても、個々の要因の解釈が直感に反する結果となる例が示され、【結果の解釈には慎重さが必要である】と学びました。

 

ケーススタディ:アルビレックス新潟レディースの来場者数をどう増やすか?

最後のケーススタディでは、これまでの内容を活かすべく、アルビレックス新潟レディースの全11試合のデータを基に、「来場者数を最大化するにはどうすればいいか?」という課題に対し、各グループで分析計画と施策を議論しました。

森氏は、ここでの目的は統計的な「証明」ではなく、【次の一手につながる「仮説の発見」】であると強調。 「『もっとデータが欲しい』という意見は実務でもよく出ますが、まずは手元のデータで価値ある洞察を示し、信頼を得ることが次のデータ提供につながるのではないか」と、普段の実務からの実感をご教示いただきました。

無料のワークショップにしては、非常に濃い内容で充実した時間だったのではないでしょうか。ご参加いただいたみなさま、ありがとうございました。次回のワークショップも、ぜひよろしくお願いいたします。

 

IPCよりお知らせ~

今回の連続ワークショップは、3回と4回だけ参加する、2回と3回だけ参加するなど、通し参加でなくともOKですので、ぜひ参加を前向きにご検討ください。

なお、参加する場合、パソコンあるいはMacなどのノートパソコンをご持参ください(タブレットや携帯電話ではなくノートパソコンがおすすめです)。ノートパソコンをご持参いただかなくとも、データ分析の神髄に触れることは可能ですが、ノートパソコンがあった方がデータ分析に対する理解が深まるためです。

イベント詳細はこちらから。参加申し込みはこちらです。

 

メールマガジン登録 Mail Magazine

新潟IPC財団メルマガに登録すると、新潟のビジネスに役立つ情報をお届け!ぜひご登録ください。