クラスタリングとは | 分類との違いや種類、マーケティングへの活用例を解説

口コミアカデミー 0円すべて無料 口コミサイトの運営やノウハウが学べる、店長限定の無料のオンラインスクール

データを分析、統計する方法としてクラスタリングがあります。

クラスターとは集団や群れを意味しており、クラスタリングとはデータを類似度によってグループに振り分けて分析する方法を指します。

属性を知るためのマーケティング手法にはデモグラフィック分析やペルソナ分析などがありますが、クラスタリングは、データが持つ要素のイメージが具体的になっていない場合に利用されることが多い手法です。

本記事ではクラスタリングの用語や種類を提示したうえで、活用例をあげて解説します。

関連記事
ペルソナとは何か?ターゲティングとの違いや重要性を紹介

クラスタリングとは

類似した要素を持つもの同士でグループ分けすることをクラスタリングといいます。

「グループ分け」で新しい情報を導き出す

マーケティングにおけるクラスター分析とは、消費者や商品、企業といった分析対象についてグループ分けすることを意味します。「クラスター」は「集団」を意味する言葉です。グループ分けの行為クラスタリングといいます。 性別や年齢など客観的基準に沿って集団を切り分ける「分類」と異なり、クラスタリングではグループを似ているか似ていないかの類似性を指標に区切っていきます。 クラスターには、さまざまな共通する傾向が見えてきます。たとえばクラスタリングの対象が「消費者」の場合、共通する生活様式や重視する価値規範、嗜好などの情報が見えてきます。

クラスタリングには、次項から解説する、樹形図のような階層構造でクラスターを作成する「階層クラスタリングと、階層構造を構成せずにクラスターを作成する「非階層クラスタリングという2つの手法があります。

1.階層クラスタリング

階層クラスタリングとはそれぞれのデータ同士を相対的に比較して、類似度の割合によりグループ分けをしていく手法です。最終的に1つの集合になるまでグループを併合していくため、階層構造になります。

たとえば販売金額をもとにクラスタリングし、さらに店舗ごとの関係性を把握して店舗運営に活かしたり、顧客の購入商品によってクラスタリングすることで人気商品の傾向を見出し、商品開発に活かしたりということが挙げられます。

階層クラスタリングの主な方法

  1. ウォード法
    それぞれのデータの平方和(各データと全体の平均値の差を2乗したものの和)を求め、小さなものからクラスターを作成する方法です。
    計算量は多くなりますが、バランス良く分類できることがメリットです。
  2. 群平均法
    クラスター同士の距離を算出し、グループを形作っていく方法の1つです。全データの距離の平均をもとに、近いものからまとめていきます。
  3. 最短距離法
    最近隣法、単連結法ともいいます。群平均法と異なるのは、平均値ではなく、単純に1番距離の近いデータをクラスターとクラスターの距離として取り扱う点です。クラスター内に、距離の基準として扱われるデータから離れたデータがある場合には、そのデータは別のクラスターに取り込まれてしまう場合もあり、分析結果に影響を与えます。
  4. 最長距離法
    最遠隣法、完全連結法ともいいます。最短距離法とは逆に最も距離の遠いデータを、クラスターとクラスターの距離とします。最短距離法と同じく、クラスター内に離れたデータがあると分析結果に影響が出ます。

2.非階層クラスタリング

非階層クラスタリングとは、最初にクラスター数を決めておき、似たデータが同じクラスターに自動で分けられるようにする手法です。

サンプル数の多い調査で回答を区分けする際などに使われます。

階層クラスタリングの主な方法(k-means法)

一般的な計算方法として挙げられるのはk-means法です。

「はじめに指定されたk個のクラスターに平均(means)をつかって分類する」ことから名付けられました。

クラスタリングの活用例

顧客の属性やニーズ、販売商品の特性を見出すためのクラスタリングの活用例を3つ紹介します。

ターゲットの年齢や商品カテゴリといった単純な分類ではわからなかった属性を発見でき、メールマガジンの内容を会員属性に合わせて送りわける際や、飲食店メニュー開発、店舗商品仕入れや陳列方法など、さまざまなシーンで活用できます。

活用例1:顧客やユーザーをクラスタリング

会員にメールマガジンを送付する際に顧客に適切な情報を届けられるよう、複数のコンテンツを用意して、会員の特性ごとに内容をわけて送付したいというとき、どの顧客にどの内容のメールを送付するべきかを検討する際に活用できます。人数が多い場合は非階層クラスタリングが適しています。

顧客データをクラスタリングした結果、そこから見えてくる各クラスターの属性を解釈(プロファイリング)します。

たとえば書店がクラスタリングを行って、クラスターは「漫画層」「雑誌層」「ビジネス書層」などにプロファイリングできたとします。

そこからさらに、「漫画層は若者や40代~50代の男性・女性が多く、月に3冊購入している」、「雑誌層はファッション雑誌を買う層と車やスポーツのコアなファンの男性が多い」、「ビジネス書層は月に1度、1冊のみ購入している」といった特徴を見出していくと、おのずとメールマガジンに書くべき内容が見えてきます。

活用例2:インタビューやアンケート結果をクラスタリング

アンケートの自由記述欄に記載されている内容を数値で計ることは困難ですが、クラスタリングを活用することで顧客の意見から特性を見出すことができます。

使用頻度の高い言葉を抽出し、クラスタリングすることでクラスターを作成します。

たとえばアパレルショップであれば「ギフト」「時計」「カップル」がクラスターとなったり、薬局であれば「健康」「飲み物」「手軽」がクラスターとなったりする可能性があります。クラスタリングによって見つかった特性を活かし、商品陳列や仕入れ数に活かすことができます。

活用例3:自社のサービスや商品をクラスタリング

ファミリーレストランなどでは、顧客にメニューの人気投票を実施し、その結果をクラスタリングすることで新商品の開発やメニューの改善に活かすことが考えられます。

クラスター同士を組み合わせてセットメニューとしたり、クラスター同士の特性をかけ合わせて新メニューを開発したりといったことに応用できます。

クラスタリングで効果的な宣伝・集客を

クラスタリングはデータの特性が似ているかどうかでグループを振り分けるため、作成されたデータ同士は類似度が高くなります。

振り分けられたクラスターの要素を的確に分析することができれば、広告手法の決定や商品開発、アンケートなどの幅広く応用できる手法だといえるでしょう。

【桜開花直前レポート】インバウンドに人気のお花見スポット予想 / 日本の桜が好きな国はどこ?


今回は「全国の桜の観光名所36スポット」に寄せられた2万件の口コミを調査、比較検証をしました。

業界動向の把握や自店舗の口コミ対策に、ぜひ本レポートをご活用ください。

詳しくはこちらをご覧ください。

 【桜開花直前レポート】インバウンドに人気のお花見スポット予想 / 日本の桜が好きな国はどこ?

口コミアカデミー 0円すべて無料 口コミサイトの運営やノウハウが学べる、店長限定の無料のオンラインスクール

関連するオススメ記事

    この記事の筆者

    口コミラボ編集部

    口コミラボ編集部

    口コミラボ編集部ではMEO対策、ローカルSEO対策、販売促進店舗の口コミデータをもとにしたコンテンツなどを配信しています。