LIVESENSE ENGINEER BLOG

リブセンスエンジニアの活動や注目していることを発信しています

紹介型マッチングアプリknewにおける好みの個人差

 リブセンスでデータサイエンティストをしている北原です。先日開催された第130回知識ベース研究会での紹介型マッチングアプリknewに関する発表の紹介です。

 今回の分析では、個々人の好みに焦点を当てました。今までは、多くの人から高く評価される人の特徴を分析してきました。しかし、人によって高く評価する要素が異なることもあります。そこで今回は、どのような特徴に個人差が生じるのか、また個人によってどの程度の違いがあるのかを分析しました。

 以下は、多くの人から高く評価される人の特徴に関する記事です。

made.livesense.co.jp

made.livesense.co.jp

目的

 好みの個人差を推定することには、マッチング精度の向上と、好みの個人差が反映されやすい評価項目の把握という目的があります。

マッチング精度

 マッチング精度をさらに向上させるためには、多くの人が好む特徴だけでなく、個々人の好みを把握する必要があります。多くの人が好む特徴を利用するだけでもマッチング精度は向上しますが、個々人の好みも考慮することでより高い精度のマッチングが期待できます。マッチングの観点からは、ユーザーによってまったく正反対の評価になるケースが重要です。例えば、かわいいタイプを非常に好む人と、美人タイプを非常に好む人がいることがわかれば、前者にはかわいいと評価されやすい人を紹介し後者には美人と評価されやすい人を紹介することができます。

好みの個人差が反映されやすい評価項目

 評価情報には、好みの個人差が顕著に現れるものとそうでないものがありますので、それらの特徴を把握することも重要です。個人差が大きい評価項目については、利用者の好みに合わせて相手を紹介することでマッチング精度を向上させることができます。また、評価情報の中には平均的には満足度などへの寄与が見られないものでも、個人差が大きくユーザーによっては重要視されているものがあります。平均的な寄与が見られないと不要な情報とみなされやすいですが、個人差を考慮してもマッチングに影響しないことを確認しておく必要があります。

データ

 今回の分析で使うデータは、以前の記事で扱ったものと同じで「どちらのタイプに近いか」を表す多段階対象評価データと印象・雰囲気満足度を使います。多段階対象評価データについては、具体的には次のような評価項目を使います。

分析に使った多段階対称評価データ

なお、一部の多段階対象評価データは収集を停止しており、以前の記事と比べて項目数が減少しています。

 今回の分析では、男女別に25〜29歳と30〜34歳のユーザーを対象にしています。その他の年齢層は対象外となります。また、対象とするユーザーは、ビデオチャットを10回以上実施したユーザーのみです。

分析方法

 今回の分析では、容姿の好みや印象・雰囲気満足度を目的変数とし、それ以外の多段階対象評価データを説明変数とした回帰分析を行います。例えば、美人度の回帰係数が0.8であれば、美人度が1上がると容姿の好みが1上がる関係があることを示します。このように回帰係数の値に基づいて、容姿の好みや印象・雰囲気満足度にどの程度の影響があるかを把握することができます。

 また、個人差を理解するために、以前の記事で紹介した階層ベイズを使用して、ユーザーごとに回帰係数を推定しています。ユーザーごとの回帰係数が大きくばらついている場合、個人差が大きいことがわかります。逆に、ほとんどの人が同じような値であれば、個人差が小さいことがわかります。

 多くの場合、ユーザーの回帰係数は正規分布に従うことを仮定しますが、今回は一般化正規分布を仮定することで分布形状に柔軟性をもたせています。これによって、極端な好みが見られやすいあるいは見られにくい評価項目を分布形状から知ることができるようにしています。

結果

容姿の好み

 以下は、容姿の好みに関するユーザー別回帰係数の密度のヒストグラムを男女年齢層別に示したものです。なお、縦軸のスケールは揃えているものの、横軸のスケールは項目別に作成しているので、項目間のばらつきを比較するときは注意が必要です。

容姿の好みに関するユーザー別回帰係数のヒストグラム

 簡単にグラフの見方を説明します。個人差が大きいかはばらつきの範囲から読み取ります。例えば、男性20代の容姿整い度を見ると回係係数が0.95から0.98の範囲に収まっていることがわかります。つまり、男性20代は容姿整い度が1上がると容姿の好みが0.95から0.98上がる人しかいないので、他の性別年齢層と比較して個人差が小さいと言えます。一方で、女性30代の容姿整い度を見ると回帰係数が0.63から1.2までばらついていることがわかります。これは容姿整い度が1上がっても0.63しか容姿の好みが上がらない容姿整い度をあまり重視しない人もいれば、1.2も上がる容姿整い度が容姿の好みに強く影響している人がいるということで、個人差が大きいと言えます。

容姿整い度:女性は個人差が大きいが、男性は容姿が整っていないことを許容しない

 容姿整い度の影響の個人差は、女性で大きく男性で小さくなっています。女性は男性と比較してばらつきが大きく、特に女性30代でその傾向が顕著です。女性は相手の容姿があまり整っていなくても好みとする女性が少なくないようです。一方で、男性は容姿が整っていないと好みとは考えないことがわかります。特に、男性20代はその傾向が顕著に表れています。

美人度:女性皆かっこいい人が好み、男性20代で個人差が大きい

 美人度の影響の個人差は、女性で小さく男性で大きくなっています。女性はかわいいタイプよりかっこいいタイプを好みとしていますが、好みには強く影響していないことがわかります。また、男性のほとんどは、かわいいタイプを好むこともわかります。特に男性20代は個人差が大きく、かわいいタイプを好みとする人が一定数いるので、そのような人たちにかわいいと評価されやすい女性を紹介することでマッチング精度の向上が期待できます。

顔の濃さ:女性30代と男性は個人差が大きい

 顔の濃さの影響の個人差は、どの性別年齢層でも大きめですが、特に女性30代と男性で顕著です。女性は濃いタイプを好む傾向があり、男性は薄いタイプを好む傾向が一般的ですが、女性でも薄いタイプを好む人や、男性でも濃いタイプを好む人も存在します。顔の濃さは平均的にはほとんど影響しないものの、個人によって好みが異なる評価項目と言えます。

印象・雰囲気満足度

 以下は、印象・雰囲気満足度に関するユーザー別回帰係数の密度のヒストグラムを男女年齢層別に示したものです。容姿の好みと同様に、横軸のスケールは項目別に作成しているので、項目間のばらつきを比較する際には注意が必要です。

印象・雰囲気満足度に関するユーザー別回帰係数のヒストグラム

清潔感:女性20代で個人差大きい

 清潔感の影響の個人差は、どの性別年齢層でも比較的大きめなものの、特に女性20代で顕著です。どの性別年齢層でも清潔感の影響は大きいものの、女性20代は他の性別年齢層と比較して平均的に清潔感の影響が大きいことに加え個人差も大きいことから、清潔感を重視している人が多くなっています。

フォーマル度:女性と男性20代で個人差大きい

 フォーマル度の影響の個人差は、女性と男性20代では大きいものの、男性30代ではやや小さくなっています。男性30代はカジュアルな人の印象・雰囲気をやや高く評価する人がほとんどです。一方で、女性と男性20代ではカジュアルなタイプを好む人やフォーマルなタイプを好む人がいるだけでなく、印象・雰囲気に与える影響の強さも人によって大きく異なっていることがわかります。フォーマル度も顔の濃さと同じように、平均するとマッチングに影響しないように見えますが、利用者別だと影響がある評価項目です。また、今回調べた範囲内ではもっとも個人差が大きかったのがフォーマル度でした。

華やかさ:どの性別年齢層でも個人差は小さく、華やかなタイプが高評価

 華やかさの影響の個人差は、どの性別年齢層でも小さいです。強いていうと、男性30代は他の性別年齢層と比較するとやや個人差が大きめです。どの性別年齢層でも華やかなタイプの印象・雰囲気をやや高評価にしていることがわかります。

活発さ:どの性別年齢層でも個人差は大きいが、皆活発なタイプが高評価

 活発さの影響の個人差は、どの性別年齢層でも大きいですが、女性30代は他の性別年齢層と比較するとやや個人差が大きめです。どの性別年齢層でもほとんどの人は活発なタイプを高評価にしていますが、ユーザーによって活発なタイプの印象・雰囲気をどの程度高く評価するかは大きく異なっています。

まとめ

 今回は容姿の好みと印象・雰囲気に影響する評価情報の個人差を調べました。個人差が大きかった項目をまとめると以下のようになります。

  • 容姿の好み

    • 女性:容姿整い度

    • 男性:美人度

    • 男女共通:顔の濃さ

  • 印象・雰囲気満足度

    • 女性と男性20代:フォーマル度
    • 男女共通:清潔感、活発さ

これらのうち、顔の濃さとフォーマル度、美人度についてはユーザーによって正反対の評価につながることがあるため、利用者の好みに合った相手を紹介することでマッチング精度の向上が期待できます。