デザインテクノロジーの最前線 - 桐山孝司

m.c.t.ホーム > エクスペリエンスマガジン > デザインテクノロジーの最前線 - 桐山孝司 > データマイニングを通してみる感情

2010.02.19データマイニングを通してみる感情

ここ数年でブログが増えたことに伴って、ブログから世の中の傾向を見ようとするデータマイニングが行なわれるようになった。その多くは事件や流行、新製品などに対する人々の反応を集合的に見ようとしている。しかしブログが個人的なものであることから、世の中の動きよりももっと日常の生活から出てくる言葉についてデータマイニングをすることもできる。そのような個人的なレベルで感情の言葉に注目しているのがWe Feel Fineプロジェクトである。

このプロジェクトを始めたジョナサン・ハリスとセップ・カムヴァのアイディアは、毎日ブログを巡回して「~という感じがする」("I feel"、"I am feeling")という言葉がある文章を集めるというものである。文章が見つかると、今度はその中から感情に関する言葉と、何についてかも見つけようとする。さらにブログの書き手のプロフィールがわかる場合には性別、年齢、地域も収集し、日時と地域からその時の天気も調べる。これによって、誰がどんな日の何時に何についてどう感じたか、という情報を集めるのである。

集められた感情の中で数が多いのは、より良い(better)、悪い(bad)、良い(good)、すまない(guilty)、変わらない(same)、残念だ(sorry)、いやだ(sick)などで、良好(well)、低調(down)、快適(comfortable)、すばらしい(great)、幸福(happy)、孤独(alone)、悲しい(sad)などが続く。これらの感情と書き手の属性との相関ではっきり出ていることは、年齢が高くなると安心感が増すということである。10代から20代では不安や興奮の感情の割合が多いのに対して、年齢が上がると、安らかさや感謝の感情が多くなる。安心(safe)という感情が上位25位にはいるのは30代からで、幸い(blessed)も40代からである。逆に、いやだ(sick)や困った(lost)という感情は10代が最大で、年齢とともに順位を下げていく。60代以上はデータが少ないのでわからないが、少なくとも50代まではこの傾向があるようである。

実は年齢と感情の関係はこれまでにも調べられており、想像できるように年齢が高くなると人間関係を重視して満足する傾向が高い。スタンフォード大学心理学部のLaura Carstensenらは、すでに20年ほど前からこの関係を確かめている。We Feel Fineはブログからのデータマイニングという現代的な方法で、改めてこの傾向を検証したといえる。

We Feel Fineプロジェクトはデータマイニングの結果の見せ方としても面白い。ブログを視覚化する画面では、一つひとつのブログが感情に対応した色の点になっていて、クリックすると感情を抽出した元の文章が見える。さらにブログに写真が含まれていると、感情についての文章を写真と合成して表示する。ブログの中の写真が必ずしも感情を表す文章と対応しているかどうかはわからないが、何か組み合わせとして面白いものが出てくればよいということだろう。

書き手にとっては顔が見える人よりも不特定の人が見ている方がかえって自由に書けるという心理が働くようで、ブログにはさまざまな感情の言葉が現れている。それらの中には他人に見せるために演じている自分という要素も多いと思うが、一方で感情に関するさまざまな文章を眺めることで発見があるのも確かである。感情のような個人の視点に注目したデータマイニングは、これから面白いフィールドになっていくだろう。


Laura L. Carstensen, Susan T. Charles, Derek M. Isaacowitz, Quinn Kennedy, "Emotion and Life-Span Personality Development", in Richard J Davidson, Klaus R Sherer, H. Hill Goldsmith, "Handbook of Affective Sciences", Oxford University Press (2009).

wefeelfine.png

We Feel Fineでブログから集めた感情を視覚化した画面(左)と、そのもとになったブログの一つ(右)。
http://www.wefeelfine.org