2011年11月11日金曜日

ソーシャルグラフに関する論文を読んだときのメモ

ソーシャルグラフについての論文を読んだメモ。

グラフデータを使い、ユーザの特徴をどう表現すればいいかが知りたくて調べてみた。ぶっちゃけそれは最初の論文だけで、後はソーシャルグラフの応用例的な。なんか長くなったので、読んだ論文のリストを書く。

1、ソーシャルネットワークにおけるリンク構造を用いた重複クラスタリング手法の提
2、MAKOTO:ソーシャルグラフを用いたコミュニケーション支援システムの提案
3、Twitter Catches the Flu: 事実性判定を用いたインフルエンザ流行予測
4、目的地にいる人々とのコミュニケーションを促進するシステムの開発



1、ソーシャルネットワークにおけるリンク構造を用いた重複クラスタリング手法の提
「プロフィール」からだけでなく、
「リンク」からもユーザの特徴を抽出し、
複数のクラスタに所属させようという研究。
「プロフィール」ではなく、「発言」だけど、
プロフィールのほうがイメージしやすかったので、
そっちで書く。


この研究では、
そのユーザが受けている「リンク」は、「リンク元ユーザの関心」を表し、
「リンク元ユーザの関心はリンク先ユーザ(対象ユーザ)の特徴を表す」
と考える。

そのため、対象ユーザの特徴を、
対象ユーザの「プロフィール」から抽出される特徴と、
対象ユーザの「リンク元ユーザとかのプロフィール」から抽出される特徴の
2種類からなる。(どちらもプロフィールを基に定義した特徴ベクトルなので、
その評価軸は同じにできる)

そのため、対象ユーザの特徴ベクトルは、
1+リンク数だけ持つことになり、
最大で、その数だけ別のクラスタに所属することになる。

さらに、リンク元ユーザが「どんな関心」をもって対象ユーザに
リンクをしているのかを定義づける必要がある。
それには、リンク元ユーザと対象ユーザが、
「共通している持っているリンク先の特徴」を使う。
これに重みづけをして、
1つの対象ユーザの特徴ベクトルを作成する。


なんかややこしい。
リンクの特徴をリンク元ユーザとかのプロフィールを使って、
表現するのは面白いと思った。


2、MAKOTO:ソーシャルグラフを用いたコミュニケーション支援システムの提案
とりあえず、写真見るだけでも一見の価値があると思う。
やっていることは、twitterから自分のついーと引っ張ってきて、
単語抽出して、ほかの人のそれと比較しているだけ。
でも、その利用方法、見せ方がすごく面白い。


3、Twitter Catches the Flu: 事実性判定を用いたインフルエンザ流行予測
タイトルまんま。twitterの発言内容からインフルエンザの流行を予測しようって研究。
同じようにインフルエンザを予測しようという研究は多くあるみたい。
「医療アドバイスコールセンターへの問い合わせ数」、「インフルエンザ市販薬の販売量、
「インフルエンザに関するGoogleの検索クエリ数」。
この研究では、「インフルエンザにかかっていると思われるツイート数」

この際問題になるのが、「発言者がインフルエンザにかかっているかどうか」を
どうやって判断するか。インフルエンザを含むツイートすべての集計では、
「インフルエンザじゃなかったw」といった発言までカウントしてしまう。
それを判別するために使われているのが、サポートベクターマシン(SVM)。

サポートベクターマシンは、
ニューラルネットワークの一種だとか。
詳しいとこまで理解できてないが、
要は、決定木と同じように、入出力のルールを
抽出するものだと思う。

この研究では、あらかじめ、
ツイート内容とインフルエンザ陰性・陽性のセットを準備して、
(人がツイート内容を読んで判断)
SVMにより、インフルエンザという単語の周辺の単語から、
発言者やその周辺の人がインフルエンザにかかっているかどうかを判断する
ルールを抽出する。

この結果、google flu trendと同じくらいの精度が出たとか。。
ただし、加熱報道時には大きく精度が悪くなるとか。
twitterっぽいw。

同じように、twitterを使った地震予知とかもある。
Earthquake Shakes Twitter Users:
Real-time Event Detection by Social Sensors




4、目的地にいる人々とのコミュニケーションを促進するシステムの開発
こっちが作りたいと思っていたものとよく似ている。
「知っている人にメッセージを送る」という意味で。
ここでは、質問内容を場所に関するものに限定し、
(情報を知っている人)=(その場所にいる人)としている。
さらにメッセージを送るための仕組みとして、
自分らでtwitterクライアントを作成することで何とかしようとしてる。
やはり問題は、「質問内容を知っている人の絞り込み」と
「メッセージ送信方法」か。

0 件のコメント:

コメントを投稿