はてなマッチング

すでに同様のことをやられてるのかもしれないが、キーワードページで「○○」を含む日記としてリストアップされているidとkeywordを以下のように点数化すると趣味が似た人同士を抽出できる気がして適当にプログラムを作ってみた。適当な仕様は以下の通り。

k_x
はてなキーワード
a_y
はてなid
f(k_x) = \{ a_1, ... ,a_n \}
キーワード k_x が ida_1 , ... , a_n の日記に含まれる
m(f(k_x),a_y,a_z)
マッチング関数 a_y \in f(k_x) かつ a_z \in f(k_x) ならば1、そうでなければ0。
 \bigsum_{i=1}^nm(f(k_i),a_y,a_z)
id a_y と id a_z のマッチング度合いを示す。

結果は以下の通り。

はてなマッチング(仮称)ランキング マンガカテゴリー編」
137 id:CAX & id:G_CAR_STK
66 id:nyah & id:sayuk
66 id:domino & id:souno418
66 id:domino & id:mkomiya
63 id:HAPPY_HOUR & id:domino
63 id:CAX & id:taketyan
61 id:ROMman & id:altea
57 id:EdgarPoe & id:ROMman
49 id:domino & id:kokko3
48 id:palca & id:yossan43

実際に趣味が似ているのかどうかは、よくわからんなぁ。
キーワードが多いとマッチング件数が多くなるので、自分の持つキーワードにおけるマッチング率にしたほうが精度が高くなるかな。
標準装備になったりすると楽しいですが出会い系サイトになってしまうかも。