どこかに重み付きキーワード抽出のAPIはないものか

GoogleとかTechnoratiとかにないかな。

集合知(?)を頼りに、自分のブログエントリーから重み付きキーワードを抽出したい。そんで、それをTreemapで表示したい。

『キーワード抽出』だけなら、形態素解析がどうたらで出来そうな気配。ただ、そこから『適切な単語』を取り出して『重み付け』をするのが大変そう。比較データが自分の手元には無い。

GETで使えて、[{"keyword":"score"},...]なJSON(だよね?)を返してくれるとベスト。いや、TreemapのHTMLを取得するのにJSONデータ使ってるので。XMLで返ってきても間にパーサ挟めばいいので問題は無い。使わせていただけるだけで万々歳。

ひょっとして、ここでベイズ統計?はてブ食わせてごにょごにょ?

おとなしく別のネタ探そうかな。

プロフィール

このブログ記事について

このページは、koshigoeが2006年11月14日 22:46に書いたブログ記事です。

ひとつ前のブログ記事は「"AllowEncodedSlashes On"にしてもサーバは404を返すもの?」です。

次のブログ記事は「スルーしてたけど、RSSファイルはGoogle検索結果に出るんだよね」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。