ブログ検索はノイズ除去で四苦八苦?

β版という事で、多少厳しめなのはご愛嬌?
F.Ko-Jiの「一秒後は未来」: Yahoo!ブログ検索に表示されない件についてYahoo!からがっかりな回答がきた

RSSのドメインとブログのドメインだとか、内容の整合性だとか、そうとう厳しい気がする。ブログのトラックバックとかコメント対策として、内容とURLとの整合性とかを利用するのはまあいいと思う。自分のコンテンツに対して、外から悪影響を受けないように厳しめの対策をとるというのは妥当かな、と。

一方で、検索のインデックス作りにこの辺のポリシーはちょっと厳しすぎるのでは?RSSはトラフィック的に結構無駄(阿呆なリーダーとかね)があるので、ホスティングしたいケースが考えられる。ここは問題ないけど、人気ブログだとか何百万PV稼ぐポータルだとかは、ね。独自のドメインで運用出来るサービスもあるけど、どうだろう。

RSSをホスティングする目的の1つに効果測定もあるんだけど、ドメインを合わせないとインデクシングされないとなれば、結構な参入障壁だとかにならないかな。

ブログ運用側も、そこまで細かい条件にいちいち対応してられないと思う。『コンテンツ内容との整合性』なんてどうすりゃいいのさ。全く一緒なんて、ね。

まあ、何にしてもブログ検索はβ版が多いし、トラックバックだとかコメントだとかの影響を考慮しての仮対応なのかもしれない。これからだんだんと緩くしてくとか。validatorでのエラーを受けて処理を止めてるとかはないよね?

検索精度を考えると色々難しいんだろうな。

プロフィール

このブログ記事について

このページは、koshigoeが2006年8月12日 02:01に書いたブログ記事です。

ひとつ前のブログ記事は「変な風にRubyにかぶれてみる」です。

次のブログ記事は「環境変数が入り乱れてるのが嫌」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。