GoogleのQDF

ホットなキーワードにはホットなページを

  • 検索回数がいつもよりえらく多いぞ
  • 何か起きているはずだ
  • 新しい情報が求められているぞ
  • 最近変わったページを上位に表示しとこう

この検索結果の鮮度に対して1つの解決策を提示し、実行しているのがGoogleGoogleは "QDF" (Query Deserves Freshness)というアルゴリズムを用いている。

仕組みは次の通りだ。ある一定の期間において、ブログ記事やニュース記事の中で特定のトピックの出現量が増加した時、Googleはそれを「話題性あり(hot)」と判断し、検索結果中に最新の情報を持つ(鮮度の高い)ページへのリンクの割合を増やす。これはGoogleが監視する検索クエリの増減量と照らし合わせて判定する。

例えば、「東京都」というキーワードが毎日平均1万前後の検索回数があるとしよう。ある日、このキーワードの検索回数が急に100万回に増えた時、何らかの出来事により世の中のユーザーが同キーワード(話題)に関心を持ったために検索数が急増したと推定できる。従って、Googleは「東京都」をホットなワードと認識し、検索結果1ページあたりの最新ページの割合を増やす。

ユーザーが使用した検索キーワードが「話題性がある」と判定されている間は、新規・更新されたページが検索結果に表示されやすくなるし、話題性がないと判断される検索キーワードで検索した時に新しいページばかりになってしまうことはない。ユーザーのインテントにあわせて検索結果の鮮度が決定できる。米Googleエンジニア・Amit Singhal氏はQDFによる成果として、ニューヨークで停電が起きた時、それを報じた記事が15分後には検索可能だった事例を挙げている。

このQDFの仕組みによって、次のように検索結果は変わる。先述した「冷凍ギョーザ」と検索した時(2008年1月30日17時時点)や、先日の虚偽の大量保有報告書が登録された「テラメント」と検索した時(同報道が流れた直後)にGoogleで検索すると検索結果1ページ目の大半は記事公開後8?3時間未満のページのリンクが占めていた。