検索システムとか。|すたしょ日記
- 2009年6月29日(月)
-
検索システムとか。
サイト内検索で、検索されるはずの単語が出てこないという指摘があったので、確かにそのようなバグがあることを確認。文字化けするページもあるようです。
最近は検索用のインデックス(データベース)を更新するのが面倒で、月一ぐらいの頻度でしか更新していませんでした。これを機に、グーグルのフォームに置き換えようか?とも思ったほどです。グーグルのテキスト検索が非常に優秀なのはご存じの通り。対して、(同じように優秀なイメージのあった)グーグル画像検索の精度の悪さが陰謀説になってしまったほどです。
そこで、同じ単語をサイトの検索システムと、グーグル(のサイト指定検索)で検索して比べてみたのですが、さすがのグーグルでもサイトの検索システムには及ばないようで、若干の漏れがあるようです。そのため、インデックスの更新作業を簡単にできるようにして、今後も利用していくことにしました。
今後は(忘れない限り)ページ更新のたびにインデックスの方も更新していくつもりです。・・・MT再構築に連動して更新してくれるようなシステムがあると便利なのですが。cronを使う方法もあるようですがよく知りません。
せっかくなので、サイト内検索、グーグルの検索などを比較してみた結果を出してみます。
名称 サイト内検索 Google mixi Google全体 堀江由衣 637 448 118 231,000(784,000) 田村ゆかり 557 441 122 768,000(774,000) meg rock 267 125 77 55,300 坂本真綾 245 172 22 868,000 白石涼子 192 128 32 343,000 水樹奈々 188 153 19 2,100,000 新谷良子 107 86 18 364,000 浅野真澄 77 76 11 277,000 VOCALOID 61 55 126 3,030,000 初音ミク 48 39 280 11,000,000 (全ページ数) 2084 1410 2000?? - 「サイト内検索」は今日現在(この日記を書く前)。「Google」はサイト内(ドメイン指定)で検索。
おまけに、「mixi」は私の日記w(2005年~)。「Google全体」は、検索方法によって若干変わります。
やはり、やまなこコンビが着実に増やしてます。「meg rock」の多さは、以前やっていたファンサイトのページを丸ごと移設したためです。「白石涼子」の多さは、テキスト内に含まれるCM情報かも知れません。「水樹奈々」がかなり多いのも同じ理由でしょう。某SNSでミク関連が多いのはまさに今の私w
3年ぶりの検索らしい。
トラックバック
- この記事へのトラックバックURI
- http://sakura-net.net/mode/neco.mimi/1157
トラックバックはただちに反映されないことがあります。 エラーや、数日経っても反映されない場合はコメントかメールでお知らせください。 なお、このページへの言及がないなど内容の関連性が薄いブログや、宣伝目的など不適当と判断したトラックバックは削除・拒否することがあります。