図書館で働いているといろんな検索システムにお世話になります.
はかせの大学の図書館の書誌データの検索などは富士通の商品を使っています.
これは Oracle で動いているそうです.
私のような末端の利用者はそう言ったことを意識せずに使っているのでどんなエンジンが動いているのかなんて分からないのよ.
メインのデータベースは富士通製なのですが、それ以外にも細々としたものを動かしています.
そんな細々したものははかせが作っているのですが、いかんせんエセ技術者のいたすところ、データベースの出来は惨々たるものなのよ.
利用者さんや担当者さんからはしょっちゅうお小言を食らって修正に励む日々なのですよ.
そんなはかせ手製の検索マシン.
これまでにいくつかの検索システムにお世話になりましたよ.
dBASE II, dBASE IIIPlus, Microsoft Access97, Microsoft Access2002 などを使っていました.
これらパソコンレベルの検索システムはアプリケーションを入れてしまえば簡単に組めて簡単に動かせ危険も少ないのでありがたいのですが、利用者さんにとっての使いやすい検索システムを作るのは難しいの.
Yahoo! や Google に慣れている者たちにとっては検索の窓一つに好きな言葉を放り込んで検索するのが楽チンなんです.
それ以外にいろんな制約をつけたりしても使いづらいのです.
そんなんを見込んで Namazu を使って全文検索を作ってみたのですが...
担当者さんから見ると、この形態素解析を用いた全文検索は「検索漏れが多い」「きめ細かい検索が出来ない」とのことで不評なのよ.
うーん、上手く行かない.
Namazu の形態素解析をうまくデータベースに組み合わせてなんとか出来ないかな.
なんて思いながらググってみたところ行き当たったのは Senna.
MeCabを使った分かち書きインデックスをMySQLで使えるそうなのです.
これは使えるかも.