InfoCiclismo - Namazu 全文検索の詳細
大文字、小文字の区別はありません。foo* のように末尾にアスタリスクを指定することで前方一致検索が可能です。また、単語をスペース区切りで並べて書くとアンド検索になります。日本語は KAKASI/ChaSen によって分解され、「日本語情報処理」なら 「日本語」 「情報処理」 のように 2 つの単語に分かれてアンド検索されます。日本語の単語の分解は完全ではありません。品質は辞書によって決定されます。
全角 (2 bytes) アルファベット・記号はすべて 1 byte として処理されます。記号を含む検索も可能で
TCP/IP
というような単語の検索も可能です。ただし、記号の処理は完全ではないのでTCP IP
のように分けてアンド検索をかけた方が取りこぼしがありません (その代わり余計なファイルまでヒットしてしまう可能性もありますが)。括弧を含めたアンド検索とオア検索およびノット検索が可能になっており検索式に
& | ! ( )
を用います。記号の代わりにand/or/not
で指定することも可能です。 検索式はひとつづつスペース区切りで入力しなければなりません。 たとえば
( sed | awk ) ! perl & regexp
( sed or awk ) not perl and regexp
のように指定します。
これは「 sed または awk が含まれ、perl は含まれない、そして regexp が含まれる」文書を検索するという意味になります。 括弧のネストもできるので、さらに複雑な検索式で検索することも可能です。
フレーズをダブルクォーテーションまたは中括弧 '{' '}' で囲むこと でフレーズ検索ができます。ただし、精度は 100%ではありません。とき どきはずれます。たとえば
"SIMPLE MAIL TRANSFER PROTOCOL"
{SIMPLE MAIL TRANSFER PROTOCOL}
のように指定します。
正規表現および中間一致/後方一致の検索も可能です。ただしちょっと 遅いです。これは日本語も使えます。
*大学
(後方一致)*ネット*
(中間一致)/インター?フェ[ーイ]ス/
(正規表現)"静岡県浜松市"
(フレーズ)のように指定します。
フィールド指定の検索を行うことができます (フィールド検索用のイ ンデックスが作ってあれば) 日本語も使えます。
+date:/Aug 1998/
(1998年 8月のもの)+from:foo@bar.jp
(差出人が foo@bar.jp)+subject:"internet message"
(Subject:を文字列で検索)+subject:{internet message}
(上と同じ)+subject:/(mule|xemacs|emacs)/
(Subject:を正規表現で検索)+message-id:<199801240555.OAA18737@foo.bar.jp>
(Message-Id)+title:amarok
(文書のタイトル)+author:foo@bar.jp
(文書の著者)+url:http://foo.bar.jp/
(文書のURL)のように指定します。
Copyright(c) 2000 Masayuki Kusunose