検索式単一単語検索
調べたい単語を一つ指定するだけのもっとも基本的な検索手法です。例:
- namazu
ある単語とある単語の両方を含む文書を検索します。検索結果を絞り込むのに有効です。3つ以上の単語を指定することも可能です。単語と単語の間に and を挿みます。例:
- Linux and Netscape
and は省略できます。単語を空白で区切って羅列するとそれらの語すべてを含む文書をAND検索します。OR検索
ある単語とある単語のどちらかを含む文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に or を挿みます。例:
- Linux or FreeBSD
NOT検索
ある単語を含み、ある単語を含まない文書を検索します。3つ以上の単語を指定することも可能です。単語と単語の間に not を挿みます。例:
- Linux not UNIX
グループ化
AND検索、OR検索、NOT検索を括弧でグループ化できます。括弧の両隣には空白を入れる必要があります。例:
- ( Linux or FreeBSD ) and Netscape not Windows
2語以上からなる複合語を検索します。 "..." と2重引用符で、あるいは {...} と中括弧で囲みます。Namazuのフレイズ検索は精度が 100 % ではないため、ときどき誤ることがあります。例:
- {GNU Emacs}
部分一致検索
部分一致検索には前方一致、中間一致、後方一致の 3種類があります。
前方一致検索
- inter* (inter から始まる単語を含む文書を検索)
中間一致検索
- *text* (text を内包する単語を含む文書を検索)
後方一致検索
- *net (net で終わる単語を含む文書を検索)
正規表現検索
検索するキーワードを正規表現で指定します。正規表現は /.../ のようにスラッシュ記号で囲みます。正規表現のエンジンにはRubyのコードを利用しています。正規表現の書式はPerlとほぼ同じです。 例:
- /インター?フェ[イー]ス/
フィールド指定の検索
Subject:, From:, Message-Id: といったフィールドを指定して検索する手法です。特にMail/News のファイルを扱う際に効果を発揮します。例:
- +subject:Linux
(Subject: に Linuxが含まれる文書)- +subject:"GNU Emacs"
(Subject: に GNU Emacsが含まれる文書)- +from:foo@bar.jp
(From: に foo@bar.jp が含まれる文書)- +message-id:<199801240555.OAA18737@foo.bar.jp>
(Message-Id を指定)特記事項
- いずれの検索方法でもアルファベットの大文字・小文字の区別はしません。
- 日本語の複合語は形態素単位に分割し、それらを フレイズ検索します。分割は不適切に行なわれることがあります。
- JIS X 0208 (いわゆる全角文字) の英数字と記号の一部 (ASCIIと重複しているもの) は ASCII (いわゆる半角文字) として処理されます。
- 記号を含む語の検索ができます。例: TCP/IP。ただし、記号の処理は完全ではないので TCP and IP のように分割してAND検索をかけた方が取りこぼしがありません (その代わり余計なファイルまでヒットしてしまう可能性があります)。
- 中間一致・後方一致、正規表現、フィールド指定の検索には少し時間がかかります。
- and, or, not を単語として検索したいときはそれぞれ、 "..." と2重引用符で、あるいは {...} と中括弧で囲みます。
検索のコツ検索がうまくいかないときは、次の点を確認してください。
- キーワードの綴りを確かめる
- キーワードの綴りが間違っていると検索できません。
- キーワードを増やしてみる
- 検索結果が何もない、あるいは少ないときは、関連するキーワードをor を挿んで羅列してみましょう。ヒットしやすくなります。
例: tex or ptex or latex or latex2e
検索結果が多すぎるときは、関連するキーワードを and を挿んで羅列してみましょう。検索結果を絞り込めます。
例: latex and dvi2ps and eps
- 部分一致検索を試してみる 検索結果が何もない、あるいは少ないときは、部分一致検索を試してみましょう。
tex* を入力すると、tex から始まる単語 (tex, texi2html, texindex, text など) を検索できます。
*tex を入力すると、tex で終わる単語 ( bibtex, jlatex, latex, platex, ptex, vertex など) を検索できます。
*tex* を入力すると、tex を含む単語 (たくさん) を検索できます。- 日本語がでたらめにわかち書きされてしまう
{ [ 最: 1 ] [ 新: 0 ] [ 情: 0 ] [ 報: 0 ] :: 0 } のように、でたらめにわかち書きされることがあります。これは、そもそも最新情報という言葉が検索対象に含まれないことを意味します。検索はあきらめましょう。- 長いカタカナ語の検索がうまくいかない
マルチパート で検索できないときは "マルチ パート" と分割してみてください。検索時にはカタカナ語の分割は行われないため、インデックス (本の索引のようなもの - 検索を高速に行うために使います) 作成時にカタカナ語が分割されていると、正しく検索できません。- フレイズ検索をしたが、そのフレイズを含まない文章までヒットしてしまった
これは仕様です。 Namazu のフレイズ検索は精度が 100 % ではないため、ときどき失敗します。- and, or, not を単語として検索したい
それぞれ、 "..." とダブルクォウテイションマークで、あるいは {...} と中括弧で囲みます。
総合研究開発機構(NIRA)
のトップページへ
この全文検索システムは Namazu によって構築されています。
Copyright (c) National Institute for Research Advancement (NIRA)
Copyright (c) 総合研究開発機構(NIRA)