コーパス検索(共起表現検索)について
1.6億語のPubMedコーパスよりオンデマンドで共起表現を検索します。
共起表現とは,注目している英単語の前後にどのような単語が並んでいるかを視覚的に表現し,掛かり受けの関係(名詞なら直前の形容詞や直後の動詞など)を数量的に明らかにするものです。 例えば下の例では,apoptosisを起こすことを表す動詞としてundergoがよく用いられていることが理解できます。論文での文章表現を吟味する場合などにご活用ください。
使い方
- 検索語句の窓に調べたい英語の語句を入れて検索ボタンを押してください。
オプション
初期状態では2つのオプション項目のみが表示されています。検索窓の横にある詳細検索をクリックすると追加のオプションメニューが表示されます。以下の項目について設定を変更することができます(太字がデフォルト)。
ソート順
- 直前でソート:検索結果を直前に共起する単語でソートします。
- 直後でソート:検索結果を直後に共起する単語でソートします。
- 集計値:前後に共起する単語の集計値を表示します。
結果を表示するウィンドウ
- 同じウィンドウに表示:同じウィンドウに結果を表示します。見終わったら戻るボタンでもとのページに戻ります。
- 別ウィンドウに表示:新しいウィンドウを開いてその中に結果を表示します。ブラウザの種類や設定によって動作が異なることがあります。
- 設定を記憶(チェックボックス):ウィンドウ表示の設定を記憶させます。
最大…行を表示
- 50行, 100行, 300行, 500行, 1000行から選んでください。
- 設定を記憶(チェックボックス):表示行数の設定を記憶させます。
1行の表示文字数
- 100字, 120字, 160字, 200字, 240字から選んでください。
検索語の大文字と小文字を
- 区別する:略語などの検索で大文字と小文字を区別します。
- 区別しない:検索語の大文字・小文字の違いを無視します。
検索語の語尾活用を
- 許す:検索語の活用形 (規則変化のみ) も表示します。
- 許さない:検索語に完全に一致する場合のみを表示します。
冠詞や前置詞を"文章内"のリストに
- 含める:集計値において文章内での共起数に冠詞や前置詞を含めます。
- 含めない:集計値において共起する冠詞や前置詞は無視します。
後方ソートのとき検索語の語尾を
- 含める:活用形ごとにまとめて表示します
- 含めない:活用形を無視して共起単語の順に表示します
正規表現による検索
オプションで「検索語の語尾活用を許さない」を指定した場合に限り、下記の表現が使用できます。
- * は任意のアルファベット列に一致します (例: *genic, transcript*, as * as)
- ? は任意の1文字に一致します (例: locali?ation, th?se)
- [abcd] はabcdのいずれか1文字に一致します (例: vitamin [abcd])
- {n,m} は直前の文字 (またはかっこで括られた文字列) のn-m回の繰り返しに一致します (例: transcription(al){0,1}, from ?{1,20} points{0,1} of view)
- (abc|xyz) は文字列abcまたはxyzのいずれかに一致します (例: under(take|took))
検索結果について
最初に表示される画面では見出し語の直後の単語をキーにしてソートしたリスト(1語後でソート)を表示します。略語の場合は直前の単語でソートします。下図に示す画面上部ボタンをクリックすることによってソートを前後で切り替えたり集計値を表示することができます。