文章型データベースを求めて③検索方法、出力方法
「文章型データベースを求めて」の第3回目です。今回は記事の検索方法、出力方法についての話です。
ここで説明する検索方法、出力方法(表示・印刷)を実現するには自作するしかありません。従いましてTxt_htmlの説明になることをあらかじめご了承ください。
百聞は一見に如かず。サンプルのデータベースをお試しください。
🔍で検索するか、日付指定してください。
△で年月表、▽で本日、📅でカレンダーを表示します。
→ http://mgh03015.fc2web.com/wdiary/index.html#po1234jp&readme
web検索のような検索をしたい(and検索)
web検索をするときに「A B C」というようにキーワードの間にスペースを入れて検索すると「A かつ B かつ C」が抽出されます。これを「and検索」といいます。
文章型データベースにはand検索は必須と考えます。その理由を説明します。
and検索を試してみてください。
→ http://mgh03015.fc2web.com/wdiary/index.html#po1234jp&readme
記事ごとのand検索は必須
見出しとその本文を「記事」とします。
キーワードひとつの検索では、多数の記事が抽出される可能性があります。
この場合、スクロールさせて確認する必要があります。
目的の記事を絞り込むために記事ごとのand検索が必要です。
一日単位のand検索も必要
「押し出しファイリング」理論に基づき、関連情報を同じ日に並べるようにしています。
例えば「Aに関する記事」「Bに関する記事」というように見出し付けをしています。
「Aに関する記事 Bに関する記事」が揃う日を検索するには「一日単位のand検索」が必要です。
この検索は、次に説明する「こうもり問題」にも有効です。
関連情報を並べるだけで「こうもり問題」解決
こうもり問題とは、A にも B にも分類できる場合に、どちらに分類すればいいのかという問題です。
「こうもり問題」は同じ日に並べて入力しておけばよく、分類する必要はありません。
関連する情報が同じ日に「ひとまとまり」になっていることが重要です。
①ある日、獣チームと鳥チームがもめました。
②獣チームが優勢になるとこうもりは「私は哺乳類、つまり獣だ」といって獣チームにつきました。
③鳥チームが優勢になるとこうもりは「羽があるから私は鳥だ」といって鳥チームにつきました。
④ついにこうもりは獣・鳥どちらのチームからも絶縁され、洞窟にこもったとさ。
このように関連する情報が並んでいれば、こうもりを獣か鳥か分類する必要はありません。「ひとまとまり」にした日付がわかれば、関連性を知ることができます。 「分類するな。ひたすら並べよ」「関連情報はひとまとまりにしておけ」です。
一日表示で関連情報を表示
「こうもり問題」の記事④を「ついにこうもりはどちらのチームからも絶縁され、洞窟にこもったとさ」としてみましょう。
「獣」「鳥」を消したのでこのキーワードでは抽出できなくなりました。
しかし、「獣」「鳥」の記事と並んでいますので、一日表示にすれば、①~④が表示されます。一連の状況(もめた経過)がわかります。
記事を選択して表示できること
一日の記事の中には関係のない記事も含みます。関係のない記事を除外し、目的の記事のみ表示する機能が必要です。
「ひとまとまり」になった記事を抽出する機能です。
次は「鳥チーム」の記事を選択している例です。
見出しの章番号で階層抽出ができること
章番号とは
論文などで章立ての際に「1-2-3」というように番号をふるのが一般的です。それぞれ「章」「節」「項」を表します。
章番号は、アウトラインプロセッサやWordの見出しの設定でふるのが一般的です。章番号をそのまま使い、階層下の記事を一括抽出できると便利です。
例えば憲法第十章の条文すべての抽出は、「1-10」の「-10」のクリックで次の条文が抽出されるというものです。
1-10 第十章 最高法規
1-10-97 第九十七条〔基本的人権の由来特質〕
1-10-98 第九十八条〔憲法の最高性と条約及び国際法規の遵守〕
1-10-98-2 第九十八条2項
1-10-99 第九十九条〔憲法尊重擁護の義務〕
押し出しファイリング理論にもかなう
章番号で「関連情報はひとまとまりにしておけ」ですし、既にある章番号をそのまま活用するので、「分類するな。ひたすら並べよ」にも反しません。
検索期間の指定ができること
検索開始日を指定することで古い情報を除外
法令改正、規定改正など情報は常に変化しています。最新の情報を参照する必要があります。古い情報は誤りの原因にもなります。
検索開始日を指定することで古い情報を除外することができます。
次はサンプルのデータベースから消費税について検索開始日を指定せずに検索した例です。
検索開始日を指定しないと、初出の記事(この場合は消費税導入日の記事)を冒頭に表示します。現在の消費税率と混同する恐れがあります。
実際の使用では「▼」で最新の情報にジャンプして最新情報を見るようにしてください。
検索終了日の指定することで当時の情報を表示
検索終了日を指定することにより、指定した日付当時の規定や様子がわかります。
法令データベースの場合、経過措置があり、旧法を削除できません。改定履歴・沿革は必須です。
マニュアルの場合、バージョン管理にも必須です。
次はサンプルのデータベースから消費税について検索終了日を「2001年1月1日」(21世紀初日)に指定して検索した例です。
再下段の税率が21世紀初日の税率となります。
ハッシュタグが使えること
関連記事を検索する機会はよくあります。キーワードを検索欄に入力して関連記事を検索するのが通常ですが、そんな作業を省略するのがハッシュタグです。
記事に「#キーワード」というように#ではじまり、前後を半角スペースで挟んだハッシュタグを記載しておきます。
データベース化後、ハッシュタグをクリックすると「#キーワード」を含む記事が抽出されるというものです。
電話応対記録を例にすれば、電話機のナンバーディスプレーに表示された番号を「#03-1234-5678」というように記載しておけば、これまでの電話応対の状況がわかります。
本稿「文章型データベースを求めて」では、プレーンなテキストファイルにこだわっています。タグ記号をできるだけ排除したいのですが、「#」だけは認めることにします。noteで使えますし、TwitterやInstagram、FacebookなどのSNSで多く使われており、どのアプリでも使えるからです。
リンクが使えること
Gメールを活用した情報の整理方法がありますが(別稿参照)、Gメールのリンク機能、添付ファイル機能があって成立する整理方法です。
html化した文章型データベースにもリンク機能は必須です。
「http://」「https://」ではじまるwebページへのリンク
特定のフォルダ、ファイルへのリンク(添付ファイル)
データベース内の他の日付・記事へのリンク
「file:///」ではじまる内部リンク
データベースは使う(出力・印刷)ためにある
データベースは使うためにあります。結果を出力できて使ったことになります。
基本の一日表示・印刷
新聞スクラップは日付が必須です。webニュースなど「〇〇:〇〇配信」というように時間で整理する方法もありますが、全ての記事に時間を入れることとなり、煩雑です。
一日表示が使い勝手がよく、基本です。見出しごとの個別表示・印刷
一日のうち、関連する情報が集まって「ひとかたまり」となった場合は「見出し」を付けて独立させた方が見やすくなります。
見出しごとの個別表示は、使用頻度が高いといえます。見出しと本文の一括表示・印刷
検索結果を表示する方法として、まず該当するデータの見出しを表示して、次に選択した見出しの本文を表示する方法と、該当するデータの見出しと本文を一括表示する方法があります。
体験的には後者が優れていると感じます。(検索キーに色付けすれば)段組み印刷も必須
印刷はA4サイズが基本です。1件のデータを印刷するだけであれば段組みは必要ありませんが、一括表示して複数のデータを印刷したり、1件のデータであっても長文の場合は2段組み、あるいは3段組みにした方が見やすくなります。
次回予告
次回は「データベースをスマホで検索・閲覧する方法」を説明します。
この記事が気に入ったらサポートをしてみませんか?