情報化社会とデータベース
■情報化社会とデータベース
 世界は、産業革命以来、農耕社会から工業社会へと大きな変化をとげ、現代社会は、情報化社会へと変わりつつある。 身近なところでは、銀行のATMを利用すれば、全国どこの支店からもお金をおろすことができる。インターネットを 利用すると簡単に情報を得たり、買い物やチケットの予約もできる。企業では、POSシステムの導入より、無駄な在庫を 置くことなく効率的な流通ができる。我々の身の回りの生活では、「情報」が大きな位置を占めるようになっている。 逆に、一銀行のシステムが止まるだけでも我々の生活に大きな支障をもたらすことも事実である。一企業・一国家が 「情報」に左右される時代であり、情報を早く正確に得ることができる能力が必要となってくる。

データと情報の意味は?
データとは・・・客観的事実を人間が知覚できる数値・文字・画像などで表したもの
情報とは・・・ある特定の目的について適切な判断を下したり、行動の意志決定のために役立つ資料や知識。データの中で、 必要なもののみが、その人にとって情報となると考えてよいのではないか。

 その情報化社会の中で、従来のようにデータを紙に記録していくような記録媒体では、とても処理できなくなってきた。 その結果、データベース(DateBasej情報の基地)というシステムが誕生した。

データベースの歴史
データベースという言葉は、1950頃米国国防省で世界の軍事情報を一カ所に集約し、そこへ行けばすべてのデータを得ることが できるように効率化を図ったことが語源とされている。
1959年マギー(W.C.McGee)氏が論文で、現在のデータベースの構造や機能に当てはまる内容を提唱した。

インターネットでの検索
インターネットは、巨大なデータベースである。現在、インターネットを利用して簡単に必要な情報を検索できる。 その検索サービスには、大きく2つある。

●ディレクトリー型検索 
例 ヤフー
●ロボット型検索
  例 グーグル
●ハイブリッド型検索  例 goo
利点 情報の内容により索引付けし、分野別に整理されている。目的別に検索しやすく、キーワードに対して、無駄な情報 が表示されない。 検索ロボットが、定期的に世界のWebを検索しており、情報量が非常に多い。索引付けをロボットが行っており キーワード検索で何万件も表示される。 両者のメリットを兼ね備えた検索サイトで、最近、増えてきている。
欠点 情報量が少ないことや登録された情報しか表示されないデメリットがある。
無駄な情報も多く表示され、必要な情報を絞り込むのが大変である。


演習 インターネットで検索してみよう
演習 次のキーワードを、3つの検索サイトで検索し、比較してみよう。
1.『火山』をキーワードで、比較してみよう。
2.『富士山』と『マウナロア火山』の両方に関係する情報を検索してみよう。
3.『火山』または、『富士山』に関する情報を検索してみよう。
4.『富士山』の情報の中で、『マウナロア火山』を含まない情報を検索してみよう。
5.『マウナロア火山』と『富士山』に関して、『地震』に関連する情報を検索してみよう。

▲ブーリアン検索演算子
次のブーリアン検索演算子を使うことで、複雑な検索をすることができる。現在、ほとんどの検索サイトでは、 検索演算子を使わなくても、詳しく検索などの項目でで簡単に設定できる。 実際には、グーグルの場合、(AND→空白、OR→OR、NOT→-)を使うなど検索サイトに検索演算子を別の記号で 使う場合が多い。演習6のような3つ以上のキーワードについては、( )を使うことで絞り込むことができる。

・AND検索・・・複数のキーワードを含むページを検索する。
・OR検索・・・・指定されたキーワードのうち、少なくとも一つは含むページを検索する。
・NOT検索・・・省きたいキーワードの前に入れることにより、特定のキーワードを含まないWebが検索できる。

シソーラスについて
シソーラスというのは、同義語辞書という意味である。検索エンジンが、同義語辞書を持っていれば、 その言葉に類したサイトを検索することができる。あるサイトで、 この良い検証をしている所があり 参考にさせていただいた。我々は、『的を得た』という言葉を使うが、実は、『的を射た』が正しい 日本語である。しかし、現在では、ほとんど『的を得た』を使っている。これを検索サイトで検索してみると おもしろいことがわかる。グーグルインフォシーク で検索して比較すると、インフォシークでは、同義語辞書を持っていると考えられることと、いかに間違って 『的を得た』と使われている場合が多いかがわかる。実際に、検索してみましょう。

最近の検索ロボット事情
(ウエブクローラー)登録URLを定期的に検索。それをデータベースに登録する技術を、インデックスといい、 これは、各ロボットのインデックス技術による。現在、日本での利用率は、Googleが70%と言われている。googleでは、 リンクを張られている数が重要なポイントとなるが、それに対抗するLycosで使われている、ワイズナットの検索エンジンは、 被リンクページの内容を加味して検索順位の決定を行う、第三世代呼ばれる新しいアルゴリズムを使っている。また、 独自の検索エンジンを使わずに、Yahoo、Exite、biglobe、niftyの検索サイトは、Googleの検索エンジンを使っている。 
HOMEへ データベーストップへ DBMSの役割と構造へ>>>