トップ > 世界のウェブアーカイブ(おすすめコンテンツ) > Internet Archive “Wayback Machine”

Internet Archive “Wayback Machine”

Wayback Machine は、インターネットアーカイブ(Internet Archive)が保存しているウェブサイトを閲覧できるサービスです。

インターネットアーカイブは世界中のウェブ情報を代表とするさまざまなデジタル情報をアーカイブしている非営利法人です。1996年にBrewster Kahle氏によって設立されました。

インターネットアーカイブはなぜデジタル情報を集めているのでしょう。それはデジタル形式で保存された歴史資料を、研究者や歴史学者ひいては全世界の人々が将来にわたって利用できるようインターネット上に図書館を作るためです。保存しているデータ量は年々増加し、2012年10月にはついに10ペタバイト(約100万ギガバイト)を突破しました。当初、インターネットアーカイブはウェブ情報の保存に力を入れていましたが、現在は、電子書籍や動画、音源などの保存にも取り組んでいます。

Wayback Machine

トップページWayback Machineのトップページにある以下のフォームに閲覧したいウェブページのURLを入力します。

以下のようなカレンダーが表示されます。このカレンダーから日付を選択すればその日のウェブページを閲覧することができます。なお、Wayback MachineではURLを指定した検索のみ可能で、ウェブページの全文検索はできません。

試しに2011年7月22日の国立国会図書館ホームページを見てみましょう。

カレンダーから該当する日を選択すると、URLがhttp://web.archive.org/web/20110722105351/http://ndl.go.jp/となるページが表示されます。このURLは2011年7月22日10時53分51秒に収集したhttp://ndl.go.jp/のページということを表しています。

画面上部のツールバーで閲覧したい日付を選択すれば、別の日に収集したウェブページを閲覧することができます。閲覧しているページの中にあるリンクから遷移する際は、閲覧しているページの収集日に最も近い日付に収集したページへと遷移します。

なお、Wayback Machineでウェブサイト中の全てのページが閲覧できるわけではありません。技術的に収集が難しいウェブページなど、収集ロボットが収集できないページがあるからです。もしリンクの遷移先のページが保存されていなかった場合は、指定したURLの現在のウェブページが表示されるようになっています。

インターネットアーカイブでは指定された時点の指定されたURLを収集してないというメッセージのスナップショット拡大図を表示

指定された時点の指定されたURLを収集してないというメッセージ

ウェブサイトの収集

次は、ウェブサイトの収集についてです。インターネット上にあるウェブサイトの数は非常に膨大で、次々に新しいサイトが作られ、また消えていきます。インターネットアーカイブはそれら全てのサイトを収集できているわけではありません。インターネットアーカイブは主要なディレクトリサービス(例えば、dmoz.orgなど)や有名なサイトにはられているリンクから収集対象とするウェブサイトのURL情報を見つけます。もし、ウェブサイトがそれらからリンクされていなければ、そのサイトはインターネットアーカイブに収集されません。また、ウェブサイト管理者がロボット排除設定により収集の拒否を明示している場合やパスワードで保護されている場合もインターネットアーカイブには収集されません。なお、保存されたウェブサイトを閲覧できないようにする方法も用意されています。

もし特定のページを収集してほしい場合は、そのページをWayback Machineで表示することでそれが可能です。画面にはオリジナルサイトが表示されますが、表示した瞬間にインターネットアーカイブがそのページを収集しようとします(以下のツールバーに保存したことが通知されます)。

保存したことを通知するメッセージのスナップショットの拡大図を表示

保存したことを通知するメッセージ

インターネットアーカイブは1カ月当たり20テラバイト分のウェブページを収集し、これまでに1,500億以上のウェブページが保存されています。なお、ウェブページが収集され、Wayback Machine で閲覧できるようになるまでには6カ月から24カ月かかります。

フェアユースに基づいたアーカイブ構築

インターネットアーカイブがこれほど大規模にウェブアーカイブを構築できるのはフェアユースに基づいているからです。米国では著作権にフェアユースと呼ばれる規定があります。著作物を利用する場合に、それが公正な利用であれば著作権の侵害には当たりません。その規定を基にWayback Machineは運営されています。

その他のサービス

インターネットアーカイブが運営しているサービスはWayback Machineだけではありません。そのうちのいくつかを紹介します。

Archive-It

Archive-Itという有料のサービスを提供しています。

ウェブアーカイブの専門知識がなくても、Archive-Itが用意した操作画面を使えば簡単にサービス利用者が指定した組織のウェブサイトを保存することができます。保存したウェブサイトはインターネットアーカイブに保管され、全文検索ができるようになります。

Open Library

インターネットアーカイブはOpen Libraryというプロジェクトの運営も行っています。

このプロジェクトでは、これまでに出版されたすべての書籍に関する情報を集めようとしています。Open Libraryを使えばインターネットアーカイブに保存されている児童書から学術書までの様々な電子書籍を利用できます。また、インターネットアーカイブに保存されていない場合もWorldCatやオンライン書店へ遷移することができます。また、インターネットアーカイブでは図書館と協力して書籍のデジタル化も行っています。2011年の9月にはその数が200万冊に達しました。

動画、音源の保存

昔の映画やニュース映像、音楽ライブの音源、オーディオブックなど幅広く動画や音源を集めています。例えば、グレイトフル・デッドのライブ音源2012年米国大統領選挙に関するニュース番組などが保存されています。

(最終更新日:2016/11/22)

ページの先頭へ

Copyright © 2013- National Diet Library. All Rights Reserved.