WARPは国立国会図書館が運営するウェブアーカイブです(国立国会図書館インターネット資料収集保存事業)。日本国内のウェブサイトを収集しています。
国立国会図書館によるウェブアーカイブ事業は、2002年に始まりました。当初は発信者の許諾を得て選択的に収集していましたが、国立国会図書館法の改正により、2010年4月から公的機関(国の機関、地方自治体、独立行政法人、国公立大学など)のウェブサイトを、許諾を得ることなく網羅的に収集できるようになりました(制度収集)。このことにより、WARPの収集量は2010年以降大きく伸びています。なお、民間のウェブサイトついては、言論の委縮をまねくおそれがあるなどの観点から法律による収集の対象とはなっておらず、引き続き許諾に基づき収集しています。
WARPではターゲット単位で収集を行っており、ターゲットに応じて収集する頻度を決めています。大規模災害が発生した際には、頻繁に更新される情報を確実に収集するため、頻度を上げて収集する場合もあります。
これまでに11,000タイトル以上を収集しており、累積データ量は800テラバイトを超えました(2016年11月現在)。収集したウェブサイトは、国立国会図書館内で閲覧できるほか、発信者の許諾を得たものはインターネット上でも公開しています。
保存されているウェブサイトは、URLやタイトル、公開者名などで検索できます。全文検索も可能です。サイト種別ごとのブラウジングが可能なコレクション検索も用意されています。詳しい検索方法については「ヘルプ」をご覧ください。
以下のコーナーなどを通じて、コンテンツを閲覧することもできます。
毎月特定のテーマに基づき、保存したウェブサイトを紹介しています。
「平成の大合併」により消失した市町村サイトなど、特徴的なコレクションを紹介しています。また、コンテンツの可視化も行っています。
あるウェブサイトの過去の有り様を調べるという以外にも、WARPを活用する方法があります。
例えば、過去の古くなったページについては、WARPで保存されているページへリンクを張って閲覧を保障するという方法です。古いデータを自機関で管理する必要がなくなり、サーバーやサイト管理者の負担を減らすことができます。
また、WARPに保存されている様々なデータが、何らかの分析に役に立つかもしれません。国立国会図書館は、WARPに保存されている地方自治体のウェブサイトを使ったデータの可視化イベントを開催するなどして、活用促進を図っています。ウェブアーカイブに蓄積された膨大なデータを研究にいかそうという取組は、世界的にも広がっています。
(最終更新日:2016/11/24)