世界各国のウェブアーカイブでは、そこで保存されているコンテンツのすべてが無条件でインターネット公開されることは珍しく、アクセス可能な場所や資格、範囲など、何らかの制限を設けて公開されるのが一般的です。
ウェブアーカイブが本格的に実施され始めた当初は、コンテンツがまったく公開されないことも珍しくありませんでした。
当時は安定した収集技術の確立に力が注がれており、先ずは日々消えていくウェブサイトを消滅する前に収集することが最優先の課題とされていました。相対的に、公開については未検討あるいは優先度が低いとする考え方があり[1]、それは当時の状況下では決して不自然なものではありませんでした。
一方で、一部には公開を意識していたウェブアーカイブもあり、システムにより様々なパターンのアクセス制御(公開期間の設定、対象ユーザの設定など)を可能にすることで、コンテンツの性質に応じた公開を行っていました[2]。
その後、世界各国のウェブアーカイブ機関の連携・協力により、収集ロボットを始めとする基本的な技術が開発され収集が安定的に行えるようになると、徐々に公開に焦点が当てられるようになりました。
2009年10月に開催されたIIPCオープンミーティングにおいて、インターネットアーカイブの代表であるケール(Brewster Kahle)氏は、『ウェブアーカイブがたとえ長期保存されても、利用に供されない「ダークアーカイブ」では意味がなく、常に利用を前提とした保存を考えることが重要である』と述べています[3]。
ダークアーカイブとは非公開のアーカイブのことで、その他、制限を設けて公開されるものはグレイアーカイブ、インターネット上で公開されるものはホワイトアーカイブと呼ばれることがあります。
インターネットアーカイブのWayback Machineでは、収集したコンテンツを原則インターネット上で公開しており、申し出があれば公開を停止する方式(オプトアウト方式)を採用しています。ただし、これは米国著作権法に定めるフェアユースの考えに基づいており、ウェブアーカイブの中でも特異な例と言えます。
ほとんどのウェブアーカイブは、公開にあたって何らかの制限を設けざるを得ません。その理由として以下のような観点が挙げられます。
ウェブアーカイブの公開にあたっては、自国の著作権法を遵守し発信者の著作権を侵害しないよう注意する必要があります。
法律により複製に係る著作権を制限することで、事前に発信者からの許諾を得ることなく収集が可能であっても、インターネット公開については法律による権利制限が設けられていない場合が多くあります。特に「.fr」や「.uk」などのトップレベルドメインでバルク収集したコンテンツがインターネットで無条件で公開されることはほとんどありません。その多くが施設内に限定したり研究目的に限定したりして公開されています。
ウェブサイト内には個人情報が多く含まれています。それらをインターネットで公開することは非常にセンシティブな問題をはらんでいますので、極めて慎重に扱う必要があります。
インターネットで公開されているウェブアーカイブの多くは発信者から許諾を得たものです。選択収集は、事前に発信者から収集・保存・公開について許諾を得た上で行いますので、バルク収集とは対照的にインターネット公開できるものが多い傾向にあります。もちろん発信者が施設内に限定しての公開を望む場合には、その条件に従わなければなりません。
また、バルク収集でも範囲が限定(例えば政府サイト限定など)されている場合には、公開に係る著作権が法的に制限されていたり、発信者から許諾を得たりするなどして、インターネット公開を実施しているウェブアーカイブもあります。
世界各国の主なウェブアーカイブの公開状況を下表にまとめました。
ウェブサイトにはありとあらゆる情報が詰まっており、その膨大な蓄積がウェブアーカイブです。それらを公開するためには、上で述べた著作権や個人情報なども含めて多様な観点から十分に検討しなければなりません。一方で、収集・保存をしても利用されなければアーカイブとしての意味がないと言うのもそのとおりです。
公開にあたっては、各国の事情や時代の要求に合わせつつ、制限と利用のバランスが取れた最適の公開方法を模索することが必要なのです。
(最終更新日:2014/10/1)