オーストラリア国立図書館(National Library of Australia、以下NLA)はウェブアーカイブの草分け的存在です。
PANDORAは、1996年に始まった選択収集によるアーカイブです。PANDORAでは、「オーストラリアに関すること、またはオーストラリア人にとって重要なかかわりがある、またはオーストラリア人によって作成されている」サイトであることが収集対象の基準です。運営の中心はNLAですが、同時に国内の州立図書館や博物館も、協力機関として非常に重要な役割を果たしています。
収集サイトの選定にあたっては、NLAや各協力機関はそれぞれ各自の選定基準を持ち、分担して選定に当たります。例えば、NLAは連邦政府の刊行物や国家的重要性のあるサイトを、オーストラリア戦争記念館は軍の歴史に関するサイトや、国軍の各種報告書等を、各州立図書館はそれぞれの地方の選挙関連情報や、州政府出版物等の選定を担当しています。
さらに、NLAや各協力機関はそれぞれが選定したサイトについて収集・保存・メタデータの整理を行います。こうした一連の作業を地理的に離れた各協力機関で行えるよう、NLAは共通システム「PANDA (PANDORA Digital Archiving System)」を開発しました。
選択収集(PANDORA)で質の高いアーカイブを構築する一方、収集漏れのリスクに対応するためにはバルク収集が有効であるという考えに基づき、2011年から政府機関サイトのバルク収集が開始されました。こうして構築されたのが、Australian Government Web Archive (AGWA)であり、2014年に公開されました。このAGWAの実施にあたっては、2010年の通達(Whole–of-Government ICT Policy (2010/001 AGIMO Circular))により法的な枠組みが整備されました。
PANDORA、AGWAに加え、NLAは2005年から毎年、インターネットアーカイブと協力して、.auドメインのバルク収集を実施してきました。さらに、インターネットアーカイブが保存していた.auドメインのウェブサイトも、1996年収集分までさかのぼってこのコレクションに加えられ、アーカイブの充実が図られました。
NLAは2019年、PANDORA、AGWA、そしてドメインハーベストの三つのウェブアーカイブを統合し、Australian Web Archiveを公開しました。このことにより、NLAのウェブアーカイブを一体的に利用できるようになりました。なお、ドメインハーベストにより保存されたコンテンツは、Australian Web Archiveの公開により初めて、一般に利用が可能となったものです。
Australian Web Archiveは、NLAの情報探索サービスTroveを通じて利用できます。アーカイブページの本文検索が可能で、詳細検索では、特定のドメインやファイルタイプに絞って検索することもできます。
Troveの「Archived websites」を選択し、検索窓にキーワードやURLを入力します。「Uluru」という単語で検索してみましょう。検索窓の下にある「Limit to the gov.au web domain」にチェックすることで、検索対象をオーストラリア政府のサイトに限定することも可能です。
検索結果一覧には、ヒットしたすべてのページではなく、ドメインごとのリストが表示されます。タイトル部分のリンクをクリックすると、アーカイブされたページを閲覧できます。また、各検索結果の右に表示されている「More results from '[ドメイン名]'」をクリックすると、そのドメインのみの検索結果が表示されます。
アーカイブページ上には、保存日を示す小さな別窓が表示されます。日付横に示されているカレンダーや時計のアイコンをクリックすることで、他の日に保存された同じURLのページに遷移できます。この別窓を、右上の「-」ボタンをクリックして非表示にすることも可能です。
(最終更新日:2020/3/12)