三田評論ONLINE

【特集:デジタルアーカイブの展望】
永崎 研宣:デジタルアーカイブの現在地とこれから──公開から連携へ

2024/11/05

  • 永崎 研宣(ながさき きよのり)

    慶應義塾大学文学部図書館・情報学専攻教授

はじめに

デジタルアーカイブ(以下、DA)と呼ばれる資料のデジタル化と公開の動向が広まり始めてから四半世紀が過ぎた。デジタルアーカイブ学会が設立されて実務者と研究者が交流しつつDAの未来を模索していく場が形成されるなど、これを担おうとする人が着実に増えてきているように思う。DAには様々な定義があるが、つまるところ、様々なタイプの資料をデジタル化して公開・共有することを中心とした営みであるため、関わる人々の多様さはその資料の種類と同様である。そのような中でも、デジタル技術やそれを巡る法制度等に関してはある程度議論の場を共有できるため、そういった軸を踏まえて学会をはじめとする様々なコミュニティの形成や活動が行われつつあるということだろう。

最近のDA学会誌を見てみると、高野明彦「DAの3つの価値*1」では、「ジャパンサーチ戦略方針 2021-2025『デジタルアーカイブを日常にする』」において提示した「3つの価値:デジタルアーカイブの大切な役割」、すなわち(1)記録・記憶の継承と再構築、(2)コミュニティを支える共通知識基盤、(3)新たな社会ネットワークの形成、を改めて挙げている。紙幅の関係で詳細には入らないが、ここで語られる価値は、知識基盤の内容が連携し、それに伴って人々も連携していき、よりよい社会ネットワークが形成されていくことを1つの重要な要素としていると筆者としては理解している。

DAは目立つコンテンツが公開された時には話題になるが、全体としては、その大部分はあまり目立たず、誰かが発見してくれることを待ち続けているものである。そして、いつか誰かが価値を見いだしてくれる可能性のために保存され公開され続けている。実際に、個別に見ると大きな価値をもたないものでも、集約されることで価値を持ったり、コミュニティの中に位置づけられることで価値を持ったり、他の様々な資料と連携することで価値を持つこともある。

DA連携とは

連携としてすぐに思い浮かぶのは、ジャパンサーチEuropeana等、メタデータの横断検索を可能とするポータルサイトである。そして、近年ではさらに粒度の細かい連携の可能性が拓かれてきている。ここではその背景と現状について簡単に紹介したい。

粒度の細かい連携とは、DAにおける1つの資料や1つのアイテムよりも小さな単位で内外からのアノテーション(注釈)を付与しやすい仕組みと、そのようにして付与した知的作業の成果としてのアノテーションをなるべく持続可能なものとすることである。

内外からアノテーションを付与するためには、それを可能とするためのソフトウェアが必要となる。かつては、企業や研究者、開発者が用意する特別な仕組みであることが多かった。しかし、特注のソフトウェアでアノテーションが行われた場合、外部のサイトと連携しようとしたら両者が同じソフトウェアを導入しなければならない。あるいは、単独で実施した場合にも、システム更新の必要が生じた時に同じ開発元のソフトウェアを継続して導入しなければアノテーションという知的作業の成果が利用できなくなってしまう。さらに言えば、そのソフトウェアがバージョンアップして以前のものと互換性を失ったり、あるいは、ソフトウェアの開発が終了してしまったりした場合などは、その成果は失われてしまうことになる可能性がある。たとえば、アドビ社のFlashの事業停止がもたらした混乱は記憶に新しい。紙媒体で刊行される知的作業の成果である紙の本が国立国会図書館に行けば概ねいつでも閲覧できることと比較すると、DAにおける知的作業は、先進的な取組みや理論面での議論はともかく、現場レベルでは持続可能性においてまだ安心できると言える状況ではないように思われる。

このような状況を回避するための措置としては、データとソフトウェアを分離した上でデータを標準的かつオープンな形式で作成するということが様々な分野で広く行われている。たとえばマイクロソフトのワードやエクセル、あるいはPDF等は、国際標準規格としてデータ形式が公表されており、同じ形式を利用できる様々なソフトウェアが普及している。データ形式を公表しつつ共通化することは、データを様々なソフトウェアで利用可能とし、特定の人や企業への依存度を下げることで、持続可能性を高めるための重要な要素となるものである。

IIIFによるDA連携

DA全体としても、Webの利用が広まった結果、Webブラウザという1つのソフトウェアで様々なコンテンツを閲覧できるが、さらに近年では、DAの外形や内容により即した形式でデータ形式を標準化しようとする動きが国内外で広まってきている。特に注目しておきたいのはIIIF(International Image Interoperability Framework)である。この規格で標準化しているのは、「Webで公開されている様々なコンテンツにおける部分的な位置や領域を国際的に共通のデータ形式で指示できる」ことである。

これは、たとえば、あるサイトで公開されている西洋中世写本において細密画が切り取られた箇所を指定して、他のサイトで公開されている該当する細密画の画像を切り取られた箇所にぴったりとあわせてWebブラウザ上で表示させるといったことを可能とする。この規格では、別々のサイトにある情報の該当箇所だけを取り出して組み合わせて新しいコンテンツを作り出すことも可能であり、典型例としては、日本の絵巻物を中心として古今東西の美術作品から顔の部分を切り出してそれぞれにアノテーションを施した顔貌コレクションが有名である。原稿執筆時点では108作品から9675件の顔画像が切り出され、データセットとして誰でも研究等に利用できる形で公開されている。

IIIFの普及は、世界各地のWebコンテンツを自由に活用できるようにし、それによってWebコンテンツの価値を高める可能性をより拡大した。初期の頃は「サイロから解放する」という表現がよく用いられていたが、それぞれのWebコンテンツが各自のサイトのなかで閉じ込められていて、連携させるためには大きなコストがかかってしまう上に必ずしもうまくできる保証もなく、個々のコンテンツの価値をより高めていくための方策が求められるなかで、こういった規格が発案されたようである。

IIIFは、国際的には欧米の多くの有力大学の図書館が貴重資料のWeb公開において採用しており、国立図書館でも仏英米独をはじめいくつかの国で採用されている。日本でも現在では国立国会図書館や国文学研究資料館など、大規模コンテンツを公開している組織が採用しているため、日本におけるIIIF対応コンテンツ数はかなりの規模となっている。ちなみに、慶應義塾大学メディアセンターでもIIIFを採用しているが、これは国内の大学図書館としては最初の例だったようである。

IIIFに準拠した公開をすることにより、DAは、1つ1つのアイテムからコンテンツの各部分のレベルまで、様々なコンテクストで自由に内容を連携させて新たな価値を付与される可能性を高めることができる。詳しくは、筆者らが本年刊行した『IIIFが拓くデジタルアーカイブ』(文学通信)を参照されたい。

カテゴリ
三田評論のコーナー

本誌を購入する

関連コンテンツ

最新記事