3. Linked Open Data の作成と公開

ねらい

独自のLinked Open Dataを作成して,Web上に公開する. その一連の作業を通じて,LODに対する理解を深める.

学習項目

  • LODの作成方法
  • LODの公開方法

関連情報

LODの作成と公開

LOD作成のパターン

LODを作成するには,いくつかの典型的なパターンが存在する.

  • 構造化されたデータをRDF形式に変換
    • CSV等のファイルを変換
    • リレーショナルデータベースを変換.
  • テキスト文書をLODに変換
    • テキスト文書中の実体(エンティティ)を抽出してRDFデータに変換.DBpediaなど.

LOD公開のパターン

作成したLOD(RDFデータ)を公開する方法にも,いくつかのパターンが存在する.

  • 静的なファイルとしてHTTPアクセス可能な場所に設置.
    • RDF/XMLやTurtle等のフォーマットでデータを記述してファイルを公開.
  • RDFaを使ってXHTML文書に埋め込む.
  • RDFとHTMLをサーバサイドスクリプトで提供.
    • CMSやフィードなど.
  • RDFトリプルストアを利用してLODを公開.
  • 既存のアプリケーションやAPIをラップしてLODとして提供.

簡単なLODの作成と公開の例

簡単なデータ作成と公開の例を示す.題材は「学内のシャワー付きトイレ」.

基本となるデータの作成

データの属性を決め,CSVファイルを作成する.

建物,フロア,説明
総合研究棟B,1,身障者用トイレ
3F棟,各階,
3C棟,各階,女性奇数フロア,男性偶数フロア
3A棟,2,身障者用トイレ

CSVからRDFへの変換

CSVからRDFへの変換にはいくつかの方法があるが, 手軽なものとしては以下の方法がある.

  • Webサービスを利用
  • LinkData.org
    • アカウントを作成することによって,データの作成から公開までをサポート. (ただしSPARQLエンドポイントは提供されない.)
    • 主な手順は以下の通り.詳細は チュートリアル を参照.
    • テーブルのスキーマ(ひな型)を作成
    • データ(CSV等)をアップロード
  • ローカルにインストールされたプログラムを利用
  • OpenRefine + RDF Refine
    • OpenRefine はオープンソースのデータ作成・変換ツール.RDF Refineを追加でインストールすることで,RDFデータを出力できる.
    • 具体的な手順については LODを作る を参照.

自作データの公開

自作のデータを一般向けに公開するにはいくつかの方法がある. 以下ではおもな二つの方法について説明する.

SPARQLエンドポイントへのアップロード

SPARQLエンドポイントにデータをアップロードする. すでに公開されているSPARQLエンドポイントがあればそれらを利用することができる.

また,自前でSPARQLエンドポイントを立ち上げてそこにデータをアップロードすることもできる.

(参考)RDFデータベースのインストール・データ登録

(参考)Webサイトを通じたデータの公開

生成したRDFデータを,Web参照可能な場所に配置する. COINS環境では,~/public_html/htdocs/ 以下が http://www.coins.tsukuba.ac.jp/~<ユーザ名> で参照可能である. ベースURIを参考に,適切なディレクトリを作成,公開ファイルを設置する.

例: $ mkdir -p ~/public_html/htdocs/lod $ cp output_yyyymmddhhmm.ttl ~/public_html/htdocs/e-toilet-seat.ttl

WebサーバにRDFデータのファイルタイプを教える.同じディレクトリに .htaccess というファイルを作成する.

.htaccess: AddType text/n3;charset=utf-8 .n3 AddType text/turtle;charset=utf-8 .ttl

LODブラウザで確認

LODデータを閲覧するためのブラウザでデータにアクセスできることを確認す る.

レポート(課題3のためのデータ作成)

課題

自作のLODを作成する.

提出物

作成したデータ

提出方法:課題3のアプリケーションの中に作成したデータを格納して提出してもらいます.

提出締切

なし

6/26 に,作成しているデータについてのヒアリングがあります.