3. Linked Open Data の作成と公開
ねらい
独自のLinked Open Dataを作成して,Web上に公開する. その一連の作業を通じて,LODに対する理解を深める.
学習項目
- LODの作成方法
- LODの公開方法
関連情報
LODの作成と公開
LOD作成のパターン
LODを作成するには,いくつかの典型的なパターンが存在する.
- 構造化されたデータをRDF形式に変換
- CSV等のファイルを変換
- リレーショナルデータベースを変換.
- テキスト文書をLODに変換
- テキスト文書中の実体(エンティティ)を抽出してRDFデータに変換.DBpediaなど.
LOD公開のパターン
作成したLOD(RDFデータ)を公開する方法にも,いくつかのパターンが存在する.
- 静的なファイルとしてHTTPアクセス可能な場所に設置.
- RDF/XMLやTurtle等のフォーマットでデータを記述してファイルを公開.
- RDFaを使ってXHTML文書に埋め込む.
- RDFとHTMLをサーバサイドスクリプトで提供.
- CMSやフィードなど.
- RDFトリプルストアを利用してLODを公開.
- 既存のアプリケーションやAPIをラップしてLODとして提供.
簡単なLODの作成と公開の例
簡単なデータ作成と公開の例を示す.題材は「学内のシャワー付きトイレ」.
基本となるデータの作成
データの属性を決め,CSVファイルを作成する.
建物,フロア,説明
総合研究棟B,1,身障者用トイレ
3F棟,各階,
3C棟,各階,女性奇数フロア,男性偶数フロア
3A棟,2,身障者用トイレ
CSVからRDFへの変換
CSVからRDFへの変換にはいくつかの方法があるが, 手軽なものとしては以下の方法がある.
- Webサービスを利用
- LinkData.org
- アカウントを作成することによって,データの作成から公開までをサポート. (ただしSPARQLエンドポイントは提供されない.)
- 主な手順は以下の通り.詳細は チュートリアル を参照.
- テーブルのスキーマ(ひな型)を作成
- データ(CSV等)をアップロード
- ローカルにインストールされたプログラムを利用
- OpenRefine + RDF Refine
- OpenRefine はオープンソースのデータ作成・変換ツール.RDF Refineを追加でインストールすることで,RDFデータを出力できる.
- 具体的な手順については LODを作る を参照.
自作データの公開
自作のデータを一般向けに公開するにはいくつかの方法がある. 以下ではおもな二つの方法について説明する.
SPARQLエンドポイントへのアップロード
SPARQLエンドポイントにデータをアップロードする. すでに公開されているSPARQLエンドポイントがあればそれらを利用することができる.
また,自前でSPARQLエンドポイントを立ち上げてそこにデータをアップロードすることもできる.
(参考)Webサイトを通じたデータの公開
生成したRDFデータを,Web参照可能な場所に配置する.
COINS環境では,~/public_html/htdocs/
以下が
http://www.coins.tsukuba.ac.jp/~<ユーザ名>
で参照可能である.
ベースURIを参考に,適切なディレクトリを作成,公開ファイルを設置する.
例: $ mkdir -p ~/public_html/htdocs/lod $ cp output_yyyymmddhhmm.ttl ~/public_html/htdocs/e-toilet-seat.ttl
WebサーバにRDFデータのファイルタイプを教える.同じディレクトリに
.htaccess
というファイルを作成する.
.htaccess
:
AddType text/n3;charset=utf-8 .n3
AddType text/turtle;charset=utf-8 .ttl
LODブラウザで確認
LODデータを閲覧するためのブラウザでデータにアクセスできることを確認す る.
レポート(課題3のためのデータ作成)
課題
自作のLODを作成する.
- 筑波大学に関連するデータを作成しよう.
- 例えば以下のような情報を元に作成することが可能:
- 地図とデータで見る筑波大学リーフレット
- 筑波キャンパスの電力使用状況・CO2排出量
- データ変換スクリプトを作成してもOK(というかむしろ推奨).
提出物
作成したデータ
提出方法:課題3のアプリケーションの中に作成したデータを格納して提出してもらいます.
提出締切
なし
6/26 に,作成しているデータについてのヒアリングがあります.