Mariko Kamie's Home Page
RESEARCH
HOME
PROFILE
PAPER
RESEARCH
LINK
研究概要
WikipediaによるWeb動画像のテキスト情報補完
背景
動画共有サイトが普及しWeb動画像数が増加、Web動画像(以降、"動画像"は"web動画像"を意味する)の内容も多岐に渡っている
YouTube
世界最大の動画共有サイト
2010年7月のユニーク視聴者数が1億4300万人以上(市場調査会社comScore調べ)
様々な用途に用いられるようになり、コンテンツ数は増加を続けている
企業の公式アカウントにあるコマーシャル動画像から、ゲーム映像等のユーザ生成の趣味動画像に至るまで
Web動画像の特徴(ACMの論文参考)
動画像付属テキスト情報(動画像の内容を説明する、投稿者あるいは視聴者が付加した、タイトル、タブ、説明文等のテキスト情報)の信頼性が低い(引用: ”Integrating web 2.0 resources by wikipedia”, C. Liu et al.Anthony K.H. Tung, ACM MM’10 )
表記ゆれがある
同音異義語が多い(“Orange”は「果物」と「色」の意味を持つ)
同義語が多い(“Leopard”と”Mac OS X”はAppleのOSを示す)
ノイズが多い
Viewerの興味を引くために,内容に無関係なタグを付加してしまうことがある
動画像付属テキスト情報の情報量が少ない
求められている技術
統一的な記述用法で書かれた、動画像の内容を正確・詳細に説明する「動画像内容説明テキスト文章」
動画像によって動画像内容説明テキスト文章の書式が違うのでは見づらい
投稿者による表記ゆれ、情報量不足を解消できる
「キーワード検索による動画像の検索」等の精度向上が期待出来る
様々な角度から捉えた、動画像間の関係抽出
Wikipedia
不特定多数の有志によって作成・編集されたオンライン百科辞典
信頼性が高い
記事は沢山の人に訂正を加えられることによって正しさを保っている
誤りの数が百科事典の金字塔「ブリタニカ百科事典」とさほど変わらず、「驚くほど優れている」という結果が調査結果がある(英科学誌 Nature、2006年調べ)
表記ゆれがない
同音異義語は、内容を説明する十分なテキストによって違う対象に関する記述だと判断できる
Wikiエントリ内に同義語・略語に関する記述があるので、同義語によるコンピュータの単語認識精度低下を防げる
ある対象に対するWikiエントリは1つだけ
十分な情報量
対象に関する十分な記述
オンラインニュースと比較して
豊富なコンテンツ数
250以上の言語で利用可能、2600万本以上のWikiエントリ(記事)が存在する (2011年1月時点, AFP BBNewsより)
ニュースほど即時性はないが、比較的迅速に新しいイベント等に関するWikiエントリが生成される
2/26に発生した京大入試でのカンニング事件に関するWikiエントリが5日後の3/3に既に存在
コンテンツ保有時間が長い
様々な側面から見て関連しているWikiエントリの情報を提供している
Wikiエントリのリンク構造全体図
目的
WikipediaエントリとWeb動画像の対応付け
研究の利点
統一的な記述方法で書かれた、対象や事象を十分に説明しているテキスト文書へ動画像を対応付け出来る
表記ゆれ、情報量不足によるキーワード検索等の精度低下を防げる
様々な側面での動画像間の関連関係が、Wikipediaリンク構造から把握できる
従来研究
Web Video Categorization based on Wikipedia Categories and Content-Duplicated Open Resources
Z. Chen(Chinese Academy of Sciences) at el.
ACM MM 2010
Wikipedia Based News Video Topic Modeling for Information Extraction
S. Roy et al.(A*STAR, Singapore)
ADVANCES IN MULTIMEDIA MODELING, Springer, 2011
Wikipediaを利用したニュース映像アーカイブへの自動索引付け
奥岡 知樹(名古屋大学)et al.
第5回デジタルコンテンツシンポジウム、pp.1-6(2009年1月)
従来手法の問題点
タイトル、タブだけを用いたWikipediaエントリとの対応づけ
ユーザ生成動画像では表記ゆれがあり、正確にマッチングできない
ユーザ生成動画像では情報量が少ない
音声認識結果を用いたWikipediaエントリとの対応づけ
音声認識は現在ではまだ精度が低い
クローズドキャプションを用いたWikipediaエントリとの対応付け
Web動画像ではクローズドキャプションがない
提案手法
動画像集合の話題構造を利用し、付属テキストの表記ゆれ・情報量不足を補う
手順
動画像の付属テキストを利用し、動画像集合から話題構造を抽出する
戸田さんの手法を適用
関連のあるノード(動画像)間は、関連度に基づく重み付きエッジで結ばれている
4種類のノード
コアノード:同一話題内の多くのノードと強い類似度を持ち、話題の中心となるノード
サプリメンタルノード:コアノードと強い関わりを持ち、話題の中心の内容を補足するようなノード
サブトピックノード:コアノードもしくはサプリメンタルノードとつながりをもつノード
アウトライヤーノード:特定のノード群とつながりを持たないノード、他のノードとは内容の重ならないノード
コアノードの付属テキスト情報を、サプリメンタルノードの付属テキスト情報で補う
Enrich付属テキスト情報の作成
コアノードの内容を表現するWikiエントリ(コアWiki)を特定する
Enrich付属テキスト情報と最もテキスト類似度の高いWikiエントリを、コアWikiとする
サプリメンタルノードと最も関連するWikiエントリ(サプリメンタルWiki)を特定する
コアWiki、コアWikiとリンクが貼られているWikiエントリ、の中で一番テキスト類似度が高いものとする
サブトピックノードと最も関連するWikiエントリ(サブトピックWiki)を特定する
コアWiki、サプリメンタルWiki、サプリメンタルWikiとリンクが貼られているWikiエントリ、の中で一番テキスト類似度が高いものとする
アウトライヤーノードと最も関連するWikiエントリ(アウトライヤーWiki)を特定する
アウトライヤーノードの付属テキスト情報をクエリとして、最もテキスト類似度の高いWikiエントリとする
将来の展望
動画像集合からの話題構造抽出の際に下記の情報も考慮する
画像特徴
YouTube特有のデータ(YouTube上の動画像に特化した場合)
動画レスポンス関係
「レスポンス動画」機能:動画像に対するコメントとして動画像を投稿する機能。関連動画が「コメント」として付加されていることが多い
再生リストの関係、再生リストについているタグ
「再生リスト」機能:複数の動画像に同じタグを付けて、動画像セットとして管理する
Copyright (C) Mariko Kamie's Home Page !. All Rights Reserved.