更新終了

残念ながら,博士過程に進学せずに就職をするので,大学院の二年間続けた研究(?)日記を終了します.

企業では,開発職として,OSやネットワークに関わる仕事に就きます.
大学院で身につけた忍耐力で企業でも頑張ろうと思います.

それでは

大喜
- | - | -

DMIEW@福岡

DEIMが終わってすぐに福岡の国際学会に参加.期間は3/16~19.
英語の発表練習はある程度していたので,気楽に地元を楽しもうと思ってた.
初日に発表があり,日本人がたくさんだったので,国内学会とほとんど変わらない感じで発表した.
質問は
1,情報源の動的選択の具体的な説明をしてくれ
2,システム負荷を軽減するための改善策はあるか
3,新規演算を含めた問合せ最適化について

最後の質問に上手く答えられなかった.この点は反省.
ただ,発表後にchairの先生にプレゼンが上手かったと言われたのは嬉しかった.

最後の学会参加も明日で終わり.楽しもうと思う.

dmiew00.JPG

dmiew01.JPG
研究 | - | -

DEIM発表終了

発表練習を十分にしていなかったので,所々で話しが詰まってしまった.
発表後の質問は,
1,対象情報源の探索はどのように行われるか
2,演算配置最適化の計算コストは
3,手法を提案して良かったか

参加したセッションが研究テーマが少々異なっていたので,突っ込まれた質問はなかった.
会議後に頂いたコメントも「実環境での評価を期待します」と一行あっただけ.悲しす...

期待していたbanquetの寿司はあまりおいしくなかった.
会議はつま恋で行われ,広々としていたし,ゆっくりできた.
最終日は掛川城に行ってきた.富士山が見れなくて残念

写真
diem00.JPG

diem01.JPG
研究 | - | -

DEIM

今日から三日間静岡の掛川でDEIMという国内学会があります.
http://db-event.jpn.org/deim2009/index.html

僕は,中日の時系列セッションで分散ストリーム処理に関する発表をします.
北川研究室のストリーム処理系メンバは最終日のストリーム処理セッションに固まっています.

三日間の間で,休憩,観光,発表,交流,TOD論文書きをする予定です.

後,dinnerに期待してます!寿司希望
研究 | - | -

修士論文口述発表終了

2/5日に無事修士論文の口述発表が終了した。
タイトルは「対象情報源を動的に探索可能なストリーム処理機能に関する研究」

発表の様子
DSCN5282.JPG

Q 位置情報を取得するのは難しくないか
という問いに対する回答が悪く、時間を要してしまった。
他は、まぁ良かったと思う。

今週は、実環境での実験とDEIM論文の再執筆を行う。
研究 | - | -

謹賀新年

新年明けましておめでとうございます。今年もよろしくお願い致します。

あとわずか3か月で大学院を卒業し、社会人になります。大学院卒業のためには、今月21日締め切りの卒業論文を頑張らなければなりません。

ということで、頑張っています。

また、DEIMが今月の9日に締め切りなので、同時進行で頑張ります〜

happynewyear.JPG
- | - | -

WebDB2008

DB系国内唯一の査読ありワークショップDBWeb2008が二日間に渡り学習院大学で開かれた。
大まかな報告や感想を述べる。

○初日
・午前の特別セッション
情報爆発と情報信憑性について、
喜連川先生、Hang Li(マイクロソフト)、Xiaofang Zou(Queensland大)、田中先生がそれぞれ討論をしていた。情報爆発時代において、知識の共有や巡回を行うための基盤技術や、大量の情報の信憑性について話された。

・技術報告セッション
企業の人が15分以内で製品紹介や会社紹介をしていた。

楽天: 楽天研究開発シンポジウム2008の紹介
初の楽天発信のシンポジウムの試み。
キーノートには、まつもとひろゆき氏、アニリール氏(トルコ人宇宙飛行士)を招待。
学生のみの発表であり、口頭9, ポスター12
優秀論文賞の人は賞金10万、副は5万、優秀ポスターは5万。
投稿した大学は東工大、筑波大、北陸先端大などなど

NTT: Postgresへの取り組み
NTTのOSセンタ部署のPostgresへの改良・性能チェックの取り組みについての講演。
具体的には、
ガーベッジコレクション(VACUUM)の処理を複数化
チェックポイント時の負荷(一度にHDDに書くのではなく、少しずつ書き出す)などなど
詳しくはこちら

サイボウズ: サイボウズ紹介
グループウェア紹介

富士通: 瞬索〜純国産テキスト型データベースエンジン
Googleのようにインデックスを作成しない検索エンジン。
インデックスの作成は形態素解析やN-gramが用いられるが、作成コストがとても大きいので作りたくない。しかし、インデックスが無いと、検索クエリとのマッチングに多大な時間がかかる。
瞬索では、1981年に九州大学の有川先生が考案したSIGUMAという検索アルゴリズムを利用することにより、高速マッチングを実現している。SIGUMAでは、テキストデータ、検索クエリの文字コードを4ビット等の固定長単位にスライスし、オートマトンを作成する。検索クエリがオートマトンに投げられると、先頭から順に読み込まれ、検索語に一致する文字列を同時並行して検出する一方逐次処理が行われる。このメリットは、検索語数が大きくなってもデータ走査は一度のみになり、検索時間は常に一定となる。
具体的には、300ページ(2000文字/ページ)の本40冊を一秒で検索できるらしい。
実際に、九州大学の教官のページや国士舘大学の図書館情報統合サービスに利用されているようだ

Yahoo: Yahoo APIの話

東芝: TX1
テラバイト級のデータ容量でも高速に検索ができるXMLデータベース

日立: u-Cosminexusの紹介
今年10月ごろにストリーム処理とインメモリ処理の機能を追加したu-Cosminexusに関する紹介。
残念なのが、15分と短い講演だったので、技術的な部分が良く分からなかった

scigineer: デクワス(出くわす)
出来たばかりの会社のscigineer。
多くの情報の中には、べき分布に従うケースが多々あるという話から始まる。これは、複雑ネットワーク構造解析の立場から見た時に、見つけることができる。
この複雑ネットワーク解析を利用したサービスとしてデクワスというソフトを提供している。多様な情報の中から、複雑ネットワーク解析(デクワス)を用いて、ある規則を見つけ出してあげようというもの。その応用にはコミュニティ発見やアマゾンのレコメンドなどがある。

ポスターレセプション
今回はSunspot紹介というよりも、きちんとStreamSpinnerの方に注目が集まった。
質問をしていただいた方はNTT研究所の同じSPEをしている方やStanfordのSTREAM projectに一年いた方など専門家の人と多く話せた。

Q. 情報源とラッパーはどのようなプロトコルで通信をしているか
Q. タイムスタンプはどうしているか(エンジンが付けるか、アプリが要請するか)
Q. 既存のSPEと違う点。streamspinnerの特徴
Q. カメラからのビデオストリームを内部でどのようにして扱っているか
Q. 分散の指標はなに?
Q. 一番最新の研究は何?
Q. センサノードwith SPEという新しい環境での研究テーマは?
Q. どのような学会で発表しているか
Q. 映像配信環境の規模と詳細
などなど

ある程度きちんと質疑応答できたと思う。


○最終日
興味深かった発表(正確に理解していないので、後日論文読んで修正するかも?)

1. サービス指向ルータにおけるパケットストリーム解析支援 (慶応)
2. 追記・参照型データ管理システムにおける分散蓄積データの再フィルタ方式 (NTT)
3. RDFデータベースのためのファイル構造に基づくマテリアライズドビューの構築 (産業総合研究所)

1.Googleはエンドホストから得られる情報だけに頼って検索結果を算出するが、より粒度が細かい情報(ネットワークパケットから得られるどのサイトから訪れたか、どのくらいあるページに滞在していたか)を利用することができていない。最近はパーソナライズ化されているが、検索キーだけで行動を図るのは限界がある。そこで、パケットストリームをルータ内部のメモリに取り込んで解析ができる高性能ルータであるセマンティックルータを利用したパケット解析がこの研究の目的である。その問合せには、SQLを拡張したUserSSQLを用いている。大きな特徴は時系列パタン演算子と分解演算子である。
未実装であるが、モチベーションは面白いと思った。関連研究にSPEを挙げているが、SPEでは超高速なパケット処理を考慮していない。

2. DMSの特徴をスケールアウト可能,機能成長可能,持続可能と3特徴をあげ、ストリームデータを処理しながら、マシンを追加し機能拡張しても、リアルタイム性を損ねないというデモを見せてくれた。
今回の新規性はストリーム処理を一旦中断し、データベースに格納した後に、再び格納したデータをストリームデータとして処理をする時に、どのマシンで処理をするのが最適であるかということを検討していた。NTT研究所が作っているSPEのシステムアーキテクチャの再フィルタにおける問題を解決した点が新規性のようだ。

3. 一番の印象はプレゼンテーションが上手だった。アルゴリズの流れを図を用いて分かりやすく説明してくれていた。内容はできるだけ再利用なマテリアライズドビューを作成することにあった。
ゼミや講演 | - | -

CoopIS2008

OTMという複合会議が11/10〜14の期間にメキシコのモンテレーで開催され、その中のCoopISという会議に参加してきた。

参加報告はゼミでしたので、下記ファイル参照。
CoopIS.pptx

ビジネスと名の付くセッションが多かった印象がある。日本人参加者は4人。CoopISのchairには東大の喜連川先生がなっていた。(会場には来ていないけど...)
ストリーム処理系の話はHP labの人の「Data-Continuous SQL Process Model」くらいだった。ストリーム処理エンジンをビジネスに応用したくらいの話だったと思う。話を聞くだけでは新規性が分からなかったので、現在論文を読んでいる最中。
ゼミや講演 | - | -

EPSファイル形式

ちょっと前になるが、DMIEWという学会に論文を提出した際に、またまたファイルサイズが問題となってしまった。ファイルサイズを小さくしてしまうと、図がゆがんで投稿ができなかった。
今回は、eps変換を学んだ。

○従来
1, PowerPointで作成した図をPNG形式で図として保存。
2, Cygwinのconvertコマンドにて、eps形式に変換
3, 論文に図として埋め込む
4, 作成されたファイルサイズが大きくなるので、Adobe PDFを利用して圧縮
5, 圧縮したファイルを投稿

この方法では、ラスタ画像をepsにしているので、図の拡大や圧縮をすると、図がゆがんでしまっていた。

○調査

・ツール
EPS-conv
cygwinのconvertコマンドで各図を変換するのがめんどくさいので、このツールで全図を一発変換。
カラーor白黒に対応している。ただし、ベクタ画像(WMF形式など)の変換には対応していない

WMFtoEPS
ベクタ画像をEPSに変換するツール。convertコマンドでも変換ができるのだが、作成されたepsの図がずれていたり、消えていたりする。このツールだと、ほぼきれいに変換ができた。
インストール手順はこのサイトを参考にした。

・画像サイズ
一つの図(architectureの図)の変換サイズを調査

PNG 193KB
EPS変換後 カラー 8570KB
EPS変換後 白黒 2911KB

JPG 160KB
EPS変換後 カラー 8731KB

このサイトでは、JPEG は EPS2(正確には PostScript Level 2 の EPS)にするとサイズがあまり増えません。
とあるが、EPS-convの変換のちEPSのバージョンは分からないが、JPEGの方がサイズが大きくなった。

WMF 4005KB
EPS変換後 カラー 1309KB
(EPS変換後はサイズが小さくなっている)

○DMIEWのドキュメントサイズ
DMIEWに投稿した論文は2カラムで6ページ

PNG⇒EPSカラー 2532KB
PNG⇒EPS白黒 1033KB きれいに見れる。ただ、グレーの枠が気になる
JPG⇒EPSカラー 5335KB
WMF⇒EPSカラー 4594KB きれいに見れるが、絵がほんの少し切れてしまっている。

・Adobe PDFで圧縮
PNG色なし 308KB
PNG色あり 358KB 図がゆがんでいる
WMF 692KB きれいに見れる

○結論
PowerPoint⇒WMF⇒WMFtoEPS変換ソフトでEPSにする⇒Adobe PDFで圧縮する⇒提出

以上
- | - | -

StreamSpinner for sensor network

本日のゼミでM1の研究テーマを聞いて、少し考えてみた。

○背景
多くのsensor network deviceがある。例えば、Sunspot, Mote などなど
network deviceに関しては、Survey on Wireless Sensor Network Devicesが詳しい(2003年発行)
SunSpotにはストリーム処理エンジンStreamSpinnerの組み込みが完了している
sun.png
異なるデバイス間の連携は出来ない。スキーマも異なる。子機のデータを親機で受信し、利用者へ渡す。

今後の研究はどのようになっていくのか?
今日のゼミの話だけを聞くと、
目的: 異種センサのデータ共有をしたい
方法: デバイス毎に異なるプログラミング方式に対して、コードジェネレーションにより、個々のデバイスに対応するコードを生成し、動作させる
注意点) コードジェネレーションの時のフィルタリング順。多くのデータを間引けるようにする。
嬉しい点) 各デバイスのメモリ使用量(フットプリント)が少なくてすむ
性能評価: 各デバイスにStreamSpinnerを乗せた場合とコードジェネレーション方式の場合との電池の持ち時間の計測
という感じだった。

気になったのは、StreamSpinnerをSunspot上に乗せた後の展開があまりなかったように感じた。コードジェネレータを作って、各デバイスのプログラム言語に合わせたプログラムを生成・動作させた方が性能評価が良いならば、なんでStreamSpinnerを組み込んだのという感じが少しした。

integrationゼミで先生が話していたように、

・問題
sensor network deviceはメモリやCPUパワー、電力がpoorである。

・目的
分散問合せに対して、弱いデバイスに対しては負荷の少ない処理を、強いデバイスにはなるべく多くの処理をするようなプランを考えて、指示する仕組みを作る

・手段
手段の一つとして、コードジェネレーション方式がある。しかし、それが最善であるとは限らない。

確かにsensor network deviceは資源がpoorだが、分散環境で資源の有効活用をする既存研究とあまり違いが分からなくなってしまうかも。ソニー先輩の分散研究だと、資源としてネットワーク帯域使用量を最小化するようにしていたが、それがメモリ、CPUパワー、電力に変わるだけかな?

DMIEW2009
に提出することになった。締切今週金曜日(汗
場所が福岡っていう点が一番頂けない。。。
研究 | - | -
calendar
<< March 2009 >>
SunMonTueWedThuFriSat
1234567
891011121314
15161718192021
22232425262728
293031    
recommend
データベースシステム (情報系教科書シリーズ)

データベースシステム (情報系教科書シリーズ) | 北川 博之

一番のお勧めです!数学の面から詳しくデータベースに関して説明をしてくれています。データベースは理論が大事ですので、難しいですが、学習の大きな手助けとなります。

recommend
トランザクション処理〈上〉―概念と技法

トランザクション処理〈上〉―概念と技法 | ジム グレイ
アンドレアス ロイター

ジムグレイが書いた上下巻の厚い本。トランザクションについて細かすぎるほどに書いてある。きちんと読めていないので、ちゃんと読みます

recommend
珠玉のプログラミング―本質を見抜いたアルゴリズムとデータ構造

珠玉のプログラミング―本質を見抜いたアルゴリズムとデータ構造 | ジョン ベントリー

プログラミング言語に捉われず、アルゴリズムの面から丁寧に説明してくれている。面白く読める本

recommend
リファクタリング―プログラムの体質改善テクニック (Object Technology Series)

リファクタリング―プログラムの体質改善テクニック (Object Technology Series) | マーチン ファウラー
Martin Fowler
児玉 公信
平澤 章
友野 晶夫
梅沢 真史

プログラミング作法の一つのリファクタリングの本。前半よりも後半がためになった。リファクタリングの本では結城さんの入門書も良かった

recommend
内定勝者 私たちはこう言った! こう書いた! 合格実例集&amp;セオリー2009 面接編

内定勝者 私たちはこう言った! こう書いた! 合格実例集&amp;セオリー2009 面接編 | キャリアデザインプロジェクト

就職活動する前には必見の本。面接官への伝え方がかなりレベルアップする。就活生にはお勧め

selected entries
categories
archives
profile
others