メールアドレス(半角):


バックナンバーは こちらから
株式会社リッテルが発行する
無料メルマガです。







東大産学連携企業株式会社リッテル

第8回マイニング探検会を更新しました

日時:2010年11月19日(金) 19:00-21:00
場所:東京大学 本郷キャンパス 東京大学アントレプレナープラザ

第8回マイニング探検会が11/19に開催されました。
今回は、図書館総合展前のプレ企画としてオープン参加を呼びかけ、
約10名の方々から参加申込があり、いつもと違う雰囲気のなかで開催されました。
今回のUstream配信は図書館情報学チャンネルで話題の「しずくラボ」に
担当して頂きました。この場をお借りしてお礼とさせて頂きます。
ありがとうございました。

【Ustreamアーカイブはこちら】
 当日の詳しい様子はUstream で参照ください。
  http://www.ustream.tv/recorded/10950059
  http://www.ustream.tv/recorded/10951117

【各チームからの報告】
各チームから5分程度の進捗状況報告がありました。
今回の報告チームを発表順に掲載します。

1. ログデータ使う系(報告者:前田)
学術ドメインに特化した検索キーワード補完を東京大学のOPAC検索ログをもとに試しています。
具体的にはOPAC検索式から単語の連接をもとに「単語・単語行列」を作成し、
GETAssoc(連想検索エンジン)にかけることで、入力キーワードから他の単語を
「連想検索」させる仕組みです。この仕組みについて、条件をかえて何パターンも
試したところ、感触としてわかってきたことがあります。

 (1)連想検索で次のキーワード予測は難しい、関連語ならさしつかえないかもしれない。
 (2)OPAC検索式の「書名」や「著者」といった検索フィールドはあえて使わない。
    これはプライバシー情報の隠蔽を図ることと、GETAssocによる連想を働きやすくする
    ふたつの意味がある。
 (3)連想結果のうち「意味を持つ単語」の比率が高いと、結果がよりよく感じる

この「単語・単語行列」を使う方法では、思うような性能が出ないため、手法を変更しました。
GETAssocでは文書データベースを作成すると、検索時に関連語提示する機能が付属しています。
文書ではなくOPAC検索式ですが、その機能を使いました。
これにより明かに入力に関連する語が結果として返ってくるようになりました。
しかし、結果の単語が形態素になるため、あまり面白い結果にはならないのが難点です。
そこで、次の目標として、GETAssocの用語切り出しに専門用語自動抽出システム「言選Web」に
換える仕組みを開発することにしました。より有用な関連語を提示できないか、試みる予定です。

[資料]
 https://mbc.dl.itc.u-tokyo.ac.jp/lecture/OPAC_serachlog_and_keyword_04.pdf


2. 連想検索を利用したサービス (報告者:青木)
11月16日(火)に連想検索勉強会を開催しました。
連想検索を「さまざまな情報と、利用者自身の経験的知識とを連想的に結びつけることで、
自身の内部から新たな知識を浮かび上 がらせることを支援するためのツール」と定義し、
新書マップ(深まりパターン:情報の奥行きを見せる)や想・IMAGINE(広がりパターン:
情報の広がりを見せる)を例に、連想検索の効果的な利用法などを、講義およびブレストしました。


3.メタデータつなぐ系(報告者:細羽見)
つなぐ系のビジョンは、現在までに2つに分類されてきましたが、一つは、
体系の異なるメタデータ同士を「つなぐ」仕組みであり、もう一つはメタデータを利用するために
「つなぐ」仕組みです。(現在Wikiで構築中)また、今後の検討事項として、
wikiへの一括登録方法、その後の同定作業や重複処理が考えられることとして挙がっています。
また、OAI-PMHでの"about"の出力についてメタデータにヘッダとして出自情報を付与していく
方法も別途検討中です。

[資料]
 http://www.slideshare.net/bammy0715/mitan8-bammy


4.サービス作る系(報告者:関戸)
「いまできるサービスを作るグループ」として活動を行っています。
当初は図書館のサイト・Webサービスの現状分析を行っていました。
これについて「図書館の外に出るには?」「マーケティングの視点」
「創りだしたサービスは本当に必要なのか?」という指摘をいただいています。
現状は好きなサービスを作ってから評価していく方向性です。
これまでの成果物として、著作物サーチver.0-1が牧野さんからでています。


【第12回 図書館総合展に関する情報交換】
11/24から3日間の日程で開催される「第12回図書館総合展」の開催が間近だったこともあり、
メンバーの参加状況や、注目のフォーラム等を総ざらいし、参加者全員で確認しました。
「人気のあるフォーラム、誰がどこのブースで出展しているかなどを相互に交換しあうことで、
効率的に図書館総合展を楽しめるのでは?」(岡本)

国立国会図書館の原さんからは、11/24のフォーラム『「本」の未来をめぐる若手
パネルディスカッション』の開催案内がありました。「本のあり方が変化してくことを
不安に思うのではなく、現場にいる若手としての視点から面白いメディアとサービスの世界を
描いていきたい。」(原)


【Code4Lib Japanの活動報告】
「Code4Lib Japanとして研究活動を進めた後、コンピュータ系の学会で発表出来れば良い。
また、Code4Lib Japanではグッドプラクティスの認定も行っているので、何らかの形でコラボ
レーションしていきたい」(岡本)

「Code4Libへのカンファレンス参加助成事業も予定している。現地(米国)への旅費・宿泊費
会議参加費などを助成する予定である。日本は、決してCode4Libの技術力に負けているという
ことはないので、是非奮って応募して頂きたい。」(高久)

と、Code4Lib Japanメンバーから、積極的な話題提供がありました。


【図書館総合展プレ企画?L1グランプリを語る?】
「L-1グランプリ」の開催が間近に迫り、「L-1グランプリ」に参加予定のマイニング探検会メンバーで
セッショントークを行ないました。
「L-1グランプリで許可されること」や「賞金100万円の扱い」についての岡本氏への質問や、
「個人的に注目しているチーム」など、盛り上がりを見せました。


【編集後記】
議事録作成にあたり、しずくラボの常川さんにご協力頂きました。
ありがとうございました。