第29回マイニング探検会を開催しました
第29回マイニング探検会
http://www.facebook.com/events/424887460905171/
====================
日時 2012年10月12日(金)19:00-21:00
場所:株式会社ネクスト 3階エクストラルーム2
(いつもと部屋が異なります。エレベーターを降りて、向かって右に直進した突き当たりの場所です)
スケジュール:
- 19:00-19:30 清田先生のお話
- 19:30-19:40 前田さん発表
- 19:40-20:30 グループ進捗報告&打ち合わせ
- 20:30-20:50 総合展ブース&ポスターセッション、12月合宿(嶋田)
- 20:50-21:00 来月の開催場所(OR開催日)
係分担:
- 記録係:
- 中継係:嶋田
- 懇親会係:
- タイマー係:三津石
====================
◆スケジュール
19:00-19:40 清田先生のお話
19:40-19:55 前田さん発表
19:55-20:45 グループ進捗報告&打ち合わせ
20:30-20:50 総合展ブース&ポスターセッション、12月合宿(嶋田)
20:50-21:00 来月の開催場所(OR開催日)
◆清田先生のお話
検索ユーザの「本当のニーズ」を知るのは難しい
・検索はインタラクションである
・検索システムの外にユーザのニーズに影響を与える要因がたくさんある(例:CM、デザイン...
→偏りがあることを前提に、どうやって「本当のニーズ」に近づいていけるか?
テストコレクションによる評価のモデル
→現実のモデルを考慮すると不十分
現実のWeb検索エンジンの使われ方
→結果を見ながら繰り返しニーズが変化していく
<オフレコ>
HOME'Sの通勤検索の例
・この検索モードを利用するユーザは、不動産屋への問合せに至る確率が高い
→なぜかは自明ではない
本当のニーズに近づくための仮説
・サイトを初めて訪れたユーザの行動はユーザの属性が大きく影響
・再訪してくるユーザの行動は初訪ほど影響を受けない
<オフレコ終了>
サーチエンジンでのランキング最適化問題
・クリックスルーデータを利用(クリックされたデータはそうでないデータより良い結果である
→しかし、かなり偏りがあることがわかっている
Evaluating the accuracy of implicit feedback from clicks and query reformulations in Web search
http://dl.acm.org/citation.cfm?id=1229181
→検索ランキングの1位と2位でクリックされる率はかなり大きく異なるが、アイトラッキングからわかる「見比べているかどうか」の差はそれほど無い
→→1位と2位を見比べてから1位をクリックする人が多いと言えるかもしれない
→いくつかの実験結果からバイアスを除去したランキング関数の最適化を行う
まとめ
・データのなかにはなんらかの偏りが含まれていることが大前提
・含まれている可能性のある偏りを想定しながら解釈することが大事
・より偏りの少ないデータ収集方法を考える
◆前田さん発表
Selemium IDE(Webアプリテストツール)
東京大学OPACランチャー
◆マイクロボランティア班報告(南雲)
批判
・学校図書館などでは返却のタイミングが集中するので大変
・図書館員相手に返却する時はそんなに悠長な時間がないのでは
・借りた本の情報を提示するのは、プライバシーに抵触するのでは
→返却ボックスに変換するときに意見をもらうのはわるくないのかも
集めたい情報をもう一度精査すると面白そうだ
本のジャンル委によっては集めるべき感情表現が変わるので、分類ごとに集める情報を変えてみては
ディスカッション
返却時に箱に分けて返すようにシンプルな方法がよいのでは
埼玉の図書館でやっている事例があるが、ポストイットでやるというアイディアもある
一次情報を集めるという意味では、Amazonのデータなどとは余りさがないのでは
→ひとり1冊だけで判断するのではなく、集合的なものと見なしてやる
背景が、読書のコミュニケーションのプラットフォームとして機能すると言うところまで広く考えてもいいのでは
伝書だと評価の粒度がより細かくなることが考えられる
◆人的リソース班
◆レファレンス班
◆総合展ブース&ポスターセッション、12月合宿(嶋田)
各班はポスター1枚と配付物を製作
3日間それぞれ喋る担当が必要なので、その担当を決める
◆冬合宿