メールアドレス(半角):


バックナンバーは こちらから
株式会社リッテルが発行する
無料メルマガです。







東大産学連携企業株式会社リッテル

第6回マイニング探検会を開催しました

  • 日時:2010年09月24日(金)19:00-21:00
  • 場所:東京大学 本郷キャンパス 東大アントレプレナープラザ

下記のとおり、各種の連絡および「サービス作る系」「連想検索を利用したサービス」「OPACログデータを使う系」の3テーマに関しての進捗報告がありました。

(連絡事項)

  • 11月に図書館総合展開催。メンバー参加の発表が複数あり。
    公式なアナウンスは今後。
     参考 http://www.j-c-c.co.jp/library/ (フォーラム内容は未公開)
  • 11/24
    • 10:30-12:00 Code4Lib Japanのセッション。丸山ほか参加。
    • 13:00-14:30 ネットアドバンス主催のWikipediaのフォーラム。清田参加。
    • 15:30-17:00 NDLのフォーラム。原参加
  • 11/25
    • L-1グランプリが丸一日開催。長谷川・三津石・矢代・福林がそれぞれチーム参加。
    • 11/26
      • 10:30-14:30 キハラのフォーラム。岡本企画。
      • 10:30-12:00 NII。名寄せに関するフォーラム。
      • 13:00-14:30 NII。認証関連のフォーラム。
      • 15:30-17:00 NII。CiNii APIコンテスト発表会。
    • 開催中の図書館関連のAPIコンテストの紹介
    • (テーマ別進捗報告)

      [サービス作る系]

      前田から進捗報告と意見の発表。
      資料 http://www.slideshare.net/genroku/vision-5281845

      Wikiでの意見からマーケティング戦略の導入に関して。
      コトラーの『戦略的マーケティング』を参考にマーケティングマネジメントプ ロセスの流れを紹介。
      その上でマイニング探検会の「サービス作る系」に関する新サービスの作成に おいてマーケティングは以下の2点から有効でないと意見した。

      1. 1)新しいものを作るさいにマーケティングは必ずしも有効でないこと(調査する市場がない)。
      2. 2)マイニング探検会「サービス作る系」の活動はボランティア(コストゼロ)かつ非営利の活動であり、経営資源分配の考え方であるマーケティングとは合わない。

    一方、マーケティングが有効な場面として「既存サービスの改善」「イミテーション(同業他社の模倣)」「新製品のイメージが明確な場合」を紹介。またマーケティングによらない新サービスの企画のヒントとして、自分自身を利用者と見立てた発想もあると説明した。

    マイニング探検会における図書館のWebデザインの改善について。デザインの改善は「本気でやる人」がいればできる、との考え。
    希望者があれば作業環境の提供やソフトのインストールについての支援ができるとのこと。

    また、サービス作る系で企画したアプリケーションについて、マイニング探検会のサーバーで開発・公開してもよいとの清田先生の了解を得た。

    その他の「サービスを作る系」Wikiで出た意見の紹介。
    図書館サイト・Webを利用したサービス等の現状分析として、GoogleガジェットやRSSの利用、図書館用語のわかりにくさ、貸出履歴データの利用者PC側での管理の支援、メール・twitterの活用、各館所蔵の書誌データの枠を超えたOPAC検索らの話題を紹介。
    また使えそうな要素技術としてGoogleカスタム検索とAmazon 欲しいものリストが紹介された。

    最後にサービス作る系の今後への提言として、Wikiの整理が必要であることと、牧野さんばかりがアイディアを出してるため他のメンバーからもアイディアを出して欲しいことが告げられた。

    以下、関連してディスカッション・意見。

    • 長沖)マーケティングについて最初に言ったのは自分。図書館は商人の香りがしないため。
      図書館についてのマーケティングは以下の三点があり、これを意識する必要がある。
    1. 1)図書館自体はマーケットを形成しているか?
      マーケット性があれば自然に改善されるはず。
    2. 2)図書館「業界」のマーケット性。TRC、丸善等。非常に小さいマーケット。
      これを活性化できるか。
    3. 3)図書館の要素技術の商品性はあるか。別業界に検索技術などを提供するのは有効か。
    • 前田)サービス作る系は新しいものを作る話。
      図書館でもマーケティングが必要な部分はあるが、「サービス作る系」の活動ではまずアイディアを出すことが大事である。
    • 長沖)アイディア出しを終えたあとでマーケティング的な側面から評価したい。
    • 清田)お金だけがビジネスでない。精神的な満足なども。その面でのマーケティングもあるのでは。
      またどうやってお金につなげていくかの側面も大事。大学図書館職員の兼業規定の再考など。
    • 岡本)図書館方面でのマーケティング・PRはあまり評価していない。無暗に飾りたてるのはよくない。
      まず大切なのは使ってもらえるサービスを作ること。
      マーケティングをするのなら慎重にしっかりやることが大事。非営利団体におけるマーケティングもかなり研究されている。

    [連想検索を利用したサービス]

    青木から進捗報告。
    具体的な話はまだできていない。今後ブレストしていく段階。
    出ているアイディアとしては、データマインニングに連想検索を使用すること、おもてに出てこないデータ(印刷文化等)を連想検索を利用して引き上げる仕組みを作ること。
    技術とデータをもつ現場、および両者をつなぐ立場のメンバーがいる強みがある。
    GETAの環境の提供はできる。
    GETAを利用する上での課題などを挙げた最終報告書まで作るのが理想。

    以下、関連してディスカッション・意見。

    • 長沖)連想検索の仕組みでは、入りと出のデータを何を使うかが大事。
      それぞれの面でいいデータがないかをメンバーに聞きたい。Twitterのツイートなど。
    • 前田)OPACの検索ログデータをGETAにかけたいと考えている。うまく成果が出れば、GETAの事例として活用できるかもしれない。
    • 山崎)いわゆるバーチャル書架のシステムで連想検索を利用できないか。分類をこえた関連図書をまとめられるのでは。
      資生堂でドキュメントのバーチャル書庫のシステムがあるらしい
    • 青木)検索に限らないサービスのかたちも重要。既存のサービスとのコラボレーションもできるか。
    • 外崎)GETAの勉強会があれば参加したい
    • 青木)勉強会は予定はないが開きたい。技術的な面だけでなく、データをどう見せていくかなどから連想検索について話をしたいと考えている。
    • 清田)データが大規模になることがネック。大量のデータの分散処理に関しての技術的な話を今後したい。
      また会のサーバでGETAを触れるようにする予定。

    [OPACログデータを使う系]

    外崎・前田・田邊からそれぞれ自館のOPACのログデータを使用した調査の内容

    • 進捗について発表あり。

    外崎の発表。
    自館(関東学院大)のOPACのアクセスログ、機関リポジトリのアクセスログを、入館ゲートのログ、貸出等のサービスのログと合わせて時系列で整理して統計的に調査した。
    長期的には、入館者の減少が2007年迄は見られたが、その後は横ばいである。
    原文が参照できる機関リポジトリへのアクセスは増加しているが、OPAC・貸出等は変化が少ない。
    年間では夏休み・冬休みは全体に利用者が少ない。OPACの検索はキーワードのみの簡易検索が多い。
    今後は入館者が貸出等のサービスを利用しているか、OPACで検索した資料が貸し出されているかなどを知りたい。

    前田の発表。
    資料: https://mbc.dl.itc.u-tokyo.ac.jp/lecture/OPAC_serachlog_and_keyword_01.pdf

    Yahoo!等では検索ログを利用してキーワードの補完機能を用意しているという話がある。OPACでも検索ログを利用して学術利用に特化し同様のことができないかの試行。
    大学の担当係にOPACの検索ログの利用申請をおこない許諾を受けた。ログデータ本体は前田個人のみの利用。外部(マイニング探検会を含む)には非公開。成果の随時公開は可。
    マイニングに十分なログデータを入手できるのは年末ごろの予定。
    現在のログからのざっとした感想。シングルキーワードの検索が多いような感 じを受ける。
    キーワード補完の仕組みの案。キーワードの組を利用してGETAssocで関連付ける。UT-kiwi等の接尾辞配列によるアルゴリズムも検討。
    ツールの形態はGreasemonkey的なサービス、独立したWebアプリケーション、Web APIの提供などを検討。

    関連して清田よりUT-KIWIの紹介あり。
    参考:http://kiwi.r.dl.itc.u-tokyo.ac.jp/ut-kiwi/

    以下、関連して意見。

    • 清田)シングルキーワードの使用等は海外の事例との比較ができるのでは。
      GETAssocの利用では、同一のセッション(またはIPアドレス)が連続して使用した検索キーワードの組を利用する方法も考えられる。

    田邊の発表。
    自館(慶應大)のOPACの検索ログを分析するツールの紹介。
    旧システム(KOSMOS)では自作のログ抽出ツールあり。条件を絞り込んで必要なログをCSVで出力。稼働以降すべてのログを保存している。
    新システム(Primo)ではパッケージにOPAC検索の分析に関わるツールがついている。
    クリックスル―(検索前後の利用者の挙動)やサーチスターティングウィズ(検索語の1文字目)などの分析機能が有効。

    OPACの検索ログを使った業務改善の事例。利用者は簡易検索で検索結果が1000件を超えると検索を辞める、という職員の認識があった。
    セッションIDから検証すると、1000件オーバーでも67%は検索を続けており、誤認であることがわかった。
    一方、3000件以上の検索結果の以降は検索を辞めるケースが多かった。このため一覧表示の制限を1000件から3000件に変えたところ利用が向上した。

    本日、OPAC検索ログの申請書(岡本後述)を提出し、申請が通った。個人を特定できない必要最低限のデータについては会で共有できる予定。今後、他大学のログデータとの比較などをしたい。

    以下、関連してディスカッション・意見。

    • 田邊)現状使ってはいけないが、貸出ログはより有益に利用できる。
    • 外崎)個人を特定しないログデータを用意できるか。
    • 清田)データマイニング上で個人を特定する情報について従来から問題になっている。
      そこから「プライバシー保護データマイニング」という研究分野がある。
      どのようにデータをマスキングするか、どういう場合にどこまでを伏せるかなど。
      次回の会で紹介したい。
    • 岡本)会として慶應大にOPACの検索ログ提供のお願いを出している。会の内部で検索ログの分析などができるよう。

    これに関連して、会員の実名・所属を含む名簿を提供した。ご了承をのこと。ただし会員は所属に関わらずあくまで個人の立場として参加してることを明確にする。

    利用の条件として、以下を守ってもらう。

    • あくまで会のメンバーのみで利用する。共同研究者等への提供はNG。
    • 会が終了した場合、または大学から要求があった場合、ログデータ(コピー含む)は即刻すべて削除する。
    • 研究成果は外部に発表してもよいが、事前に慶應大学の了解を得る。論文等は投稿前に許諾を。

    これを糸口にしてマイニング探検会をアピールしたい。上手くいけば図書館業界的にも大きな動きにできる。
    Gov 2.0。国の機関はデータを公開するのが当たり前である時代。
    データの取り扱いは注意のこと。漏洩があればARGやリッテルがつぶれてしまう。

    今後は、貸出履歴等だけでなく、大学で図書館に行く前に学生がどこにいたか等のデータも必要であるはず。大学におけるライフログ全般を図書館が分析して業務に活用できれば。

    • 清田)デジタルサイネージの技術ではカメラなどを利用して、広告を見ている人の属性を詳細に把握することも行われている。
      マイニングに関わる技術提供などもしていきたい。10月以降も是非来ていただきたい。

    以上。
    次回のマイニング探検会は10月22日(金)(場所・時間は同じ)を予定。

    文責: 山田俊幸