メールアドレス(半角):


バックナンバーは こちらから
株式会社リッテルが発行する
無料メルマガです。







東大産学連携企業株式会社リッテル

第2回マイニング探検会を開催しました

去る5月14日に、リッテルがスポンサーとして協力しているマイニング探検会の第二回が開催されました。



第二回目のマイニング探検会では、第一回から少し発展して具体的な技術の話がメインになされました。2010年11月25日(木)、図書館振興財団では、図書館総合展運営委員会と共に、L-1グランプリ2010?若手ライブラリアンのためのワークショップ式登竜門を開催されるとの話が会の開始前に告知されました。

マイニング探検会で学んだ知識を実際に生かしてほしいとのこと。この大会における賞金総額はなんと100万円!

詳細はこちらからどうぞ

賞金総額百万円!L1グランプリ開催


第二回マイニング探検会の開催様子です。

P1030278.JPG


第二回マイニング探検会では、検索技術の歴史を俯瞰した後、具体的に現在どのような技術が活用されているのかが紹介されました。

まずは、検索技術の歴史の紹介から。

1950年になると、キーワード抽出やKWICインデックスと呼ばれる現在も活用されている技術の基礎が出来上がりました。そんな中、1957年のスプートニクショックで米国,科学情報検索システムへの支援強化がなされるようになります。その後、1960年代に入って文献検索システムが実用化されるのです。具体的な例としては、MEDLARS(1964年?。のちのMEDLINE)などが挙げられます。

1970年代から80年代にかけては、全文検索システムの実用化と性能向上が進みます。SaltonらのSMARTシステム(ベクトル空間法・TFIDF・適合性フィードバックなど)、テストコレクションによる客観的精度評価の試みが行われます。そして1990年代に入って、いくつか評価型ワークショップが開催されるようになるのです。

では今現在利用されている検索技術としてはどのようなものがあるのでしょうか?


●形態素解析の技術

*形態素解析とは、自然言語で書かれた文を形態素(意味を持つ最小単位)に分割する技術です

Mecab

Yahoo!検索API日本語形態素解析

日本語形態素解析システム JUMAN 6.0


●情報検索システム

全文検索システム Namazu

HyperEstraier

Lucene (Apache Project)

Solr (Apache Project)

Senna

GETA / GETAssoc (国立情報学研究所)


●Web検索API

Google AJAX Search API

Yahoo! JAPAN 検索Web API


技術に関する話をきいただけではいけない、実際に自分で手を動かしてみてその技術を使ってどのようなことができるのかを試行錯誤してみることが大切とのことです。

今回のマイニング探検会で挙がった興味深い技術を以下に示しておきます。
ぜひ一度お試しください。自分で面白いWebサービスをつくることも可能です。