はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ MinHash

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 1 / 1件)
 

MinHashによる高速な類似検索 : Preferred Research

2011/02/02 このエントリーをはてなブックマークに追加 219 users Instapaper Pocket Tweet Facebook Share Evernote Clip クローラー 文脈 Preferred Research 単語

年が明けてもう一ヶ月経ちましたね.岡野原です.今日はMinHashと呼ばれる手法を紹介します.これは特徴ベクトルの高速な類似検索に利用することができます(クローラーの文脈だとShingleとして知られている).今や世の中のあらゆる種類のデータが,高次元のバイナリベクトルからなる特徴ベクトルで表されて処理されるようになってきました.例えば文書データであれば文書中に出現する単語やキーワードの出現情報を... 続きを読む

 
(1 - 1 / 1件)