タグ 類似度
人気順 5 users 10 users 100 users 500 users 1000 users数字300桁を適当に言う→数列から96%以上で誰が言ったか特定 数列には個人の「クセ」が現れる
115人の参加者を対象に、1~9までの数字を使って300桁のランダムな数列を2回生成してもらう実験を行った。参加者には、数字の出現頻度ができるだけ均等になるよう意識しながら、なるべく予測不能な数列を生成するよう求めた。 そして、2つの数列の類似度を定量化する独自の手法を用いて分析したところ、わずか300桁の数... 続きを読む
「一番厨ニ臭いホトトギス詠んだ奴優勝」の中で元ネタと類似度が高い奴優勝 - Qiita
概要 だいぶ前に「一番厨ニ臭いホトトギス詠んだ奴優勝1」というネタがありまして。 哭かぬなら 虚無に誘え(いざなえ) 時鳥(ホトトギス) とか 哭け 我が漆黒の刄 炎斗闘斬(ホトトギス) みたいなやつです。 どの作品も好きなんですが、この手のって元ネタとあまりかけ離れすぎていてもダメで、元ネタと似た形や意味を保ち... 続きを読む
機械学習初心者向け、Word2VecとDoc2Vecでディープラーニングやってみた - paiza開発日誌
2017 - 03 - 16 機械学習初心者向け、Word2VecとDoc2Vecでディープラーニングやってみた 機械学習 秋山です。 機械学習 が人気ですが、「Word2Vec」「Doc2Vec」という、文章などを分析する ニューラルネットワーク モデルを知っていますか? すごーく簡単に言うと、「Word2Vec」は単語の類似度のベクトル、「Doc2Vec」は文章の類似度のベクトルを表現します。... 続きを読む
PostgreSQL Deep Dive: コサイン類似度に基づくソート処理の実装方法とその性能比較
文書の類似度を計算する方法に「コサイン類似度」を用いる方法があります。 これは、出現する単語を出現回数などで数値化して、空間ベクトルに変換した上でベクトル同士の類似度を計算する、という手法です。 コサイン類似度 http://www.cse.kyoto-su.ac.jp/~g0846020/keywords/cosinSimilarity.html 最近、このコサイン類似度を使って、似ているデータ... 続きを読む
Gyazo、かすかな記憶を頼りに画像を探せる連想検索「Ivy Search」 MAUは1000万人突破 | TechCrunch Japan
フォルダやファイル名をつけて画像を管理している人にとって、「あの画像どこだっけ?」というのはよくある話だ。画像にタグを付けてあとで検索すればいいという人も、そもそものタグを思い出せないこともある。そんな問題を解決する検索機能を、スクリーンショットツール「Gyazo」が発表した。6月29日以降、有料ユーザーに対して順次公開。その後は無料ユーザーも利用できるようにする。 画像の類似度を自動算出→似てい... 続きを読む
「関連する○○」機能を手軽に実現できる。そう、Elasticsearch ならね。 - クックパッド開発者ブログ
2014-09-24 「関連する○○」機能を手軽に実現できる。そう、Elasticsearch ならね。 セコン (id:secondlife, @hotchpotch) です。ウェブサービスにはよく「このエントリーに関連するブログ記事」や「このレシピに関連するレシピ」という機能が実現されてますよね。さて、この機能はどのように実現すれば良いでしょうか。例えば tf-idf で単語の類似度を求め…と... 続きを読む
アップルとサムスンの方針の違いが一発で見て分かる画像 - GIGAZINE
AppleとSamsungといえば、スマートフォンやタブレット市場で特許訴訟を起こしたり起こされたり殴ったり殴られたりして何がなんだかわけがわからないことになっており、互いに互いをパクリだと罵り合う仲となっていますが、個別製品の類似度はあるものの、両社の方針の差は露骨です。 Coffee Time: Market Share vs Profit - journal - minimally mini... 続きを読む
自然言語処理における類似度学習(機械学習における距離学習)について - 生駒日記
Twitter でグラフ理論に関する話題が上がっていたので、最近調べている距離学習(distance metric learning)について少しまとめてみる。カーネルとか距離(類似度)とかを学習するという話(カーネルというのは2点間の近さを測る関数だと思ってもらえれば)。この分野では Liu Yang によるA comprehensive survey on distance metric le... 続きを読む
livedoor Developers Blog:String::Trigram でテキストの類似度を測る - livedoor Blog(ブログ)
こんにちは。検索グループ解析チームの nabokov7 です。 今回は、livedoor キーワードでの事例より、テキストの類似度を測るのに便利な手法を紹介します。 livedoor キーワードは、livedoor ブログでその日その日で話題になった語をランキング表示するサービスです。 当初、はてなキーワードやWikipediaを足して2で割ったようなサービスを作れといった開き直った指示のもとで開... 続きを読む