タグ 文書中
人気順 10 users 50 users 100 users 500 users 1000 usersマイクロソフト、Wordに自動TO-DOリスト作成機能を追加。必要な作業を文書中に記述するだけでOK - Engadget 日本版
米Microsoftが、Wordでの文書作成時において、予定している作業をTO-DOリスト式に自動記録できる機能のテストを開始しました。まずはMac向けのWord for Office Insider(Fast)版から導入し、その後Windows版やOffice 365に採用していく予定です。 続きを読む
肉眼で確認できないレベルで文書内に秘密のメッセージを隠すことができる「FontCode」 - GIGAZINE
特殊な処理を施さないと目に見えないインクとして知られる「 不可視インク 」など、人類は他人に見られてはならない秘密情報をやり取りするための手段を数多く開発してきました。コロンビア大学のチャンシ・ズン准教授らの研究チームは、文書中に肉眼では確認できない秘密のメッセージを埋め込む技術「 FontCode 」の開発に成功しています。 [1707.09418] FontCode: Embedding In... 続きを読む
キーワード抽出API - gooラボ
キーワード抽出APIを利用すると、入力した文書のキーワードを抽出するアプリケーションを作成できます。 キーワード抽出APIの概要 キーワード抽出APIはリクエストで送られたタイトルと本文からなる文書から、人名や地名、組織など文書を特徴づけるキーワードを抽出します。キーワードはタイトルや本文における出現位置や、文書中における出現回数、固有表現の種別などによってスコア付けされます。 このAPIを用いる... 続きを読む
『トピックモデルによる統計的潜在意味解析』読書会を開催中です | ALBERT Official Blog
はじめまして。データ分析部の越水です。 本日は、弊社セミナールームで定期開催している 『トピックモデルによる統計的潜在意味解析』読書会について ご紹介したいと思います。 『トピックモデルによる統計的潜在意味解析』について トピックモデルとは、文書中の各単語およびそれらの単語が属するトピックが確率的に生成されていると仮定するモデルです。近年活発に研究が行われている分野であり、ニュースサイトでの記事の... 続きを読む
ご注意! プライバシーへの懸念の高まりを受けてAppleはデバイスIDにアクセスするアプリを拒絶し始めた
オンラインのプライバシー問題に関して議会がさらに厳しい視線を向ける中、Appleは今週からUDIDにアクセスするアプリを拒絶し始めた。UDIDというのはiPhoneとiPadに割り当てられた1台ごとに異なるデバイスIDだ。 6ヶ月以上前からAppleはこの点についてiOS関連の文書中で、将来UDIDを無効にする予定だとしてデベロッパーに注意を喚起していた。 しかしプライバシー問題について議会やメデ... 続きを読む
MinHashによる高速な類似検索 : Preferred Research
年が明けてもう一ヶ月経ちましたね.岡野原です.今日はMinHashと呼ばれる手法を紹介します.これは特徴ベクトルの高速な類似検索に利用することができます(クローラーの文脈だとShingleとして知られている).今や世の中のあらゆる種類のデータが,高次元のバイナリベクトルからなる特徴ベクトルで表されて処理されるようになってきました.例えば文書データであれば文書中に出現する単語やキーワードの出現情報を... 続きを読む
きまぐれ日記: キーワード抽出: tf-idf の意味づけ
単語の重み付けの古典的な方法に tf-idf があります。文書中の各単語の tf-idf 値計算し、値でソートすると、その文書に特徴的な単語リストを得ることができます。 http://nais.to/~yto/clog/2005-10-12-1.html tf-idf は、単なるヒューリスティックスだと考えられていましたが、最近言語モデルに基づく情報検索手法がさかんに研究されるようになり、tf*i... 続きを読む