はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ nokuno

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 13 / 13件)
 

テキストファイルを処理するときのUnixコマンドまとめ - nokunoの日記

2012/01/21 このエントリーをはてなブックマークに追加 555 users Instapaper Pocket Tweet Facebook Share Evernote Clip UNIX sortコマンド Tips リダイレクト タブ区切り

個人的にテキストファイルを処理することが多いのですが,簡単な処理ならUnixのコマンドをパイプとリダイレクトで組み合わせてできることが多くあります.今回はそんななかでもちょっとマニアックなTIPSをまとめてみました. sortコマンドでタブ区切りのファイルを指定する最近知って驚愕したのがこれ.sortコマンドでタブ区切りのファイルを指定したいときは,Ctrl+v Tabでタブ文字を入力していたので... 続きを読む

米スタンフォード大が機械学習と人工知能に続き,自然言語処理と確率モデルの講義を一般公開 - nokunoの日記

2011/11/18 このエントリーをはてなブックマークに追加 171 users Instapaper Pocket Tweet Facebook Share Evernote Clip 表題 スタンフォード大 著者 分野 教科書

表題の通り,米スタンフォード大が自然言語処理と確率モデルの講義のオンライン公開を始めるようです.Natural Language ProcessingProbabilistic Graphical ModelsNLPを担当するManning先生は,この分野では知らぬものはいない教科書「Foundation of Statistical Natural Language Processing」の著者... 続きを読む

自然言語処理にはやっぱりPythonがいちばん - nokunoの日記

2011/08/20 このエントリーをはてなブックマークに追加 266 users Instapaper Pocket Tweet Facebook Share Evernote Clip Processing Python Quora NLTK 日記

Quoraで「自然言語処理に適したプログラミング言語はどれか?」という質問をしたところ,やっぱりPythonが一番人気のようです.What programming language is suitable for natural language processing? - Quora理由として以下が挙げられていますNLTKがあるから正規表現ライブラリ(re)が強力だからnumpyとscipyがあ... 続きを読む

情報系の学生がやっておくべき10000のこと - nokunoの日記

2011/06/30 このエントリーをはてなブックマークに追加 204 users Instapaper Pocket Tweet Facebook Share Evernote Clip 何事 タイトル 意味 内容 16個

「情報系の学生がやっておくべき10000のこと」というタイトルの記事があったので、何事かと思いました。10000 things all ICS students should do before graduating | Tagide10000個もあるのか…とびっくりしましたが、よく読むと2進数で書かれていて、16個という意味でした。内容もとても良いことを言っていると思うので、簡単に紹介してみます... 続きを読む

【これはすごい】Twitter検索を3倍高速化した記事の翻訳 - nokunoの日記

2011/04/19 このエントリーをはてなブックマークに追加 281 users Instapaper Pocket Tweet Facebook Share Evernote Clip エンドユーザ トラフィック twitter検索 遅延 翻訳

これはすごい! というわけでTwitter検索を3倍高速化したという記事を翻訳してみました。Twitter Engineering: Twitter Search is Now 3x Faster2010年春。Twitterの検索チームは、我々の増え続けるトラフィックに対応し、エンドユーザにとっての遅延を減らし、我々のサービスの可用性を向上させ、新しい検索の機能を素早く開発できるようにするため、検... 続きを読む

Facebookの新しいリアルタイム解析システムとは? - nokunoの日記

2011/03/24 このエントリーをはてなブックマークに追加 199 users Instapaper Pocket Tweet Facebook Share Evernote Clip Facebook HBase 翻訳 システム 以下

Facebookの新しいリアルタイム解析のシステムでは、HBaseで1日200億件のイベントを処理しているそうです。以下の記事の翻訳です。High Scalability - High Scalability - Facebook’s New Realtime Analytics System: HBase to Process 20 Billion Events Per DayFacebookが... 続きを読む

第1回にこにこテキストマイニング勉強会に参加しました #nicotextmining - nokunoの日記

2011/02/19 このエントリーをはてなブックマークに追加 125 users Instapaper Pocket Tweet Facebook Share Evernote Clip 日記

というわけで参加してきました。第1回 にこにこテキストマイニング勉強会 : ATND 目的テキストマイニングについての学習のスタートアップテキストマイニング技術に関して気軽に参加・議論することができる場の提供 概要テキストマイニングとは、例えば製品の評判をweb上のテキストから抽出したり、大量のアンケートテキストを分析するために用いられる技術であり、特にマーケティングの場で多くの利用例があります。... 続きを読む

Quoraを支える技術 - nokunoの日記

2011/02/03 このエントリーをはてなブックマークに追加 162 users Instapaper Pocket Tweet Facebook Share Evernote Clip Quora バックエンドシステム 勉強 技術 システム

勉強になる記事を見つけたので気になったところを翻訳してみました。Quora’s Technology Examined | Phil Whelan's Blog はじめにQuoraはハイテク起業家の世界を体現しており、問題を見つけるのが難しいほどなめらかなシステムを提供している。この巧妙なシステムは回答者と質問者だけに支えられているわけではなく、よく練られたバックエンドシステムによっても支えられて... 続きを読む

そろそろHadoopについてひとこと言っておくか - nokunoの日記

2011/01/03 このエントリーをはてなブックマークに追加 279 users Instapaper Pocket Tweet Facebook Share Evernote Clip Hadoop GFS reduce ひとこと クローン

もうこの手の話題は出尽くした感がありますが、最近Hadoopについて考えることが多いので、エントリにしてみます。なお、ここではベーシックなMapReduce+HDFSのことをHadoopと呼ぶことにします。 HadoopとはHadoopとは言わずと知れたGoogleのMapReduce/GFSのオープンソースのクローンです。MapReduceではプログラマはMapとReduceという2つの関数を書... 続きを読む

エンジニアの英語勉強法 - nokunoの日記

2010/12/30 このエントリーをはてなブックマークに追加 528 users Instapaper Pocket Tweet Facebook Share Evernote Clip Podcast エントリ iTunes Smart.fm 単語

エンジニアの、というほど特化しているわけではありませんが、昨日のエントリに英語のことを少し書いたら英語の勉強法について書きたくなったので、まとめてみました。Smart.fm - 世界最大級英語学習コミュニティーサイトPC上で単語の学習ができます。iTunesに無料のPodcastもあり、電車の中などで勉強するのにオススメです。英会話ならオンライン英会話のレアジョブSkypeで英会話のレッスンを受け... 続きを読む

統計的自然言語処理エンジンStaKK - nokunoの日記

2010/11/23 このエントリーをはてなブックマークに追加 175 users Instapaper Pocket Tweet Facebook Share Evernote Clip README GitHub Mozc サジェスト http

統計的自然言語処理エンジンStaKK を開発しました。nokuno’s stakk at master - GitHub 以下、READMEからの引用です。 現在の機能 かな漢字変換 予測変換 または サジェスト スペル訂正 形態素解析 HTTPによるAPIサーバ Trieの直接操作現在は、StaKK は辞書として Mozc (Google日本語入力のOSS版)のデータを使っています。 リバースモ... 続きを読む

nokunoの日記

2010/10/26 このエントリーをはてなブックマークに追加 1261 users Instapaper Pocket Tweet Facebook Share Evernote Clip 日記

nokuno Software Engineer at a Web Company. Interested in Natural Language Processing, Machine Learning, and Data Mining. Skillful in C/C++, Python, and Hadoop. 続きを読む

「Googleを支える技術」に載っていない日本語検索エンジンの技術 - nokunoの日記

2008/05/02 このエントリーをはてなブックマークに追加 222 users Instapaper Pocket Tweet Facebook Share Evernote Clip クエリー インデックス 単語 Google データ構造

Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「... 続きを読む

 
(1 - 13 / 13件)