はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ EchizenBlog-Zwei

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 42件)

手元に置いておくと安心できる、情報系の人向けな日本語の本のリスト - EchizenBlog-Zwei

2014/02/23 このエントリーをはてなブックマークに追加 582 users Instapaper Pocket Tweet Facebook Share Evernote Clip アルゴリズム 入門本 データ構造 事前知識 以下

書籍最近、人に本を薦める事が多くなった。とりあえずこの辺を読むといいですよ的なリストを作っておくと便利だと思ったので作ることにした。以下、「事前知識のいらない入門本」「事前知識はいらないけど本格的な本」「事前知識がないと何言ってるかわからないけど有益な情報が満載な本」の3つにわけて列挙する。 事前知識のいらない入門本数式少なめ、脳負荷の小さめな本をいくつか。何をやるにしてもデータ構造、アルゴリズム... 続きを読む

機械学習の有益な書籍情報を共有します - EchizenBlog-Zwei

2015/04/22 このエントリーをはてなブックマークに追加 487 users Instapaper Pocket Tweet Facebook Share Evernote Clip フリーソフト 分野 最初 言語処理 実装

書籍機械学習の有益な書籍情報を共有します。 初心者向け最初に読む本としては「オンライン機械学習」「フリーソフトではじめる機械学習入門」「言語処理のための機械学習入門」がオススメです。「オンライン機械学習」は3章までが入門的な内容になっています。4章以降は発展的な内容なのである程度力がついてからが良いです。オンライン機械学習という分野は実装が簡単で実用性が高いので最初に取り組むのに適しています。広い... 続きを読む

文系でも機械学習がわかるようになる教科書 - EchizenBlog-Zwei

2015/11/13 このエントリーをはてなブックマークに追加 452 users Instapaper Pocket Tweet Facebook Share Evernote Clip 正攻法 有志 数学 観点 文系

計算機科学社内の有志で機械学習や数学の勉強会をいくつかやっています(私以外の方が主催しているものもある)。とくに理系ではない方も参加されていますが、きちんと頑張ればだんだん機械学習ができるようになるということがわかってきたのでメモしておきます。なお、機械学習をとりあえず実装するだけだったらもっと簡単に学ぶ方法もいろいろあり、今回はあくまで正攻法で機械学習を勉強する、という観点での書籍の選択となって... 続きを読む

自然言語処理を活用したwebサービスをつくるときに参考になる5冊の書籍 - EchizenBlog-Zwei

2011/10/10 このエントリーをはてなブックマークに追加 351 users Instapaper Pocket Tweet Facebook Share Evernote Clip フェルミ推定 アルゴリズム 珠玉 プログラミング 本質

計算機科学自然言語処理を活用したwebサービス開発に関わって5年以上経った。いい機会なのでこれまでを振り返って役に立ったと思う5冊をメモしておく。 1.珠玉のプログラミング―本質を見抜いたアルゴリズムとデータ構造まずはこれ。有名な本なので知っている人も多いと思う。簡単に説明するとちょっと前に「フェルミ推定」という名前で流行ったような、データから必要な数値を概算する方法や、問題が起きたときに問題点が... 続きを読む

機械学習超入門IV 〜SVM(サポートベクターマシン)だって30分で作れちゃう☆〜 - EchizenBlog-Zwei

2011/06/27 このエントリーをはてなブックマークに追加 310 users Instapaper Pocket Tweet Facebook Share Evernote Clip SVM パーセプトロン サポートベクターマシン perl 実装

計算機科学ニーズがあるのかさっぱりわからない機械学習超入門だけどひっそり続けていきたい。前回は識別関数の基礎であるパーセプトロンの簡単な説明とPerlによる実装を解説した。実はこの時点でかの有名なSVM(Support Vector Machine、サポートベクターマシン)もほぼ完成していたのだ!というわけで今回はSVMをPerlで作ってしまうお話。参考:これからはじめる人のための機械学習の教科書... 続きを読む

「高速文字列解析の世界」を読む前に知っておくと良いこと - EchizenBlog-Zwei

2013/01/08 このエントリーをはてなブックマークに追加 248 users Instapaper Pocket Tweet Facebook Share Evernote Clip 本書 メモリ 敷居 ディスク キャッシュ

計算機科学「高速文字列解析の世界」という大変すばらしい本が発売された。わりと敷居が高い本ではあるので読む前に知っておくとよさそうなことを書いておく。 「高速文字列解析」とは本書でいう高速文字列解析というのは主に2つのことを指している。ひとつはデータを圧縮して小さくしてディスクよりメモリ、メモリよりキャッシュというようにより高速な記憶装置で扱いましょう、という話。もうひとつはデータ構造を工夫すること... 続きを読む

【転職一周年記念エントリ】エンジニアの転職を支える技術 - EchizenBlog-Zwei

2013/05/03 このエントリーをはてなブックマークに追加 225 users Instapaper Pocket Tweet Facebook Share Evernote Clip 前職 意思 他人 本来 辛い時期

その他転職して1年が経ちました。前職での6年間は私の人生で最も辛い時期でした。転職してようやく本来の自分を取り戻せました。自分にあった場所で働くというのはとても大切だと思うので、転職するにあたって私がやったことをメモしておきます。 1.転職の意思を固める辞めたいと思った時が辞めどきです。他人の意見は気にする必要はないです。よく「n年はうちで頑張れ」と言われたりしますが、実際は転職を決意してから転職... 続きを読む

伝説のベイジアン先生にベイズの基礎を教えてもらえる「図解・ベイズ統計「超」入門」を読んだ - EchizenBlog-Zwei

2013/12/26 このエントリーをはてなブックマークに追加 224 users Instapaper Pocket Tweet Facebook Share Evernote Clip アヤ ベイス ゲン 数学 ドン

書籍「図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術」という本を読んだ。社会人のアヤとケンが社内研修で伝説のベイジアン先生からベイズの基礎を教わる、という設定の会話形式でベイズについて書かれた入門書。社内研修でベイズのプロから指導を受けるとかどんだけ恵まれてるんだ。 アヤさんは大学で統計をやったが数学は詳しくないという設定。ただ時々鋭い質問をする。また統計に詳しいイケメン兄がい... 続きを読む

未知の分野の論文を読むときの10のポイント - EchizenBlog-Zwei

2011/09/04 このエントリーをはてなブックマークに追加 177 users Instapaper Pocket Tweet Facebook Share Evernote Clip 視野 国際会議 英語 未知 専門外

計算機科学同じ分野の論文ばかり読んでいると視野が狭くなるので専門外の分野の論文も積極的に読んでいきたい。とはいえ未知の分野だとどの論文から読めばいいのかわからず困ることも。そんなときにこれまで試して役に立ったことをメモしてみた。 1.調べる論文は英語に絞るこれは日本人の論文が良くないということではなく日本人の論文も含め優れた論文は国際会議(つまり英語)でも発表されているから。英語が苦手でも頑張って... 続きを読む

自然言語処理の教科書はもう全部FSNLP一冊でいいんじゃないかな - EchizenBlog-Zwei

2011/11/03 このエントリーをはてなブックマークに追加 171 users Instapaper Pocket Tweet Facebook Share Evernote Clip 入手 答え 自然 言語処理 教科書

書籍自然言語処理の優秀なエンジニア各位にオススメ本を聞くと大抵FSNLP(Foundations of Statistical Natiral Language Processing)という答えが返ってくる。またブログ等でFSNLPを絶賛している方も多い。私は自然言語処理は長尾本で満足してしまっていたのでFSNLPは読んでいなかったのだけれど、長尾本は現在入手困難ということもあって入手しやすい自然... 続きを読む

まったく最小二乗法は最高だぜ!な「イラストで学ぶ機械学習」を読み終えた。 - EchizenBlog-Zwei

2013/10/13 このエントリーをはてなブックマークに追加 168 users Instapaper Pocket Tweet Facebook Share Evernote Clip パーセプトロン MATLAB 最小二乗法 本書 機械学習

書籍「イラストで学ぶ機械学習」という機械学習の本を読んだので感想を書いておく。なお本書にはMatlabのコードが書いてある場合があるけど、Matlabに詳しくないので読み飛ばした。 対象となる読者あくまで私の主観だけど、以下のような人が読むと良さそうな感じ。 ・機械学習の基礎は知っている(パーセプトロンくらいは実装できる) ・機械学習の論文に出てくる用語が理解できる ・確率の基礎は知っている(条件... 続きを読む

基礎から深層学習まで。おそらく初心者向けな「フリーソフトではじめる機械学習入門」を読んだ - EchizenBlog-Zwei

2014/04/02 このエントリーをはてなブックマークに追加 124 users Instapaper Pocket Tweet Facebook Share Evernote Clip データマイニング 本書 手法 箇所 深層学習

書籍おそらく初心者向けな「フリーソフトではじめる機械学習入門」を読んだ。おそらく、というのは多少説明が足りない箇所がある本なので、そのへんが受け入れられない人もいるかなあ、と思ったので。以下、読んだ感想を書いておくので購入を検討している人は参考にどうぞ。 本書の扱う範囲"データマイニングの基礎"と"はじめてのパターン認識"の内容を合わせたような感じ。決定木やルール学習などの古典的な手法からはじまっ... 続きを読む

CRFがよくわからなくてお腹が痛くなってしまう人のための30分でわかるCRFのはなし - EchizenBlog-Zwei

2011/12/06 このエントリーをはてなブックマークに追加 114 users Instapaper Pocket Tweet Facebook Share Evernote Clip CRF SVM LdA サポートベクターマシン はなし

計算機科学機械学習の3大有名手法といえばSVM、CRF、LDAではないだろうか(と勝手に思っている)。SVM(Support Vector Machine)については以前記事を書いたので今回はCRF(Conditional Random Fields)について書いてみたい。機械学習超入門IV 〜SVM(サポートベクターマシン)だって30分で作れちゃう☆〜 - EchizenBlog-Zwei とい... 続きを読む

5/1は転職記念日なので記事を書く - EchizenBlog-Zwei

2014/04/30 このエントリーをはてなブックマークに追加 102 users Instapaper Pocket Tweet Facebook Share Evernote Clip バイアス 後々 勝利 転職 現時点

その他転職して2年が経った。転職は私の人生における最大の勝利であるので、2周年を記念して記事を書く。さしあたり、現時点で考えていることを書いておくことで後々の参考にしたい。 転職してよかったかこれは「よかった」と断言できる。2年経ったのでさすがにそろそろ前の環境と比較してもよい頃合い(転職してすぐはバイアスがかかって何でもよく見えるので)なので書いておくが、あらゆる点で今の環境のほうが良い。私が転... 続きを読む

30分でわかる高性能な圧縮符号vertical code - EchizenBlog-Zwei

2011/10/23 このエントリーをはてなブックマークに追加 93 users Instapaper Pocket Tweet Facebook Share Evernote Clip 高性能 30分

計算機科学検索エンジンの転置インデックスなどデータ列を小さいデータサイズで持たせたい、という状況がある。こういう場合圧縮符号を使うのが一般的でunary符号やgamma符号、delta符号など様々な種類がある。圧縮符号の中でイチオシなのがvertical code(vcode)。これは岡野原(@hillbig)氏によって提案された圧縮符号で単純な仕組みでdelta符号並の性能を誇っている。本記事で... 続きを読む

社会は厳しい - EchizenBlog-Zwei

2015/11/10 このエントリーをはてなブックマークに追加 87 users Instapaper Pocket Tweet Facebook Share Evernote Clip 社会 厳しい

その他社会が厳しいのでメモしておきます。 勤怠について前職がブラックだったので精神状態があまりよくないです。毎日最低8時間は寝たいところです。充分な睡眠をとるためには定時帰宅が何より大切です。今の環境では(ホワイトではあるのですが、何故か)残業が推奨されているのであまりよくないです。定時帰宅が徹底されているか、定時出社が要求されないか、そもそも勤怠管理がないような環境に興味があります。とにかく安定... 続きを読む

SVMの定番入門書「サポートベクターマシン入門(赤本)」の読み方 - EchizenBlog-Zwei

2011/06/08 このエントリーをはてなブックマークに追加 76 users Instapaper Pocket Tweet Facebook Share Evernote Clip SVM 原書 文体 本書 通称

計算機科学SVMを学びたい人にとっては「サポートベクターマシン入門」通称「赤本」は最適な入門書であるといえる。理論から実践までバランスよく解説されており、本書を読むだけでSVMの実装が可能になる。しかし本書はSF小説を彷彿とさせる独特な翻訳の文体のため機械学習に不慣れな読者にとっては読みこなすのは苦しい戦いとなる。本来なら原書をオススメしたいところだが、そうはいっても英語はちょっとという人も多いは... 続きを読む

「木構造と自然数の重複あり集合は等価だよね」というはなし - EchizenBlog-Zwei

2014/01/30 このエントリーをはてなブックマークに追加 65 users Instapaper Pocket Tweet Facebook Share Evernote Clip LOUDS 既知 簡潔データ構造 はなし 重複

計算機科学「木構造と自然数の重複あり集合は等価だよね」というはなしをする。簡潔データ構造な人向けに言うとLOUDSの話。とはいえこの記事は特に簡潔データ構造の知識を要求しない。データ構造とか情報量とかに興味がある人全般を対象としている。※簡潔勢にとっては既知な話のはずなのであえて読む必要はないです。 まず結論から述べる。以下のような幅優先で番号を振った木構造を考える。 親 → 子 ==== (1)... 続きを読む

「入門 機械学習」を献本していただきました - EchizenBlog-Zwei

2013/01/20 このエントリーをはてなブックマークに追加 64 users Instapaper Pocket Tweet Facebook Share Evernote Clip 数式 アルゴリズム 本書 入門書 計算機科学

計算機科学「入門機械学習」を献本していただきました。ありがとうございました。というわけで早速読み終わったので感想を書いておく。 機械学習の入門書ではない本書はタイトルから連想されるような機械学習に入門するような内容は書かれていない。一切数式は登場せずアルゴリズムはすべてブラックボックス化されている。では本書はダメな本なのかというとそんなことは全くない。少なくとも「入門 機械学習」というタイトルに興... 続きを読む

Googleの新しい圧縮アルゴリズムZopfliについて調べた。 - EchizenBlog-Zwei

2013/03/02 このエントリーをはてなブックマークに追加 63 users Instapaper Pocket Tweet Facebook Share Evernote Clip 圧縮ライブラリ LZ77 Google データ

計算機科学Googleの新しい圧縮アルゴリズムZopfliについて調べたのでメモしておく。Compress data more densely with Zopfli - Google Developers Blog deflateアルゴリズムzopfliはdeflateアルゴリズムに基づいた圧縮ライブラリ。deflateアルゴリズムはデータをLZSSというLZ77を改良した圧縮法で圧縮し、その後... 続きを読む

実装が簡単で高性能な線形識別器、AdaGrad+RDAの解説 - EchizenBlog-Zwei

2014/09/14 このエントリーをはてなブックマークに追加 61 users Instapaper Pocket Tweet Facebook Share Evernote Clip Papers 実装 論文 高性能 http

計算機科学機械学習では、データがどのクラスに属するかを識別するという問題が基本的です。この識別問題は線形識別器というモデルを使うことで解くことができます。この記事では、実装が簡単で高性能な線形識別器、AdaGrad+RDAの解説を行います。AdaGrad+RDAの詳細な解説は以下の論文を参考にしてください。http://www.magicbroom.info/Papers/DuchiHaSi10.... 続きを読む

ウェーブレット木の効率的で簡単な実装 "The Wavelet Matrix" - EchizenBlog-Zwei

2012/08/01 このエントリーをはてなブックマークに追加 58 users Instapaper Pocket Tweet Facebook Share Evernote Clip ウェーブレット木 論文 拡張 実装 http

計算機科学久しぶりに論文を読んだ。http://www.dcc.uchile.cl/~gnavarro/publ.htmlThe Wavelet Matrix Claude & Navarro; SPIRE2012"The Wavelet Matrix"はSPIRE2012のNavarro無双のうちの一本。タイトルからするとウェーブレット木の拡張のように思える。機能としてはウェーブレット木と同一で... 続きを読む

「4人のロシア人の方法」で編集距離を高速化する - EchizenBlog-Zwei

2012/05/20 このエントリーをはてなブックマークに追加 43 users Instapaper Pocket Tweet Facebook Share Evernote Clip 論文 アルゴリズム アルゴリズム自体 ブロック単位 テーブル

計算機科学ちょっと前に「4人のロシア人の方法(Method of Four Russians)」というのを論文で見かけて面白かったので紹介しておく。簡単に言ってしまうと、ある処理を高速化したい時にデータ全体を小さなブロックに分割してブロック単位での結果を事前に計算したテーブルで持っておくよ、というアルゴリズム。名前は知らなくてもアルゴリズム自体は知ってる人は多いかもしれない。Method of F... 続きを読む

AdaGrad+RDAを実装しました。 - EchizenBlog-Zwei

2014/07/26 このエントリーをはてなブックマークに追加 40 users Instapaper Pocket Tweet Facebook Share Evernote Clip

計算機科学AdaGrad(Adaptive Gradient)というオンライン学習のアルゴリズムを実装しました。https://github.com/echizentm/AdaGrad 論文: Adaptive Subgradient Methods for Online Learning and Stochastic Optimization(http://www.magicbroom.info... 続きを読む

「テキストマイニングを使う技術/作る技術」を読んだ - EchizenBlog-Zwei

2011/10/02 このエントリーをはてなブックマークに追加 40 users Instapaper Pocket Tweet Facebook Share Evernote Clip テキストマイニング データマイニング 本書 定義 技術

書籍自然言語処理は大学時代からやっていたのだが、恥ずかしながらテキストマイニングについてはよくわかっていなかった。@shima__shima先生から「テキストマイニングを使う技術/作る技術」を紹介していただいたので読んでみた(紹介していただき、ありがとうございました)。 本書によるとテキストマイニングは厳密な定義はないものの、テキストデータから抽出されたデータを用いたデータマイニングを指すらしい。... 続きを読む

 
(1 - 25 / 42件)