タグ ダブル配列
人気順 5 users 50 users 100 users 500 users 1000 usersCentroid Path Decompositionを使ったトライでダブル配列と勝負してみた | Preferred Research
釣りタイトルを付けたかったのですがさっぱり思いつかないのでもう諦めました。徳永です。 今回はCentroid Path Decomposition(以下CPD)についての話を書きます。直訳すると重心パス分解となるでしょうか。Trieを実現するためのテクニック(普通のツリーにも使えるのかな?なかなか難しそうですが…)の一つです。CPDは一年前の弊社岡野原の記事に出てきますが、私のような素人にはあれだ... 続きを読む
LOUDS を普通のプログラマにもわかるように解説してみた - アスペ日記
以前「日本語入力を支える技術」(通称「IME本」「徳永本」)を読んで「ダブル配列」「LOUDS」の解説のわかりやすさに感動したので、友達(情報系大学院の修士課程での同級生)との勉強会ネタに使ってみたところ、いろいろひっかかるところがあって難しいようだった。それで、より直感的な説明をしようと情報系修士にもわかるダブル配列 を書いた。幸い、その時はすぐにわかってもらえた。その後、LOUDS も同じよう... 続きを読む
情報系修士にもわかるLOUDS - アスペ日記
「情報系修士にもわかるダブル配列」が好評だったので、二匹目のどじょうを狙って、「日本語入力を支える技術」でダブル配列と並べて解説されていた LOUDS についても書いてみる。注意点。LOUDS は本質的に難しい。流し読みではまずわからない。ダブル配列の「ずらしてガッチャンコ」のようなわかりやすいキーワードはない。ここでは簡潔ビットベクターはブラックボックスとして扱い、中には踏み込まない。trie ... 続きを読む
情報系修士にもわかるダブル配列 - アスペ日記
最近話題の「日本語入力を支える技術」を途中まで読んだ。3章がものすごく気合いが入っている。trie(トライ)というデータ構造の2つの実装、「ダブル配列」と「LOUDS」について詳しく説明がされている。ダブル配列については、ぼくは以前論文を読んで勉強しようとしたのだが、その時は難しくてあきらめた覚えがある。しかし、この本の説明を読むことで理解ができた。ありがたい。 感銘を受けたので、この本を教材に友... 続きを読む
WEB+DB PRESS vol.64に日本語入力の記事を書いたよ - 射撃しつつ前転
WEB+DB PRESS Vol.64に日本語入力についての記事を書かせていただきました。 日本語入力の歴史とかについて簡単に触れた後、かな漢字変換を実際に作ってみる、という構成になっています。ビタビアルゴリズムやダブル配列、構造化パーセプトロン、構造化SVMなどのテクニックを紹介しています。この特集だけ読めば、今年の3月の言語処理学会に私が出した論文(?)と同じものがたぶん作れます。日本語入力だ... 続きを読む