タグ 分かち書き
人気順 10 users 50 users 100 users 500 users 1000 users分かち書きに近い書き方をする人は未だによく見るんだけど、この前ツイッ..
分かち書きに近い書き方をする人は未だによく見るんだけど、この前ツイッターで、今まで普通の文章書いてた人がそういう書き方をするようになってなんでだろう?って思ったら病気(の後遺症?)でそう書かないと脳が理解できないようになってしまったと書いていた。 リハビリのためにも色々試行錯誤していて、なぜか分から... 続きを読む
mikan.js - 機械学習を用いず日本語の改行問題を解決 MOONGIFT
先日、Googleがディープラーニングを使って文字文節を自然に区切るという budou を開発しました。日本語は分かち書きによって分割できますが、それをさらに自然に改行させるというのは面倒なものです。 しかし機械学習を行わずに、クライアントサイドだけでも実現できてしまうのがmikan.jsです。 mikan.jsの使い方 幅が広い場合。 一番狭めた場合。 ちゃんと良い感じに文節に区切れます。 mi... 続きを読む
kuromoji.js - Webブラウザ上で分かち書き! MOONGIFT
テキストから意味を読み取るというのは非常に難しく、そのための専用ソフトウェアが存在するほどです。そしてテキスト解析手法の一つとして知られているのが分かち書きです。日本語であればChasenがよく知られています。 kuromoji.jsはそんな分かち書き処理をJavaScriptで行ってしまおうというソフトウェアになります。KuromojiというApache財団のオープンソース分かち書きエンジンをJ... 続きを読む
TinySegmenter: Javascriptだけで実装されたコンパクトな分かち書きソフトウェア
TinySegmenterはJavascriptだけ書かれた極めてコンパクトな日本語分かち書きソフトウェアです。 わずか25kバイトのソースコードで、日本語の新聞記事であれば文字単位で95%程度の精度で分かち書きが行えます。 Yahoo!の形態素解析のように サーバーサイドで解析するのではなく、全てクライアントサイドで解析を行うため、セキュリティの 観点から見ても安全です。分かち書きの単位はMeC... 続きを読む
形態素解析MeCab(和布蕪)をPerlから使ってみる ゆうすけブログ/ウェブリブログ
[Perl] 形態素解析MeCab(和布蕪)をPerlから使ってみる << 作成日時 : 2006/04/04 00:40 >> トラックバック 1 / コメント 3 京都大学 情報学研究科のオープンソース形態素解析エンジンMeCab(和布蕪)を インストールして試してみたメモ。ChaSen, Juman, KAKASIより高速らしい。 今回は、形態素解析自体じゃなくて、分かち書き・読み仮名取得が... 続きを読む