はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ TinySegmenter

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 3 / 3件)
 

頻出単語表示、わずか9KBのAI日本語単語分割ライブラリ「TinySegmenter」をESモジュール化

2022/05/30 このエントリーをはてなブックマークに追加 238 users Instapaper Pocket Tweet Facebook Share Evernote Clip deno 辞書 単語 実装 形態素解析

自由入力された文章をデータ化する形態素解析ですが、巨大な辞書が必要になったり次々登場する単語に対応することなどなかなか大変そうなイメージでしたが、機械学習を使った、単語分割するコンパクトな実装「TinySegmenter」を発見。ブラウザやDenoでいい感じに使えるESモジュール版にしてみました。 「頻出単語表示 by... 続きを読む

TinySegmenterをJulia移植したらMITの先生に指導してもらえた話 - once upon a time,

2015/10/21 このエントリーをはてなブックマークに追加 81 users Instapaper Pocket Tweet Facebook Share Evernote Clip janome pyconjp MIT Julia 工藤さん

2015-10-21 TinySegmenterをJulia移植したらMITの先生に指導してもらえた話 julia python tinysegmenter 先日、工藤さんがJavaScript向けに作った日本語のコンパクトな分かち書きツール、TinySegmenterをJuliaに移植したTinySegmenter.jlを作りました。 もともとは、PyconJPでjanomeの話を聞いたら居ても... 続きを読む

TinySegmenter: Javascriptだけで実装されたコンパクトな分かち書きソフトウェア

2008/02/07 このエントリーをはてなブックマークに追加 443 users Instapaper Pocket Tweet Facebook Share Evernote Clip 分かち書き Mec サーバーサイド JavaScript 精度

TinySegmenterはJavascriptだけ書かれた極めてコンパクトな日本語分かち書きソフトウェアです。 わずか25kバイトのソースコードで、日本語の新聞記事であれば文字単位で95%程度の精度で分かち書きが行えます。 Yahoo!の形態素解析のように サーバーサイドで解析するのではなく、全てクライアントサイドで解析を行うため、セキュリティの 観点から見ても安全です。分かち書きの単位はMeC... 続きを読む

 
(1 - 3 / 3件)