はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 正規表現マッチ

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 4 / 4件)
 

英文を一文ずつに分割してGoogle翻訳へ投げるAlfred Workflowを作った - ぽよメモ

2019/08/13 このエントリーをはてなブックマークに追加 278 users Instapaper Pocket Tweet Facebook Share Evernote Clip Alfred Workflow 英文 メモ google翻訳

これまでに作ったAlfred Workflow poyo.hatenablog.jp poyo.hatenablog.jp これまでに作ったAlfred Workflow これは何? 論文PDFの問題 環境 sentence-splitter 準備 使い方 注意点 一文ごとに分解する機能は単なる正規表現マッチとIFの羅列 ピリオドが無い場合は文字列分解できない. 意図的に混入されているハイフンを... 続きを読む

Go - Luceneで使われてるFSTを実装してみた(正規表現マッチ:VMアプローチへの招待) - Qiita

2014/12/18 このエントリーをはてなブックマークに追加 47 users Instapaper Pocket Tweet Facebook Share Evernote Clip Lucene Qiita 招待

入力と出力のペアに対して,上のようなグラフを作るのが目標です.テーブルの出力のとこは数字が書いてありますが,文字列だと思ってとらえて下さい.map だと出力は1つに限られちゃいますが,ひとつの入力に対して出力が複数あってもいいです.たとえば入力 "feb" に対して,出力は "28" と "29" があります.(2月は28日と29日のときがありますね). ノードの部分が状態で,そこから出ている矢印... 続きを読む

Perlの m// は中身が固定文字列だと爆速になる - Islands in the byte stream

2013/04/18 このエントリーをはてなブックマークに追加 44 users Instapaper Pocket Tweet Facebook Share Evernote Clip perl Lingr 爆速 index 中身

Perlの話題を日本語で – Lingr で出た話題です。Perlの正規表現マッチはパターンが単純だと index() とおなじく Boyer-Moorアルゴリズムで検索するので非常に高速です。要は最適化のつもりでパターンマッチをindex()に書き換えるのは無意味なのです。ソースは pp.c や regexec.c あたりを fbm_instr() で検索かな? ドキュメントもどこかで読んだ気が... 続きを読む

Ruby の invalid byte sequence in UTF-8 例外を encode("UTF-8", "UTF-8") で回避するのはおかしいよ、という話 : sonotsのblog

2013/02/18 このエントリーをはてなブックマークに追加 118 users Instapaper Pocket Tweet Facebook Share Evernote Clip Encode sonots UTF Ruby UTF-8

こんにちは @sonots です。 Ruby の invalid byte sequence in UTF-8 例外を encode("UTF-8", "UTF-8") で回避するのはおかしいよ、という話をします。 Ruby 1.9 でUTF-8的に正しくないバイト列がある文字列を扱っていると、正規表現マッチや gsub といったメソッドを使っているところで ArgumentError: inva... 続きを読む

 
(1 - 4 / 4件)