タグ「正規表現マッチ」

タグ正規表現マッチ

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 4 / 4件)

英文を一文ずつに分割してGoogle翻訳へ投げるAlfred Workflowを作った - ぽよメモ

2019/08/13 278 users Alfred Workflow 英文メモ google翻訳

これまでに作ったAlfred Workflow poyo.hatenablog.jp poyo.hatenablog.jp これまでに作ったAlfred Workflow これは何？論文PDFの問題環境 sentence-splitter 準備使い方注意点一文ごとに分解する機能は単なる正規表現マッチとIFの羅列ピリオドが無い場合は文字列分解できない．意図的に混入されているハイフンを... 続きを読む

Go - Luceneで使われてるFSTを実装してみた（正規表現マッチ：VMアプローチへの招待） - Qiita

2014/12/18 47 users Lucene Qiita 招待

入力と出力のペアに対して，上のようなグラフを作るのが目標です．テーブルの出力のとこは数字が書いてありますが，文字列だと思ってとらえて下さい．map だと出力は1つに限られちゃいますが，ひとつの入力に対して出力が複数あってもいいです．たとえば入力 "feb" に対して，出力は "28" と "29" があります．（2月は28日と29日のときがありますね）．ノードの部分が状態で，そこから出ている矢印... 続きを読む

Perlの m// は中身が固定文字列だと爆速になる - Islands in the byte stream

2013/04/18 44 users perl Lingr 爆速 index 中身

Perlの話題を日本語で – Lingr で出た話題です。Perlの正規表現マッチはパターンが単純だと index() とおなじく Boyer-Moorアルゴリズムで検索するので非常に高速です。要は最適化のつもりでパターンマッチをindex()に書き換えるのは無意味なのです。ソースは pp.c や regexec.c あたりを fbm_instr() で検索かな？ドキュメントもどこかで読んだ気が... 続きを読む

Ruby の invalid byte sequence in UTF-8 例外を encode("UTF-8", "UTF-8") で回避するのはおかしいよ、という話 : sonotsのblog

2013/02/18 118 users Encode sonots UTF Ruby UTF-8

こんにちは @sonots です。 Ruby の invalid byte sequence in UTF-8 例外を encode("UTF-8", "UTF-8") で回避するのはおかしいよ、という話をします。 Ruby 1.9 でUTF-8的に正しくないバイト列がある文字列を扱っていると、正規表現マッチや gsub といったメソッドを使っているところで ArgumentError: inva... 続きを読む

(1 - 4 / 4件)