タグ UTF
人気順 5 users 10 users 50 users 500 users 1000 users絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama|note
UnicodeのUTF-16エンコーディングではほとんどの文字(コードポイント)は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて... 続きを読む
JavaScript における文字コードと「文字数」の数え方 | blog.jxck.io
created_at: 2017-03-02 updated_at: 2017-03-02 tags: [ utf-16 , unicode , javascript ] Intro <textarea> などに入力された文字数を、 JS で数えたい場合がある。 ここで .length を数えるだけではダメな理由は、文字コードや JS の内部表現の話を理解する必要がある。 多言語や絵文字対応なども... 続きを読む
痛いニュース(ノ∀`) : 【画像】 NHKでまたヤラセ発覚 街頭インタビューに答える美女、仕込みだった - ライブドアブログ
【画像】 NHKでまたヤラセ発覚 街頭インタビューに答える美女、仕込みだった 1 名前: バーニングハンマー(アメリカ合衆国)@\(^o^)/:2014/10/28(火) 15:52:44.43 ID:TAh3VXGc0●.net ソース http://realtime.search.yahoo.co.jp/search?tt=c&ei=UTF-8&fr=sfp_as&aq=-1&oq=&p=NH... 続きを読む
痛いニュース(ノ∀`) : フジテレビ、“山下智久書類送検”を「山下さんの書類は送付されました」と報じる - ライブドアブログ
フジテレビ、“山下智久書類送検”を「山下さんの書類は送付されました」と報じる 1 名前: スターダストプレス(中国)@\(^o^)/:2014/10/21(火) 18:20:02.96 ID:AwyMmBtY0●.net ソース http://realtime.search.yahoo.co.jp/search?p=%E6%9B%B8%E9%A1%9E%E5%E3%82%B8&ei=UTF-8 3... 続きを読む
Ruby の invalid byte sequence in UTF-8 例外を encode("UTF-8", "UTF-8") で回避するのはおかしいよ、という話 : sonotsのblog
こんにちは @sonots です。 Ruby の invalid byte sequence in UTF-8 例外を encode("UTF-8", "UTF-8") で回避するのはおかしいよ、という話をします。 Ruby 1.9 でUTF-8的に正しくないバイト列がある文字列を扱っていると、正規表現マッチや gsub といったメソッドを使っているところで ArgumentError: inva... 続きを読む
プログラマのための文字コード技術入門を読んだ 2010-02-14 - 未来のいつか/hyoshiokの日記
例えば、次の言葉の意味を知りたい、聞いたことがあるけどよく分かっていないプログラマにとって、お勧めの書籍だ。Unicode/UTF-8/UTF-16/USC-2/JIS X0208/JIS X0212/JIS X0213/SJIS/EUC-JP/CP932/ISO-2022-JP/ASCII/Latin-1/ISO 10646/ISO 8859-1/サロゲートペア/文字化け/機種依存文字/半角カナ... 続きを読む
HTML/XHTML Character Entities : HTML.SU
Other projects of manual.su: Freeware, HTML, CSS, XML, MathML, DTD, JavaScript, W3C DOM, SSI, SQL, UTF, Chemistry, Free fonts, Cheat sheets Other projects of Itlibitum, Corp.: Polls, Free icons, Pictu... 続きを読む