はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 4バイト文字

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 1 / 1件)
 

絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama|note

2017/11/13 このエントリーをはてなブックマークに追加 1446 users Instapaper Pocket Tweet Facebook Share Evernote Clip Rui Ueyama Note unicode UTF 絵文字

UnicodeのUTF-16エンコーディングではほとんどの文字(コードポイント)は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて... 続きを読む

 
(1 - 1 / 1件)