はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 2バイト

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 4 / 4件)
 

絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama|note

2017/11/13 このエントリーをはてなブックマークに追加 1446 users Instapaper Pocket Tweet Facebook Share Evernote Clip Rui Ueyama Note unicode UTF 絵文字

UnicodeのUTF-16エンコーディングではほとんどの文字(コードポイント)は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて... 続きを読む

Yahoo!知恵袋で大学のレポートについて質問したら教授本人が回答してくれてベストアンサー不可避だった件 - ねとらぼ

2015/04/30 このエントリーをはてなブックマークに追加 143 users Instapaper Pocket Tweet Facebook Share Evernote Clip ベストアンサー とらぼ ほか 国語辞典 Yahoo

大学のレポート課題についてYahoo!知恵袋で質問を投げかけた大学生に、まさかの教授本人が回答して話題になっています。 大学のレポートについて質問 レポート内容は国語辞典「大辞林」をデータ換算すると何バイト分になるかを求めるというもの。質問者は「大辞林の総文字数を概算して、2バイトをかければよいのではないか」と考えており、この方法の正しさやそのほかの方法についてアドバイスを求めました。 まさかの教... 続きを読む

テキストファイルの標準エンコーディングは? - やねうらお−俺のブログがこんなによっちゃんイカなわけがない

2013/06/20 このエントリーをはてなブックマークに追加 52 users Instapaper Pocket Tweet Facebook Share Evernote Clip イカ やねうらお−俺 テキストファイル サロゲートペア ブログ

テキストファイルのエンコーディングとして何を基本とすべきかというのは悩ましい。 日本語のみならutf-16で幸せになれるのかと思ったら、JIS2004で追加された907字のうち304文字がサロゲートペアであって、2バイトで表現できない。 どうせ16bitで表現しきれないのなら、utf-32は保存領域がもったいない感があるので仕方ないのでutf-8を選択する。 utf-8だと相手に解釈してもらうため... 続きを読む

dotdotdot - はみ出したテキストを…に変えてくれるjQueryプラグイン | CREAMU

2012/03/19 このエントリーをはてなブックマークに追加 88 users Instapaper Pocket Tweet Facebook Share Evernote Clip CREAMU jQueryプラグイン テキスト 日本語 確認

dotdotdotは、はみ出したテキストを…に変えてくれるjQueryプラグインです。 日本語の2バイトでの確認は必要かもですが、簡単に実装できるようです。 dotdotdot 続きを読む

 
(1 - 4 / 4件)