タグ 文字コード問題
人気順 5 users 10 users 100 users 500 users 1000 users中国人を悩ませるレアな名字の文字コード問題
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 中国では、2023年8月1日に強制力のある国家標準規格「GB 18030-2022」(信息技術中文編碼字符集)が施行される。中国で「強制」という言葉が出ると「また締め付けが強化される... 続きを読む
最近、モリサワのようすがちょっとおかしいんだが。 - Mac OS Xの文字コード問題に関するメモ
ところで、モリサワのPr6Nフォントがやばいらしいですね。twitterで話題になってたね。まとめを読んでも、ちょっとわかりにくかったんですけど、どういうことなんですか?リュウミンとかのPr6Nには複数のバージョンが存在して、新バージョンで作ったデータを旧バージョンの環境で開くと、豆腐になっちゃう文字があるんだよね。うー、それはかなりイヤですね。だよね。新バージョンのほうは、IVS(異体字シーケン... 続きを読む
CJK統合漢字拡張Fがヤバイ - Mac OS Xの文字コード問題に関するメモ
日本がCJK統合漢字拡張F1/F2に提案している文字には、すでにUCSに入っている漢字と見分けがつかない例がいくつもある。これらは、提案書*1に「Similar and Variation」として既存の文字の符号位置が記載されているものの一部であり、つまり、似ている漢字の存在は百も承知で提案しているわけだ。以下、そのような例を拾ってみた。左右に並べた文字のうち「UCS」欄に符号位置が入っているほう... 続きを読む
この「邉」を作ったのは誰だぁ!! - Mac OS Xの文字コード問題に関するメモ
『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかで、目玉がWindows 8のIVS対応を紹介している第2章だとするなら、背骨といえるのが、IVSという枠組み自体について解説している第5章だよね。たとえがしっくりきませんが、こだわらずに先に進みましょう。その第5章のなかでも、IVSの基本中の基本をわずか1行に凝縮して視覚化しているのが、図5-7だ。はいはい。で、今日は図5-7に... 続きを読む
先生怒らないからリュウミンは手を挙げなさい - Mac OS Xの文字コード問題に関するメモ
IVSファンの皆さん、こんにちは。いえ、ぜんぜんファンとかじゃないですから。『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)の目玉と言えるのが、表2-7の「Windows 8におけるJIS X 0208:1990字形と異体字セレクター」だよね。そうなんですか?Microsoftの人が執筆しているIVS本なんだから、焦点は当然Windows 8のIVS対応。皆さんそこが知りたいわけでし... 続きを読む
『Unicode IVS/IVD入門』へのツッコミ - Mac OS Xの文字コード問題に関するメモ
『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)を読んでいたら、いくつか気になる点があったので、まとめてみることにした。とりあえず、第4章(37ページ分)だけ。時間と気力があれば、今後、他も追加していくかも*1。組版上の突っ込みは(ひどい例以外は)省いた*2。p.103ISO/IEC 8859は《中略》パート16まで定義されています(パート15は破棄)。破棄されたのはパート12。p.... 続きを読む
連絡先アプリに「バカ」とか登録しておくと死ぬの? - Mac OS Xの文字コード問題に関するメモ
だれかにメールを出すとき、どんな宛名で届いてるのか、不安になることってないですか?ん、なんで?MacやiPhoneのメールって、表示されてる差出人や宛先を見ただけじゃ、本当はそこに何が書いてあるかわからないじゃないですか。で、気付かないうちに本人に見られたくない名前が送られちゃたりしないかな、と。あー、たとえば「ほげ山」さんのメールアドレスを自分の連絡先には「バカ先生」って名前で登録してますみたい... 続きを読む
OS X 10.8.2のMail.appで新種の文字化け - Mac OS Xの文字コード問題に関するメモ
OS X 10.8.2のMail.appでは、Windows外字入りのISO-2022-JPを受信すると、メッセージ全体が化けることがある*1。たぶん、下図ピンク地の文字が1つでも含まれていると、メッセージ全体が(まるでソースを表示しているように)化ける。下図は、Thunderbirdから本文に「ローマ数字のⅤ」「ローマ数字のⅥ」と書いたメールを送信し、OS X 10.8.2のMail.appで受... 続きを読む
ぼくらを乗せた新幹線はどこへ向かっているのか - Mac OS Xの文字コード問題に関するメモ
Mountain Lionで新幹線の絵文字が変わりましたねー。うん。といっても、Appleカラー絵文字には、新幹線の疑いがある車両が4つほどあるんだけどね。う、疑いですか?ほら、こんなかんじ。いや、上の2つは新幹線でしょうけど……。U+1F689 STATIONなんて、看板にはっきりと「新幹線」て書いてあるじゃん。書いてあっても違います。ふーん。U+1F686 TRAINは逆に、どこにも新幹線とは... 続きを読む
iPhoneの文字化けを防ぐ魔法の呪文 - Mac OS Xの文字コード問題に関するメモ
昨日のエントリ(「iPhoneのMailから送ったメッセージ全体が文字化け」のまとめ)読みましたよー。iPhoneから送るメールの文字化け防止策は、署名に「♡」を入れておけばOKなんですよね?うん。ただまあ、ちょっと気にする人はいるかもなあ。男子に誤解されちゃう、と?いや、そういうのじゃなくて、つまり、化けちゃうんだよね。えっ?相手の環境によっては「♡」が化けるんだよ。何ですかそれ。文字化け対策で... 続きを読む
SoftBank iPhoneのShift_JISがすごいことになっている件 - Mac OS Xの文字コード問題に関するメモ
下図は、SoftBank iPhoneのMailが用いるShift_JISのIBM拡張文字領域*1。どうだ、驚いたろう。SoftBank iPhoneのMailは、charset=Shift_JISをよく使う。髙村薫の「髙」や宮﨑あおいの「﨑」などのWindows外字もShift_JISで送るし、絵文字もShift_JISで送る。しかし、WindowsのIBM拡張文字領域とSoftBankの絵文字... 続きを読む
なぜAppleカラー絵文字のプードルには眉毛があるのか - Mac OS Xの文字コード問題に関するメモ
ここに2匹のプードルがいるんだけどね。間違い探しですか? ズバリ、左にだけ眉毛がありますね。うん。眉毛があるほうが、iPhoneやLionに入ってる絵文字フォントのプードル。眉毛のないほうが、Unicodeのコードチャートに載ってるプードル。えっ、どういうことですか?そもそもUnicodeにケータイ絵文字を入れようって提案したのがGoogleとAppleだからね。提案書のための絵文字をAppleが... 続きを読む
Unicodeで見る各国の十二支 - Mac OS Xの文字コード問題に関するメモ
もうすぐお正月だし、こんな図を作ってみたんだけどね。十二支ですか? いろんな国の十二支?そうそう。実はこれ全部、「どこの国の十二支の何番目の動物」という情報まで含めて、Unicodeのコードチャートに載ってるものなんだよね。いちばん左の列が標準的な十二支ってことですね。うん。日本だと、12番目のイノシシだけが独自仕様だな。それが標準仕様だとブタ。カザフスタンでは、来年の干支はカタツムリですか。よく... 続きを読む
auのiPhoneで絵文字が化ける問題についてのまとめ - Mac OS Xの文字コード問題に関するメモ
auのiPhoneで絵文字が化ける問題について、まとめておく*1(以下、iPhoneはiOS 5であることが前提)。細かい条件によっていろいろ違いがあるのだけれど、大ざっぱには、下図の赤矢印が化ける。つまり、iPhoneの@ezweb.ne.jpアカウントからiPhoneの@i.softbank.jpアカウントに絵文字を送ることはできるが、逆方向の場合は化ける。また、auのiPhone(@ezwe... 続きを読む
Lionにナマハゲと天狗が入っているのはどうして? - Mac OS Xの文字コード問題に関するメモ
Appleカラー絵文字って何?iPhoneやLionに搭載されている絵文字フォントの名前だよ。Lionをインストールすると、iPhoneのカラー絵文字がMacでも使えるようになるんだ。文字ビューアの「絵文字」から入力できるよ。iPhoneとLionでは、絵文字に違いはあるの?いちばん目立つ違いは、Lionでは文字が増えてることかな。わあ、どんなのが増えたの?ナマハゲとか天狗とかナルトとか。これ、モ... 続きを読む
「●」が小さく見えることがあるのはどうして? - Mac OS Xの文字コード問題に関するメモ
(ホー先生)Macの画面で「●▲■」の「●」と「■」だけが小さく見えることがあるのはなぜじゃ*1。「●」と「■」が欧文フォントで表示されているからだよ。たとえばMacのFinderでは、ファイル名は「Lucida Grande優先」で表示される。Lucida Grandeは「●(U+25CF)」や「■(U+25A0)」のグリフを持っているけれど、「▲(U+25B2)」のグリフを持っていない。だから... 続きを読む
いろんな日本語EUCについてのまとめ - Mac OS Xの文字コード問題に関するメモ
日本語EUC(EUC-JP)にはいろいろあって頭がこんがらがってきたので、サルにもわかるように(つまり、自分があとから見て理解できるように)まとめてみた*1。まず、EUC-JPにはどんな種類があるのだろうということで、わたしの環境で実装例を確認できるものをピックアップしてみた。下図のうちeucJP-openとIANAのEUC-JPについては身近な実装例を思いつかなかったが、これを外すわけにはいかな... 続きを読む
新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 - 新常用漢字が引き起こす文字コード問題:ITpro
普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。 (日経コンピュー... 続きを読む
Mac OS Xの文字コード問題に関するメモ - ヒラギノでは全角でデザインされていない文字
たとえば「○か×か」というテキストをヒラギノで表示した際、「×」だけが小さく見えて困惑したといった経験を、多くのMac OS Xユーザが持っていると思う。これは、ヒラギノがU+00D7 MULTIPLICATION SIGN(乗算記号)をプロポーショナルでデザインしているためである。そんなわけで、JIS X 0208の範囲内のいわゆる「全角文字」のうち、ヒラギノでは全角でデザインされていない文字の... 続きを読む