タグ 文字コード問題
人気順 10 users 50 users 100 users 500 users 1000 users中国人を悩ませるレアな名字の文字コード問題
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 中国では、2023年8月1日に強制力のある国家標準規格「GB 18030-2022」(信息技術中文編碼字符集)が施行される。中国で「強制」という言葉が出ると「また締め付けが強化される... 続きを読む
最近、モリサワのようすがちょっとおかしいんだが。 - Mac OS Xの文字コード問題に関するメモ
ところで、モリサワのPr6Nフォントがやばいらしいですね。twitterで話題になってたね。まとめを読んでも、ちょっとわかりにくかったんですけど、どういうことなんですか?リュウミンとかのPr6Nには複数のバージョンが存在して、新バージョンで作ったデータを旧バージョンの環境で開くと、豆腐になっちゃう文字があるんだよね。うー、それはかなりイヤですね。だよね。新バージョンのほうは、IVS(異体字シーケン... 続きを読む
CJK統合漢字拡張Fがヤバイ - Mac OS Xの文字コード問題に関するメモ
日本がCJK統合漢字拡張F1/F2に提案している文字には、すでにUCSに入っている漢字と見分けがつかない例がいくつもある。これらは、提案書*1に「Similar and Variation」として既存の文字の符号位置が記載されているものの一部であり、つまり、似ている漢字の存在は百も承知で提案しているわけだ。以下、そのような例を拾ってみた。左右に並べた文字のうち「UCS」欄に符号位置が入っているほう... 続きを読む
なんたら統一文字の面積比の正確な図 - Mac OS Xの文字コード問題に関するメモ
戸籍統一文字、住基ネット統一文字、登記統一文字に含まれる漢字の数について、面積比が正確になるように図を描いてみた*1。法務省が戸籍のオンライン手続きのために整理した文字集合が、戸籍統一文字。この戸籍統一文字を拡張した文字集合が登記統一文字であり、拡張部分を登記固有文字と呼ぶ。図にすると、こんなかんじ。総務省の住民基本台帳ネットワーク統一文字(住基ネット統一文字)には、法務省の戸籍統一文字・登記統一... 続きを読む
IPAmj明朝の住基グリフ汚染 - Mac OS Xの文字コード問題に関するメモ
半年くらい前にツイートした件なのだけれど、より詳しい情報も含めてまとめておく。発端は@tree3yamaさんの、この発言。 .@tree3yama IPAmj明朝はJIS2004字形フォントではないのですね。一例としては「飴」がそうです。IVS テーブルで Adobe-Japan1 が混在しているわけではありませんでした。 URL2012-11-14 10:46:51 via web to @tr... 続きを読む
人生がときめくWindows 8のIVS実装 - Mac OS Xの文字コード問題に関するメモ
皆さんこんにちは、片づけコンサルタントのこんまり先生です。いきなりの個人名詐称……。今日は、Windows 8のIVS実装について説明するわよ。「わよ」?最初に結論を言っちゃうと、Windows 8のMS明朝・MSゴシックがIVSでサポートしているのは、MS122から「筵」を引いて「濹」を足した122文字ね。ん?以前のエントリでも言ったように、Windows Vistaで変更された文字のうち、jp... 続きを読む
この「邉」を作ったのは誰だぁ!! - Mac OS Xの文字コード問題に関するメモ
『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかで、目玉がWindows 8のIVS対応を紹介している第2章だとするなら、背骨といえるのが、IVSという枠組み自体について解説している第5章だよね。たとえがしっくりきませんが、こだわらずに先に進みましょう。その第5章のなかでも、IVSの基本中の基本をわずか1行に凝縮して視覚化しているのが、図5-7だ。はいはい。で、今日は図5-7に... 続きを読む
先生怒らないからリュウミンは手を挙げなさい - Mac OS Xの文字コード問題に関するメモ
IVSファンの皆さん、こんにちは。いえ、ぜんぜんファンとかじゃないですから。『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)の目玉と言えるのが、表2-7の「Windows 8におけるJIS X 0208:1990字形と異体字セレクター」だよね。そうなんですか?Microsoftの人が執筆しているIVS本なんだから、焦点は当然Windows 8のIVS対応。皆さんそこが知りたいわけでし... 続きを読む
『Unicode IVS/IVD入門』へのツッコミ - Mac OS Xの文字コード問題に関するメモ
『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)を読んでいたら、いくつか気になる点があったので、まとめてみることにした。とりあえず、第4章(37ページ分)だけ。時間と気力があれば、今後、他も追加していくかも*1。組版上の突っ込みは(ひどい例以外は)省いた*2。p.103ISO/IEC 8859は《中略》パート16まで定義されています(パート15は破棄)。破棄されたのはパート12。p.... 続きを読む
アレはどこから来たの? - Mac OS Xの文字コード問題に関するメモ
Unicodeっていうと、まあ、なんでもありなかんじもしますけど、結局、JIS規格にもなるわけですよね。*1当然、そうなるね。JIS規格にアレが入るんですか?うん。JIS規格にアレ。まあ、すでにあんなのの例もあるけどね。でもそれには、ケータイ絵文字というソースがありますよね。中指のアレのほうはどこから来たんですか?うーん、ちょっと長くなるけど、アレを押し込んだアイルランドの理屈を大ざっぱに言うと…... 続きを読む
IVSアドインをインストールしてみたよ - Mac OS Xの文字コード問題に関するメモ
「Unicode IVS Add-in for Microsoft Office」(http://ivsaddin.codeplex.com)をインストールしてみた。環境は、Vista + Office 2007*1。インストール後、用意されているサンプルファイルをWordで開いてみると、最初はアドインなしの環境と変らない表示だったが、カーソルがぶるぶる震えながら、徐々に異体字に置き換わっていった... 続きを読む
連絡先アプリに「バカ」とか登録しておくと死ぬの? - Mac OS Xの文字コード問題に関するメモ
だれかにメールを出すとき、どんな宛名で届いてるのか、不安になることってないですか?ん、なんで?MacやiPhoneのメールって、表示されてる差出人や宛先を見ただけじゃ、本当はそこに何が書いてあるかわからないじゃないですか。で、気付かないうちに本人に見られたくない名前が送られちゃたりしないかな、と。あー、たとえば「ほげ山」さんのメールアドレスを自分の連絡先には「バカ先生」って名前で登録してますみたい... 続きを読む
OS X 10.8.2のMail.appで新種の文字化け - Mac OS Xの文字コード問題に関するメモ
OS X 10.8.2のMail.appでは、Windows外字入りのISO-2022-JPを受信すると、メッセージ全体が化けることがある*1。たぶん、下図ピンク地の文字が1つでも含まれていると、メッセージ全体が(まるでソースを表示しているように)化ける。下図は、Thunderbirdから本文に「ローマ数字のⅤ」「ローマ数字のⅥ」と書いたメールを送信し、OS X 10.8.2のMail.appで受... 続きを読む
欧文フォントの異体字にはどんなものがあるのか - Mac OS Xの文字コード問題に関するメモ
日本語フォントのグリフ置換(GSUB)機能についてはこれまでに何度も取り上げてきたが、欧文フォントのそれについてはあまりよく知らなかったので、ちょっと調べてまとめてみることにした。下図は、文字パネルメニュー。ブラケット付きで表示されているフィーチャは、指定されたフォントではサポートされていないことを意味する。以下、番号を振ったものについて見ていく。任意の合字(dlig)は、日本語フォントでは主に「... 続きを読む
絵文字バリエーション・シーケンスとは何か - Mac OS Xの文字コード問題に関するメモ
たとえば、仕事用のメールの署名に「☎」という文字を入れていたら、iPhoneではそれが絵文字の赤電話として表示されてびっくり。というような経験をしたことがある人は、たぶん少なくないと思う。こういうことが起きるのは、「絵文字じゃない文字」と「絵文字」がUnicodeでは同じ符号位置に包摂されていて、どちらが表示されるかはフォント(の優先順位)次第だからだ。ケータイ絵文字をUnicodeに収録する際、... 続きを読む
ぼくらを乗せた新幹線はどこへ向かっているのか - Mac OS Xの文字コード問題に関するメモ
Mountain Lionで新幹線の絵文字が変わりましたねー。うん。といっても、Appleカラー絵文字には、新幹線の疑いがある車両が4つほどあるんだけどね。う、疑いですか?ほら、こんなかんじ。いや、上の2つは新幹線でしょうけど……。U+1F689 STATIONなんて、看板にはっきりと「新幹線」て書いてあるじゃん。書いてあっても違います。ふーん。U+1F686 TRAINは逆に、どこにも新幹線とは... 続きを読む
Mountain LionのAppleカラー絵文字はどこが変わったのか - Mac OS Xの文字コード問題に関するメモ
Mountain Lion(OS X 10.8)のAppleカラー絵文字には、下図の14文字が追加されている。U+FE0Fは、絵文字バリエーション・シーケンス(http://std.dkuug.dk/jtc1/sc2/wg2/docs/n4182.pdf)用のバリエーション・セレクタ。U+1F600以下は、Unicode 6.1で追加された顔文字のサポート。下図は、Mountain Lionでデザ... 続きを読む
iPhoneの文字化けを防ぐ魔法の呪文 - Mac OS Xの文字コード問題に関するメモ
昨日のエントリ(「iPhoneのMailから送ったメッセージ全体が文字化け」のまとめ)読みましたよー。iPhoneから送るメールの文字化け防止策は、署名に「♡」を入れておけばOKなんですよね?うん。ただまあ、ちょっと気にする人はいるかもなあ。男子に誤解されちゃう、と?いや、そういうのじゃなくて、つまり、化けちゃうんだよね。えっ?相手の環境によっては「♡」が化けるんだよ。何ですかそれ。文字化け対策で... 続きを読む
SoftBank iPhoneのShift_JISがすごいことになっている件 - Mac OS Xの文字コード問題に関するメモ
下図は、SoftBank iPhoneのMailが用いるShift_JISのIBM拡張文字領域*1。どうだ、驚いたろう。SoftBank iPhoneのMailは、charset=Shift_JISをよく使う。髙村薫の「髙」や宮﨑あおいの「﨑」などのWindows外字もShift_JISで送るし、絵文字もShift_JISで送る。しかし、WindowsのIBM拡張文字領域とSoftBankの絵文字... 続きを読む
OS X Lion 10.7.3のAppleカラー絵文字がすごい! - Mac OS Xの文字コード問題に関するメモ
Appleカラー絵文字が変わった。OS X Lion 10.7.3では、一気に300以上の絵文字が、新たに追加されたり、カラー化されたりした。これらは、現時点では文字ビューアの「絵文字」からは入力することができないので、見つけにくく、あまり話題になっていないようだが、大きいサイズで表示されうることを前提とした気合いの入った描き込みがすごい*1。入力は、文字ビューアの「Unicode」から。今回掲載... 続きを読む
Mac OS Xのフォントアイコンについてのまとめ - Mac OS Xの文字コード問題に関するメモ
Mac OS Xでは、フォントのアイコンがどれも似たようで意味がわかりにくいので、自分用にメモ。まず、Mac OS 9時代のフォントは、下図左側のようなかんじ。もう忘れていたが、TrueTypeも、CIDも、Type 1もスーツケースだった。このフォントスーツケース(ファイルタイプFFIL:Font File)が、(フォントフォーマットの種類を問わず)Mac OS XではFFILアイコンになる。ま... 続きを読む
なぜAppleカラー絵文字のプードルには眉毛があるのか - Mac OS Xの文字コード問題に関するメモ
ここに2匹のプードルがいるんだけどね。間違い探しですか? ズバリ、左にだけ眉毛がありますね。うん。眉毛があるほうが、iPhoneやLionに入ってる絵文字フォントのプードル。眉毛のないほうが、Unicodeのコードチャートに載ってるプードル。えっ、どういうことですか?そもそもUnicodeにケータイ絵文字を入れようって提案したのがGoogleとAppleだからね。提案書のための絵文字をAppleが... 続きを読む
Unicodeで見る各国の十二支 - Mac OS Xの文字コード問題に関するメモ
もうすぐお正月だし、こんな図を作ってみたんだけどね。十二支ですか? いろんな国の十二支?そうそう。実はこれ全部、「どこの国の十二支の何番目の動物」という情報まで含めて、Unicodeのコードチャートに載ってるものなんだよね。いちばん左の列が標準的な十二支ってことですね。うん。日本だと、12番目のイノシシだけが独自仕様だな。それが標準仕様だとブタ。カザフスタンでは、来年の干支はカタツムリですか。よく... 続きを読む
平均字面とは何か - Mac OS Xの文字コード問題に関するメモ
InDesignでは「文字揃え」と「グリッド揃え」で、平均字面に揃えるオプションが用意されている。この平均字面(ICF:Ideographic Character Face)は、OpenTypeフォントのBASEテーブルで、icfb(ICFのbottom)とicft(ICFのtop)の値として定義されている。下図、赤枠が平均字面。ideoは仮想ボディ(グレー枠)、romnは欧文ベースライン(青線)... 続きを読む
サルでもわかる行送りの基準位置 - Mac OS Xの文字コード問題に関するメモ
InDesignの「文字揃え」と「行送りの基準位置」と「グリッド揃え」の関係とかについては、たまに必要があって調べると*1、そのときはいくらかわかった気になるのだけれど、3日後くらいには、またすっかり忘れている。そんなわけで、今後の自分のために、「これだけ読めば一応わかる」という程度のことをメモしておこうと思う。まず、文字パネルメニューの「文字揃え」。これは、1行の中に異なるサイズの文字が混在する... 続きを読む