はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 文字コード

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 116件)

市民への郵送物、JISコード外の氏名が文字化け さいたま市が謝罪

2024/02/19 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip 謝罪 文字化け 氏名 市民 JIS規格

さいたま市は2月16日、9日に発送した給付金の通知書で、氏名の一部に誤表記があったと16日に発表し、謝罪した。 発送した12万通のうち4438通で、JIS規格の文字コードに含まれない外字を含む氏名について、正しい漢字が適用されなかったという。 対象の郵送物は「さいたま市物価高騰対応重点支援給付金のお知らせ」。 給... 続きを読む

ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ

2023/12/19 このエントリーをはてなブックマークに追加 108 users Instapaper Pocket Tweet Facebook Share Evernote Clip unicode 混迷 ミャンマー にせねこメモ ビルマ語

まえがき ミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか? それは、Unicodeという文字コードの標準がありながら、Zawgyiというものが広く使われていたためである。... 続きを読む

全ての開発者が知っておくべきUnicodeについての最低限の知識

2023/10/04 このエントリーをはてなブックマークに追加 470 users Instapaper Pocket Tweet Facebook Share Evernote Clip unicode プレーンテキスト 解読 最低限 おかげ

2003年には「プレーンテキストなんてものは全く存在しない」と言われ、テキストの解読には文字コードの情報が必須となっていました。しかし、2023年になるまでの20年の間に絵文字などのおかげでUnicodeの利用率は98%へと到達し、再び文字コードを気にせずにすむ時代がやってきています。そんな時代において、正しくUnic... 続きを読む

話題の「Telnet」電子公告、「平文やんけ」という指摘に応えて「over SSL」版を追加/文字コードも「UTF-8」に、ただし超長文の反論付き【やじうまの杜】

2023/09/06 このエントリーをはてなブックマークに追加 182 users Instapaper Pocket Tweet Facebook Share Evernote Clip Telnet やじうま UTF-8 電子公告 指摘

続きを読む

よく訓練されたITエンジニアが『迂闊に触るな!』と徹底的に叩き込まれてる教えには理由がある

2023/06/06 このエントリーをはてなブックマークに追加 24 users Instapaper Pocket Tweet Facebook Share Evernote Clip 迂闊 ITエンジニア 素人 住所 感覚

あゆゆん♪ @ayu_littlewing よく訓練されたITエンジニアは 「住所と文字コードには迂闊に手を出しちゃならん!!」と徹底的に叩き込まれているのだが、この感覚はたぶん素人には分かりにくいと思う。。。 あともうひとつくらい迂闊に触るながあった気がしたけどなんだっけな。。。 2023-06-06 08:57:31 続きを読む

文字コード | 衆議院議員 河野太郎公式サイト

2023/05/10 このエントリーをはてなブックマークに追加 1031 users Instapaper Pocket Tweet Facebook Share Evernote Clip

2023.05.10 官報に使われる「官報文字」というものがあります。 そこには渡辺さんの「辺」の異体字が140文字も登録されています。 日本語の常用漢字には2136文字ありますが、そこには邉や邊などは入っていません。 そこでJISの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを... 続きを読む

ChatGPTは文字コードをどのように解釈しているか Unicodeの「日本語認識」「括弧の抽出」「旧字体と新字体の変換」を実験してみた

2023/05/09 このエントリーをはてなブックマークに追加 86 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt unicode ライトニングトーク 括弧 抽出

「YAPC(Yet Another Perl Conference)」は、Perlを軸としたITに関わるすべての人のためのカンファレンスです。ライトニングトークにはPR TIMES インターンのShun氏が登壇。ChatGPTと文字コードについて話します。 ChatGPTは文字コードをどのように解釈しているか 土屋俊介氏:こんにちは。先ほど、発表が4分だと知った... 続きを読む

目に見えないUnicode文字をコピペして使えたり元のUnicode文字を検索したりできる「Invisible Characters」

2022/12/08 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip Unicode文字 unicode カレンダー 表現 絵文字

世界中の文字を収集して文字コードを付与する規格「Unicode」では、バージョンアップごとに次々と絵文字が追加されたり、画像じゃなく文字で出力するためコピー&ペーストが可能なカレンダーを作成できたりと、文字を使ったさまざまな表現を使うことができます。そのようなUnicodeの「目に見えない文字」はどういった種... 続きを読む

JavaScript における文字コードの初歩 - 30歳からのプログラミング

2022/10/23 このエントリーをはてなブックマークに追加 137 users Instapaper Pocket Tweet Facebook Share Evernote Clip 初歩 プログラミング サロゲートペア JavaScript

この記事では、 JavaScript で文字コードを扱う際に知っておくべき概念である Code Point や Code Unit、サロゲートペア、といったものについて説明していく。 また、具体的にそれらの概念を使ってどのようにコードを書いていくのかについても扱う。 この記事に出てくるコードの動作確認は以下の環境で行った。 Deno 1.2... 続きを読む

「HTMLでは環境依存文字(①や©など)を文字参照にしなければいけない」という誤解と、本当に置換すべき文字

2022/10/21 このエントリーをはてなブックマークに追加 150 users Instapaper Pocket Tweet Facebook Share Evernote Clip 誤解 HTML UTF-8 特殊記号 ソフトウェア

HTMLファイルで特殊記号を使う際、① は ①、© は © のように置き換えて書かないといけないものだと思いこんでいないでしょうか。 現代ではそれは誤解です。 UTF-8では特殊記号の文字参照は不要 そもそも環境依存文字とは、データを扱う機種・ソフトウェアなどの違い(文字コードの割り当ての違い)により表示... 続きを読む

改行コード(CR/LF)と改行文字と標準C - yohhoyの日記

2022/09/04 このエントリーをはてなブックマークに追加 6 users Instapaper Pocket Tweet Facebook Share Evernote Clip yohhoy プログラム内部 外部ファイル 改行コード 標準C

プログラミング言語C標準規格における改行文字(new-line character)と改行コードCR, LFとの関係性について。 まとめ: C標準規格ではプログラム内部で扱う「改行文字」と、外部ファイルにおける具体的なCR, LF等の「文字コード」を区別する。*1 *2 改行文字をファイル上でどう表現するかについて何ら規定しない。CR/LFを... 続きを読む

全社会人に伝えたい! WindowsやMacで「ZIPファイル」を文字化けさせない方法 | ライフハッカー[日本版]

2022/06/02 このエントリーをはてなブックマークに追加 20 users Instapaper Pocket Tweet Facebook Share Evernote Clip ライフハッカー Mac zipファイル Windows 文字

文字コードにUnicode(UTF-8)が使われるようになって以来、OS間の垣根はかなり低くなっています。 基本的には、現在の4大OSとも言うべき、Windows、Mac、iOS、Androidの間でファイルをやり取りしても、文字化けを起こすことはほぼありません。 続きを読む

Windowsでちょっと文字コードを調べたいときの方法 (1/2)

2021/11/21 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip Windows プログラミング コンピュータ パターン 別途

Windows PowerShellを使えば、文字コードを簡単に調べることができる。パターンさえ覚えれば、プログラミングの知識は不要で、アプリを別途インストールする必要もない コンピュータを使っていると、文字コードを調べなければならないことがある。昔なら文字コードは8bitしかなかったので、ASCIIコード表からすぐだった... 続きを読む

(プログラマのための) いまさら聞けない標準規格の話 第1回 文字コード概要編 | オブジェクトの広場

2021/07/14 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip プログラマ オブジェクト ミドルウェア 狭間 フレームワーク

プログラマがシステム開発において共通で必要となる、技術と業務の狭間の共通知識を解説します。連載第1回は文字コードの概要編です。 0. はじめに 業務システムを開発する場合、プログラミング言語、フレームワーク、ミドルウェア、業務知識など以外に、共通で必要となる知識があります。文字コード、国際化、日付・時... 続きを読む

「ASCIIをUTF-8にして」それが『できない』ことを理解してもらえなかった話 - Qiita

2021/04/03 このエントリーをはてなブックマークに追加 190 users Instapaper Pocket Tweet Facebook Share Evernote Clip 発端 Shift_JIS 拙者 Qiita ASCII

物語の始まり 事の発端は納品後。 先方からメッセージが届きました。 クライアント様「このファイルの文字コードがShift_JISになっておりますので、UTF-8で再納品をお願いいたします。」 拙者(あれ…UTF-8にしてたと思うんだけどな) 拙者「確認いたします。」 文字コードを確認する 本案件はいわゆる更新案件で、今回の... 続きを読む

「ASCIIをUTF-8にして」それが『できない』ことを理解してもらえなかった話 - Qiita

2021/04/03 このエントリーをはてなブックマークに追加 539 users Instapaper Pocket Tweet Facebook Share Evernote Clip 発端 Shift_JIS 拙者 Qiita ASCII

物語の始まり 事の発端は納品後。 先方からメッセージが届きました。 クライアント様「このファイルの文字コードがShift_JISになっておりますので、UTF-8で再納品をお願いいたします。」 拙者(あれ…UTF-8にしてたと思うんだけどな) 拙者「確認いたします。」 文字コードを確認する 本案件はいわゆる更新案件で、今回の... 続きを読む

UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま

2020/08/05 このエントリーをはてなブックマークに追加 23 users Instapaper Pocket Tweet Facebook Share Evernote Clip UTF-8 Shift_JIS unicode 文字列 CSV

Shift_JIS の CSV で連携する外部サービスがあり、DB では UTF-8 でテキストを持っていたため文字コードを変換する必要が生じた。 ところが UTF-8 に存在する多くの文字は Shift_JIS に対応がないため変換することができない1。 そこで、事前に NFKC 形式で Unicode 正規化することで変換可能な文字を増やすことを試みた... 続きを読む

nkf の代替としての StreamRelay.jar (文字コード変換) - Qiita

2020/06/01 このエントリーをはてなブックマークに追加 16 users Instapaper Pocket Tweet Facebook Share Evernote Clip nkf オプショ Qiita Writer Reader

java.exe -Djava.security.policy=StreamRelay.policy -jar StreamRelay.jar ⇔ StreamRelay.bat InputStream/OutputStreamにReader/Writerを被せる事で、(文字コードを含む)文字列を扱うことができるので、入力の文字コードと出力の文字コードを異なるオプション指定をすれば、文字コード変換を行う事ができる オプショ... 続きを読む

メモ帳の文字コード既定値がUTF-8に、Windows 10「May 2019 Update」 | 日経 xTECH(クロステック)

2019/05/28 このエントリーをはてなブックマークに追加 60 users Instapaper Pocket Tweet Facebook Share Evernote Clip Linux 順次 親和性 xTech デフォルト設定

2019年5月21日(米国時間)から、Windows 10の大型アップデート「Windows 10 May 2019 Update(May 2019 Update)」の配信が順次始まった。主要な新機能や変更点を見ていこう。 May 2019 Updateでは、Linuxとの親和性をさらに高める機能が追加された。この他、メモ帳のデフォルト設定の文字コードがUTF-8となり、今まで... 続きを読む

Unicode 12.1.0で「令和」の合字1文字が追加 - Engadget 日本版

2019/05/01 このエントリーをはてなブックマークに追加 35 users Instapaper Pocket Tweet Facebook Share Evernote Clip 令和 Engadget 日本版 追加 unicode 元号

文字コード規格の標準化団体Unicode Consortiumは、日本の新元号「令和」合字を追加する「Unicode 12.1.0」を近日中にリリースします。 合字は、「㍻」のように元号の2文字を1字に収めたもので、カレンダーシステムなどに使われています。新元号「令和」はUnicodeの文字コード「U+32FF」として予約されており、令和元年... 続きを読む

【WSL入門】第2回 避けては通れないWSLとWindows 10との文字コードの違い:ITの教室 - @IT

2019/04/04 このエントリーをはてなブックマークに追加 36 users Instapaper Pocket Tweet Facebook Share Evernote Clip WSL WSL入門 Linux シェル コマンド

WSLを活用するためには、Windows OSとWSLの関係を理解するのが第一歩。基本となるWindows 10とWSLの文字コードの違いなどを理解しよう。 Windows 10の中で、Linuxを動作させるWindows Subsystem for Linux(WSL)では、フル機能のコマンドやコマンドインタープリター(シェル)を利用でき、高度なコマンドライン機能を持... 続きを読む

新元号 令和(れいわ)の文字コードについて - Qiita

2019/04/02 このエントリーをはてなブックマークに追加 23 users Instapaper Pocket Tweet Facebook Share Evernote Clip Qiita れいわ ユニコード 字体 元号

新元号 令和 の文字コードに関して 2019年4月1日、新元号「令和(れいわ)」が発表された。 しかし、令という字体を表すユニコードは2つあるため、詳細をまとめる。 結論 元号に通常使用される、使用すべきなのは「U+4EE4」であり、日本語フォントに存在するのも「U+4EE4」である。 「U+F9A8」は、韓国語の等音法則に... 続きを読む

新元号「令和」と文字コード(主にUnicode)の問題 - Togetter

2019/04/01 このエントリーをはてなブックマークに追加 328 users Instapaper Pocket Tweet Facebook Share Evernote Clip 事例 ケース Togetter unicode ところ

年号扱うシステムを運用しているところは、これから30日でテスト完了させなきゃいけないわけだけど、U+F9A8 U+548C (令和) のケースと、U+4EE4 U+548C (令和) のケースがあるみたいなのを想定していなかった…って事例はなんかすごくありそう。大丈夫かなぁ… 続きを読む

CSVファイルを呼び出す前に文字コードを確認するようにする。 | バシャログ。

2019/01/24 このエントリーをはてなブックマークに追加 19 users Instapaper Pocket Tweet Facebook Share Evernote Clip バシャログ CSVファイル forEach PHP エク

みなさんこんにちは 私の担当したプロジェクトで必要な情報をエクセルからCSVファイルに変換してそれをphpで読み取って保存する。 という手順がありました。 処理自体は簡単なものでSplFileObject()を使ってやればforeachで一行ずつ読み取るだけです。 しかし、一点読み取る前に問題がありました。文字コードです。 エク... 続きを読む

char8_tによせて - なるせにっき

2018/12/23 このエントリーをはてなブックマークに追加 102 users Instapaper Pocket Tweet Facebook Share Evernote Clip せにっき グリフ Glyph 字形 字体

C++標準化委員会、ついに文字とは何かを理解する: char8_tという記事が話題だってので、つらつらと書いてみました。 「グリフ」について グリフ(glyph)という言葉の定義をめぐって でも触れられていますが、「グリフ」という言葉が「字体」を指すのか「字形」を指すのかってのは議論がありますね。文字コードの文脈で... 続きを読む

 
(1 - 25 / 116件)