はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ unicode

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 110件)

Googleが変体仮名フォント「Noto Hentaigana」をリリース ~蕎麦屋の看板などを再現可能/Unicodeに登録されている変体仮名286文字をカバー

2024/04/03 このエントリーをはてなブックマークに追加 266 users Instapaper Pocket Tweet Facebook Share Evernote Clip 再現 看板 リリース カバー 蕎麦屋

続きを読む

ZawgyiとUnicode: ミャンマーの文字の電子化について - にせねこメモ

2023/12/19 このエントリーをはてなブックマークに追加 108 users Instapaper Pocket Tweet Facebook Share Evernote Clip 混迷 ミャンマー にせねこメモ ビルマ語 公用語

まえがき ミャンマーでは公用語としてビルマ語が使われている。ビルマ語の表記にはビルマ文字を用いるのだが、このビルマ文字のインターネット上での使用は、混迷を極めていた。そしておそらく今もまだ…。なぜか? それは、Unicodeという文字コードの標準がありながら、Zawgyiというものが広く使われていたためである。... 続きを読む

「Tera Term 5.0」がリリース ~18年ぶりのメジャーバージョンでUnicodeに全面対応/来年で30周年を迎える老舗のリモートログオンクライアント

2023/10/16 このエントリーをはてなブックマークに追加 210 users Instapaper Pocket Tweet Facebook Share Evernote Clip リモートログオンクライアント Tera Term 老舗 来年

続きを読む

全ての開発者が知っておくべきUnicodeについての最低限の知識

2023/10/04 このエントリーをはてなブックマークに追加 470 users Instapaper Pocket Tweet Facebook Share Evernote Clip プレーンテキスト 解読 最低限 おかげ 知識

2003年には「プレーンテキストなんてものは全く存在しない」と言われ、テキストの解読には文字コードの情報が必須となっていました。しかし、2023年になるまでの20年の間に絵文字などのおかげでUnicodeの利用率は98%へと到達し、再び文字コードを気にせずにすむ時代がやってきています。そんな時代において、正しくUnic... 続きを読む

awkが新しくなる!? 本家AwkがUnicode (UTF-8)とCSV対応に! - Qiita

2023/09/16 このエントリーをはてなブックマークに追加 147 users Instapaper Pocket Tweet Facebook Share Evernote Clip awk Qiita UTF-8 CSV Excel

はじめに 2023年、長い時を経て awk がとうとう Unicode (UTF-8) と CSV に対応しました 🎉🎉🎉 awk で日本語がうまく扱えない(場合がある)、Excel が出力する CSV ファイルが扱えない(場合がある)、といった問題が解決に向けて一歩に進みます。 去年、本家 awk (One True Awk, nawk) に Unicode サポートが Brian K... 続きを読む

ChatGPTは文字コードをどのように解釈しているか Unicodeの「日本語認識」「括弧の抽出」「旧字体と新字体の変換」を実験してみた

2023/05/09 このエントリーをはてなブックマークに追加 86 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt ライトニングトーク 括弧 YAPC perl

「YAPC(Yet Another Perl Conference)」は、Perlを軸としたITに関わるすべての人のためのカンファレンスです。ライトニングトークにはPR TIMES インターンのShun氏が登壇。ChatGPTと文字コードについて話します。 ChatGPTは文字コードをどのように解釈しているか 土屋俊介氏:こんにちは。先ほど、発表が4分だと知った... 続きを読む

iPhoneの新絵文字21種:震え顔にピンクや水色ハート、翼に扇子にクラゲなど。iOS 16.4ベータでEmoji 15.0対応🫨 | テクノエッジ TechnoEdge

2023/02/28 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip iPhone iOS TechnoEdge 扇子 Emoji

iPhoneに新しい絵文字が加わります。iOS 16.4ベータで加わったのは「震える顔」、ピンクや水色や灰色のハート、くらげ・翼・驢馬・扇子・ヒヤシンス・マラカス、生姜、無線マークなど、Unicodeのemoji 15.0で定められた21種。肌の色違いを含めれば31種になります。 🫨🫷🫸🩷🩵🩶🪿🐦‍⬛🫏🫎🪽🪼🪻🫛🫚🪭🪮🪇🪈🛜🪯 (21字を列挙。非対応OSでは... 続きを読む

PHPからJavaScriptにデータを受け渡すときに考えること - Qiita

2023/01/01 このエントリーをはてなブックマークに追加 123 users Instapaper Pocket Tweet Facebook Share Evernote Clip Qiita String Array JSON int

PHPのstringは任意のバイト列を扱えますが、JavaScript/JSONはUnicodeで扱える文字しか扱えません PHPのint / floatはプラットフォーム依存ですが、JavaScriptのnumberは整数と小数を型レベルで区別しません JSONのarrayに対応する型はPHPのarrayのうちリストであるものです PHPは配列(リスト)と連想配列を型レベルで区... 続きを読む

目に見えないUnicode文字をコピペして使えたり元のUnicode文字を検索したりできる「Invisible Characters」

2022/12/08 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip Unicode文字 カレンダー コピー&ペースト 表現 絵文字

世界中の文字を収集して文字コードを付与する規格「Unicode」では、バージョンアップごとに次々と絵文字が追加されたり、画像じゃなく文字で出力するためコピー&ペーストが可能なカレンダーを作成できたりと、文字を使ったさまざまな表現を使うことができます。そのようなUnicodeの「目に見えない文字」はどういった種... 続きを読む

Slackはハイライト部分をU+E000とU+E001で囲って表していそう - hogashi.*

2022/10/06 このエントリーをはてなブックマークに追加 164 users Instapaper Pocket Tweet Facebook Share Evernote Clip hogashi Description Glitch

Slack は、メッセージのどこからどこまでハイライトするかを、 Unicode の私用領域 *1の U+E000 と U+E001 を使って表しているらしく、こういう HTML を glitch とかで書いて、 <html> <head> <meta property="og:title" content="Slackで&#xE000;タイトルをハイライト&#xE001;する" /> <meta property="og:description"... 続きを読む

Unicodeの異体字セレクターを使ったステガノグラフィ - Qiita

2022/06/05 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip Hidden 字体 文字列 概要 文字

Unicodeの異体字セレクター(variation selectors)を使い、ユニコード文字列内に隠し情報を埋め込む方法です。 異体字セレクターとは 異体字セレクターは、文字の字体を詳細に指定するモディファイアのようなもの 異体字セレクターは16種類のコードポイントがある(FE00~FE0F) 仕組みの概要 隠したい文字列(hidden)を文字... 続きを読む

全社会人に伝えたい! WindowsやMacで「ZIPファイル」を文字化けさせない方法 | ライフハッカー[日本版]

2022/06/02 このエントリーをはてなブックマークに追加 20 users Instapaper Pocket Tweet Facebook Share Evernote Clip ライフハッカー Mac zipファイル Windows 文字

文字コードにUnicode(UTF-8)が使われるようになって以来、OS間の垣根はかなり低くなっています。 基本的には、現在の4大OSとも言うべき、Windows、Mac、iOS、Androidの間でファイルをやり取りしても、文字化けを起こすことはほぼありません。 続きを読む

Python 3.12 から Unicode のサイズが小さくなります - methaneのブログ

2022/05/18 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip methane sys メモリ 文字列 内部表現

Python 3.11 までは、空文字でも64バイトのメモリを使用していました。(64bitプラットフォームの場合) Unicodeの内部表現のうち一番小さい PyASCIIObject 構造体が48バイトで、その構造体の後ろにASCII文字列が続きます。その文字列はNUL終端されているので、空文字列でも1バイト追加されて49バイトになります。 >>> sys... 続きを読む

Unicodeに含まれる謎の記号「⍼」の起源を追ったレポートが公開中

2022/04/14 このエントリーをはてなブックマークに追加 78 users Instapaper Pocket Tweet Facebook Share Evernote Clip 起源 記号 ブリティッシュコロンビア大学 正体 ソフトウェア

大規模文字セットのUnicodeは世界中のあらゆる文字を収録することを目指して策定されており、「溶解する顔」や「妊娠中の人」といった個性的な絵文字も数多く登録されています。そんなUnicodeに登録されている正体不明の記号「⍼」について、ブリティッシュコロンビア大学でソフトウェアについて学んでいるジョナサン・チ... 続きを読む

ソースコードに脆弱性を潜ませられるUnicode悪用攻撃法「Trojan Source」を研究者が発表

2021/11/02 このエントリーをはてなブックマークに追加 25 users Instapaper Pocket Tweet Facebook Share Evernote Clip 脆弱性 rust ソースコード 発表 Java

英ケンブリッジ大学コンピュータ研究所が、「Trojan Source」と名付けた攻撃法を発表した。Unicodeの脆弱性を悪用するもので、C、C++、C#、JavaScript、Java、Rust、Go、Pythonに対して機能した。「他のほとんどの言語に対しても機能すると思われる」としている。 英ケンブリッジ大学コンピュータ研究所は11月1日(現地... 続きを読む

Unicode 版美乳テーブルを探せ

2021/04/03 このエントリーをはてなブックマークに追加 357 users Instapaper Pocket Tweet Facebook Share Evernote Clip

美乳テーブルとは 「美乳テーブル」という物がある。 「EUC-JP の文章を Shift_JIS だと誤認識されない様に、EUC-JP 固有のバイト値を文章先頭付近に埋め込んでおく」という物。 具体的に、Shift_JIS には 0xFD と 0xFE が現れず、EUC-JP にはそれが現れるので、その値を含む文字コードを書いておこうという事で、その文... 続きを読む

漢字のようで漢字でないUnicodeの「康熙部首」と「CJK部首補助」|TechRacho(テックラッチョ)〜エンジニアの「?」を「!」に〜|BPS株式会社

2020/10/07 このエントリーをはてなブックマークに追加 24 users Instapaper Pocket Tweet Facebook Share Evernote Clip TechRacho テックラッチョ 漢字 エンジニア

きっかけ 以下のツイートで「埼玉埼⽟問題」と康煕部首を知りました。 「埼玉」と「埼⽟」の話。unicodedata.normalize('NFKC', '「埼玉」と「埼⽟」') でいけそう https://t.co/kte0sxDvZT — Haruhiko Okumura (@h_okumura) July 11, 2020 康煕部首とは ⼀⼁⼂⼃⼄⼅⼆⼇⼈⼉⼊⼋⼌⼍⼎⼏⼐⼑⼒⼓⼔⼕⼖⼗⼘⼙⼚⼛⼜⼝... 続きを読む

UTF-8 の文字列をできる限り Shift_JIS に変換したい(実践編) | うなすけとあれこれ

2020/08/17 このエントリーをはてなブックマークに追加 25 users Instapaper Pocket Tweet Facebook Share Evernote Clip UTF-8 Shift_JIS 文字列 実践編 iconv

先日、きりきりやままさんがこのような記事を公開していました UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま それでは実際にそのような文字列変換を行うにはどうすればよいのか、またコメントでiconvについて触れられていたので、この記事ではUnicodeにおけるNFKC正規化をどうやって行うのか試し... 続きを読む

UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま

2020/08/05 このエントリーをはてなブックマークに追加 23 users Instapaper Pocket Tweet Facebook Share Evernote Clip UTF-8 Shift_JIS 文字列 CSV 変換

Shift_JIS の CSV で連携する外部サービスがあり、DB では UTF-8 でテキストを持っていたため文字コードを変換する必要が生じた。 ところが UTF-8 に存在する多くの文字は Shift_JIS に対応がないため変換することができない1。 そこで、事前に NFKC 形式で Unicode 正規化することで変換可能な文字を増やすことを試みた... 続きを読む

文字コード再入門 ─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう! - エンジニアHub|若手Webエンジニアのキャリアを考える!

2020/04/28 このエントリーをはてなブックマークに追加 358 users Instapaper Pocket Tweet Facebook Share Evernote Clip サロゲートペア エンジニアHub 結合文字 キャリア 正規化

ソフトウェア開発に携わる方の多くは、何らかの形で文字コードに触れることがあるでしょう。文字や記号をコンピュータ上でデータとして扱うには、文字コードの知識が必要不可欠です。 本稿では、書籍『プログラマのための文字コード技術入門』の著者である矢野啓介さんが、知っておきたい基礎知識を分かりやすく解説しま... 続きを読む

外字を使うのはやめてくれ! Unicodeへの移行を呼びかけるMicrosoftの公式ブログ記事が話題に - やじうまの杜 - 窓の杜

2020/03/03 このエントリーをはてなブックマークに追加 444 users Instapaper Pocket Tweet Facebook Share Evernote Clip やじうま Microsoft 移行 外字 話題

続きを読む

Twitterで「機種依存文字 Unicode」と検索するとなぜか自殺を制止されるロジックが判明【やじうまWatch】 - INTERNET Watch

2019/09/17 このエントリーをはてなブックマークに追加 119 users Instapaper Pocket Tweet Facebook Share Evernote Clip Twitter やじうまWatch ロジック 自殺 判明

続きを読む

Unicode 12.1.0で「令和」の合字1文字が追加 - Engadget 日本版

2019/05/01 このエントリーをはてなブックマークに追加 35 users Instapaper Pocket Tweet Facebook Share Evernote Clip 令和 Engadget 日本版 追加 元号 令和元年

文字コード規格の標準化団体Unicode Consortiumは、日本の新元号「令和」合字を追加する「Unicode 12.1.0」を近日中にリリースします。 合字は、「㍻」のように元号の2文字を1字に収めたもので、カレンダーシステムなどに使われています。新元号「令和」はUnicodeの文字コード「U+32FF」として予約されており、令和元年... 続きを読む

Apple、macOS Mojave 10.14.5/iOS 12.3 Beta 3でApple Symbolsフォントに新元号「令和」の合字(U+32FF)を追加。 | AAPL Ch.

2019/04/23 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip AAPL Apple 令和 新元号 合字

AppleはmacOS Mojave 10.14.5/iOS 12.3 Beta 3のApple Symbolsフォントで、Unicode(U+32FF)に新元号「令和」の合字を追加したようです。詳細は以下から。  A 続きを読む

Ruby 2.6.3 リリース

2019/04/17 このエントリーをはてなブックマークに追加 16 users Instapaper Pocket Tweet Facebook Share Evernote Clip リリース beta 令和 新元号 バージョン

Ruby 2.6.3 がリリースされました。 このリリースでは日本の新元号「令和」のサポートを追加しています。 具体的には Unicode のバージョンを 12.1 beta に更新する (#15195) とともに、date ライブラリを更新しています (#15742)。 その他いくつかの不具合修正も含まれます。詳細は commit log を参照してください。 ダ... 続きを読む

 
(1 - 25 / 110件)