はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 正規化

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 9 / 9件)
 

とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro

2023/06/06 このエントリーをはてなブックマークに追加 2409 users Instapaper Pocket Tweet Facebook Share Evernote Clip inuro まさかり 名寄せ 総立ち 言説

「住所の揺らぎ程度のことにAIを使いたいだとかデジタル音痴」だの「住所の正規化なんてExcelで2時間あれば作れそう」だの、たいへんフットワークの軽やかな言説の数々に、位置情報界隈のみならず住所の正規化や名寄せに少しでも関わったことのあるエンジニアが総立ちでマサカリを投げていたのも記憶に新しい今日この頃... 続きを読む

住所の正規化は沼である。

2023/06/06 このエントリーをはてなブックマークに追加 383 users Instapaper Pocket Tweet Facebook Share Evernote Clip 住所 twitter.com 中略 河野大臣 河野太郎

杉原航太 @kota_sugihara 河野太郎がマイナンバーカードの住所照合についてデジタル音痴ぶりを如何なく発揮した件 河野大臣『問題は住所が「港区赤坂一丁目2の3」と書く人もいれば、「港区赤坂1-2-3」と書く人もいる…(中略)将来的にはAIの技術を使って表記揺れを判断することがあり得るかもしれない。』… twitter.com/... 続きを読む

日本の住所の正規化に本気で取り組んでみたら大変すぎて鼻血が出た。 - Qiita

2020/06/04 このエントリーをはてなブックマークに追加 689 users Instapaper Pocket Tweet Facebook Share Evernote Clip Qiita 緯度経度 鼻血 JSON ファイル 数字

先日、弊社では Community Geocoder というサービスをリリースしました。 Community Geocoder 紹介記事 さて、このジオコーダーは、住所を正規化してそれを「大字町丁目コード」という12桁の数字に変換し、そのコードをファイル名として GitHub ページ上に大量においた JSON ファイルにアクセスして緯度経度を取得すると... 続きを読む

経産省発の npm モジュール!住所や電話番号の正規化、ジオコーディングなどができる IMI コンポーネントツールを試した! - Geolonia developer's blog

2020/05/29 このエントリーをはてなブックマークに追加 1237 users Instapaper Pocket Tweet Facebook Share Evernote Clip 経産省 ジオコーディング https npm ツール

Photo by Luiz Centenaro on Unsplash Code for Japan の関さんが SNS でシェアしてて知ったのですが、経産省さんがなにやらオープンソースで住所や電話番号の正規化などなどをするツールを公開したとのこと。 https://info.gbiz.go.jp/tools/imi_tools/ 経産省が住所変換や法人種別名、電話番号の正規化に使えるIMIコン... 続きを読む

文字コード再入門 ─ Unicodeでのサロゲートペア、結合文字、正規化、書記素クラスタを理解しよう! - エンジニアHub|若手Webエンジニアのキャリアを考える!

2020/04/28 このエントリーをはてなブックマークに追加 358 users Instapaper Pocket Tweet Facebook Share Evernote Clip サロゲートペア unicode エンジニアHub 結合文字

ソフトウェア開発に携わる方の多くは、何らかの形で文字コードに触れることがあるでしょう。文字や記号をコンピュータ上でデータとして扱うには、文字コードの知識が必要不可欠です。 本稿では、書籍『プログラマのための文字コード技術入門』の著者である矢野啓介さんが、知っておきたい基礎知識を分かりやすく解説しま... 続きを読む

アンチパターンから学ぶ RDBの正しい設計 / learn-from-failure-2 - Speaker Deck

2019/03/24 このエントリーをはてなブックマークに追加 336 users Instapaper Pocket Tweet Facebook Share Evernote Clip RDB Speaker Deck Proposal 前作 失敗

■PHPerKaigi 2019の登壇資料です - https://phperkaigi.jp/2019/ - https://fortee.jp/phperkaigi-2019/proposal/328896eb-c084-41c9-847f-f0512a538811 ■前作 - 失敗から学ぶ、RDBの正規化の話 - https://soudai.hatenablog.com/entry/learn-from-failure-1 続きを読む

Encoder-Decoder でレシピの材料名を正規化する - クックパッド開発者ブログ

2017/10/29 このエントリーをはてなブックマークに追加 357 users Instapaper Pocket Tweet Facebook Share Evernote Clip 原島 かたわら マネージメント クックパッド しょうゆ

2017 - 10 - 30 Encoder-Decoder でレシピの材料名を正規化する 研究開発部の原島です。部のマネージメントのかたわら、自然言語処理関連の開発に従事しています。本エントリでは、最近社内で開発した自然言語処理システムを紹介します。 ■ 「しょうゆ」のバリエーションは 100 種類以上 クックパッドで以前から解決したかった課題の一つに材料の名前(以下、材料名)の正規化があります... 続きを読む

食べログのレビュー点数を正規化する Chrome Extension - Tatsuhiko Miyagawa's blog

2015/01/16 このエントリーをはてなブックマークに追加 250 users Instapaper Pocket Tweet Facebook Share Evernote Clip Tatsuhiko Miyagawa's blog ロク

A weblog about Programming, Tech, gadgets, Japan and San Francisco. Tabelog is well known for its score system very crowded between 3.1 and 3.5. Most restaurants over 4 stars (or even 3.5) are excepti... 続きを読む

Swiftでの文字列比較におけるUnicode正規化を巡る注意点 - Qiita

2014/10/27 このエントリーをはてなブックマークに追加 228 users Instapaper Pocket Tweet Facebook Share Evernote Clip Qiita NSString Swift String Let

Stringの比較は正規化をかけた上で行われる Swiftの文字列比較は,Unicode正規化をかけた上で行われます。 たとえば,次の例をご覧ください。 let gaC = "\u{304C}" // 「が」の結合形 let gaD = "\u{304B}\u{3099}" // 「が」の分解形 // NSString としての文字数(UTF16での文字数)は異なる (gaC as NSStrin... 続きを読む

 
(1 - 9 / 9件)