はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ テキストデータ

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 25件)
 

AIの進化が止まらない→スクショを送るだけでゲームも作れる、バグも修正できる、宿題もやってくれる、認証システムも……

2023/10/20 このエントリーをはてなブックマークに追加 122 users Instapaper Pocket Tweet Facebook Share Evernote Clip スクショ 宿題 パク OpenAI 進化

OpenAIが提供するChatGPT Visionは画像の認識や分析に長けた機能 (要:$20/月のChatGPT Plusアカウント) 例えば、バグが起こっている様子をスクショして送れば、AIがソースコードの問題箇所を検出し、訂正したコードを送ってくれる ほかには手書きの文字を読み込んでテキストデータにしたり、画像を認識してその状況を... 続きを読む

「大規模言語モデル(LLM)カオスマップ」2023年度6月版が公開

2023/06/07 このエントリーをはてなブックマークに追加 144 users Instapaper Pocket Tweet Facebook Share Evernote Clip LLM 激化 直近 カオスマップ 起業

株式会社ANOBAKAは、直近の大規模言語モデル(LLM:Large Language Models)の開発競争の激化を受け、Generative AI領域で起業を考えている人への参考情報として「大規模言語モデル(LLM)カオスマップ」2023年度6月版を公開したと発表した。 大規模言語モデル(LLM:Large Language Models)とは、大量のテキストデータ... 続きを読む

ChatGPTで記憶を持たせる|ナッピー通信|note

2023/04/16 このエントリーをはてなブックマークに追加 140 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt Note 対話 個別 記憶

こんにちは代表のサル君です。今日はChatGPTに記憶を持たせる方法を紹介します。 ChatGPTと記憶力ChatGPTは、大量のテキストデータをトレーニングデータとして使用し、そのデータを元に自然言語テキストを生成することができます。しかし、個別の対話の詳細を長期的に覚えることはできません。これは、ChatGPTが非常に大... 続きを読む

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) - Qiita

2023/03/30 このエントリーをはてなブックマークに追加 804 users Instapaper Pocket Tweet Facebook Share Evernote Clip prompt LLM Fine-tuning GPT 過言

【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) ChatGPT に代表される今日の AI ブームを牽引しているのは 大規模言語モデル(Large-scale Language Model, LLM) と言っても過言ではないでしょう。LLM とは大量のテキストデータを使ってトレーニングされた自然言語処理のモデルで... 続きを読む

幻冬舎が記事をNFT化へ Web3.0系エンジニアとシステム開発

2022/09/05 このエントリーをはてなブックマークに追加 120 users Instapaper Pocket Tweet Facebook Share Evernote Clip NFT化 幻冬舎 システム開発 NECO JSON

幻冬舎は9月5日、記事をブロックチェーン上に保存するシステム「あたらしい経済 ON-CHAIN WEB APP(NECO)」を開発したと発表した。メディアの廃刊やサイバー攻撃があってもコンテンツデータが消えないとしている。 NFT(非代替性トークン)の発行時に、記事タイトルとサムネイル画像のURL、本文のテキストデータをjson... 続きを読む

[Python]機械学習などでテキストデータを特徴量にする際のソースコード集 | かものはしの分析ブログ

2019/06/23 このエントリーをはてなブックマークに追加 387 users Instapaper Pocket Tweet Facebook Share Evernote Clip パシ Python テキストマイニング 機械学習 GitHub

都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト テキスト... 続きを読む

マイクロソフト、テキストデータをDNAに変換する装置を開発。将来はデータセンターをサイコロ大に - Engadget 日本版

2019/03/22 このエントリーをはてなブックマークに追加 58 users Instapaper Pocket Tweet Facebook Share Evernote Clip マイクロソフト DNA 手のひら 概念実証 装置

マイクロソフトが、ワシントン大学と共同でデジタルデータをDNAに変換・保存する初めての装置を開発しました。マイクロソフトは、この装置による概念実証がDNAストレージ技術を進歩させ、データセンター規模の情報を手のひらに乗るほどの大きさのDNAに記録できるようにしたいと考えています。 続きを読む

ブラウザ上で複数のテキストをコピー可能になる拡張機能「Multicopy」を使ってみた - GIGAZINE

2019/01/14 このエントリーをはてなブックマークに追加 58 users Instapaper Pocket Tweet Facebook Share Evernote Clip ブラウジング GIGAZINE メモリ 一度 PC作業

テキストデータなどをPC上のメモリにコピーして任意に貼り付けることができるクリップボード機能は効率的なPC作業やブラウジングに不可欠ですが、一度にひとつしかコピーできず、新しくコピーすると前のデータは消えてしまうので、「さっきコピーしたテキストはどこのページにあったっけ」と探した経験がある人も多いは... 続きを読む

確率的プログラミングPyro入門 | eureka tech blog

2017/12/17 このエントリーをはてなブックマークに追加 3801 users Instapaper Pocket Tweet Facebook Share Evernote Clip eureka tech blog SRE Qiita 卓球

確率的プログラミングPyro入門 はじめまして。eureka-BIチームの小林です。 普段は卓球とスプラトゥーンをやっています。 この記事は eureka Engineering Advent Calendar 2017 – Qiita の17日目の記事です。 16日目は サマーインターン参加者かつSREでインターン中のdatchこと原田くんの 「Pairsのテキストデータを学習させたword2v... 続きを読む

LIMEで機械学習の予測結果を解釈してみる - Qiita

2017/10/10 このエントリーをはてなブックマークに追加 50 users Instapaper Pocket Tweet Facebook Share Evernote Clip 回帰 データサイエンティスト ユーザ Lime 年収

初投稿です 導入 セクシーなデータサイエンティストの皆様におかれましては、日々の業務で様々な機械学習のモデルを構築しておられるかと思います。それは例えば、あるサービスのユーザ情報を用いてコンバージョンするかしないかを予測していたり、またある時は年収を回帰で予測していたり、またあるときはユーザが投稿した画像情報についての二値分類やテキストデータについてのネガポジ分類をしていたりすることでしょう。 こ... 続きを読む

【特別企画】もう「Excel」はいらない? 最強CSVエディターと化した「EmEditor」を使いこなす - 窓の杜

2016/07/18 このエントリーをはてなブックマークに追加 751 users Instapaper Pocket Tweet Facebook Share Evernote Clip EmEditor Excel 特別企画

【特別企画】もう「Excel」はいらない? 最強CSVエディターと化した「EmEditor」を使いこなす テキストデータを整形するなら「Excel」よりもときに強力で、「Excel」よりもお手軽 7月19日 06:05 続きを読む

Javaで1行ずつテキストデータを読み込むイディオムの変遷 - argius note

2015/06/06 このエントリーをはてなブックマークに追加 373 users Instapaper Pocket Tweet Facebook Share Evernote Clip イディオム forEach Java 変遷 大抵

2015-06-06 Javaで1行ずつテキストデータを読み込むイディオムの変遷 Java テキストデータを読み込む場合、言語にかかわらず1行ずつ読み込んで処理します。ここではこのイディオムを"read-lines"と呼ぶことにします。 スクリプト言語なんかだと大抵、最初からforeachで済んでしまっていたりしますが、初期のJavaではちょっと面倒な手順が必要でした。 新しいバージョンではだいぶ... 続きを読む

3桁ごとにカンマが発生するフォント: mottainaiDTP

2014/04/22 このエントリーをはてなブックマークに追加 84 users Instapaper Pocket Tweet Facebook Share Evernote Clip 置換 カンマ データベース フォント ミス

DTP作業者にとっての難易度 ★★★★☆(4) 通常、桁区切りのカンマが必要な場合「テキストデータに含めておく」「レイアウト上に手作業で入力する」「検索/置換により挿入する」といった作業が必要です。対象箇所が多ければ負担が大きくなりますしミスの原因にもなります。また、私が経験した仕事ではレイアウト上の数字をデータベースに戻す際にカンマが邪魔になり、わざわざ削除することもありました。 このような問題... 続きを読む

あふれでるアイデアを箇条書き、階層化して整理してみよう! : ライフハッカー[日本版]

2013/04/26 このエントリーをはてなブックマークに追加 170 users Instapaper Pocket Tweet Facebook Share Evernote Clip ライフハッカー アイデア 階層化 Dropbox 階層

Dropbox , Webツール , その他 , 最新テック あふれでるアイデアを箇条書き、階層化して整理してみよう! 2013.04.26 10:00 アウトラインはとても便利なアイデアの整理方法です。テキストデータを箇条書きにし、かつ階層にわけて表示させることで、プロジェクトやTo-Doリストの管理などに役立ちます。 そんなアウトラインを作成、編集して、複数の端末間で同期するシンプルな方法を探... 続きを読む

LTSV FAQ - LTSV って何? どういうところが良いの? - naoyaのはてなダイアリー

2013/02/09 このエントリーをはてなブックマークに追加 460 users Instapaper Pocket Tweet Facebook Share Evernote Clip JSON httpd naoya LTSV TSV

LTSV って何?Labeled Tab-Separated Values という、テキストのフォーマットの仕様です。CSV や TSV や JSON そのほかと同じ、テキストデータのフォーマット名。主にログ、特に httpd のアクセスログなどに適用すると便利です。仕様は http://ltsv.org にまとまっています。随時更新中です。LTSV は単なるログのフォーマットであって、それ以上で... 続きを読む

初心者は必見!Evernoteの使い方に迷ってるなら作って欲しい20個のノート | simple days

2012/10/07 このエントリーをはてなブックマークに追加 1783 users Instapaper Pocket Tweet Facebook Share Evernote Clip Evernote ユースケ you_shirasaki 音声

love notes ♥ / jessgrrrr ■Evernoteには、何でも突っ込んでしまえ!! とりあえず、保存するのに迷ったらEvernoteに突っ込んでます。 どうも、ユースケ(@you_shirasaki)です。 Evernoteって使い始めの時は「どう使えば良いのか分からない!!」という人が結構多いです。 Evernoteには、テキストデータはもちろん、写真やPDF、音声など、とにか... 続きを読む

誠 Biz.ID:3分LifeHacking:EvernoteでOCR処理したテキストデータを抽出する

2012/02/06 このエントリーをはてなブックマークに追加 122 users Instapaper Pocket Tweet Facebook Share Evernote Clip Evernote word 語句 OCR処理 単語

Evernote上で「WORD」という単語でテキスト検索をしたところ。JPG画像上の「Word」という文字列をハイライト表示していることから、文字列をテキストデータとして認識していることが分かる 「Evernote」は、文字列を含む画像をアップロードするとサーバ側でOCR処理をする。それにより、テキストでの検索が可能となっている。任意の語句で検索をすると、画像上の文字列を黄色くハイライト表示するの... 続きを読む

単語と文字の話 : Preferred Research

2011/05/29 このエントリーをはてなブックマークに追加 157 users Instapaper Pocket Tweet Facebook Share Evernote Clip Preferred Research 単語 Mecab 文字

4月からPFIで働いてます。海野です。 今日は単語の話をします。読み物的な話なので軽く読んでください。 テキストデータなどの自然文を機械処理するときには、まず最初に単語に分割するということをよく行います。一般的にはMeCabやChasenといった形態素解析エンジンに投げて行います。形態素と単語の区別という話もあるのですが、ここでは大雑把に「連続した文字列の単位」くらいの意味で話します。 検索という... 続きを読む

私の翻訳のやり方 - capsctrldays(2011-03-26)

2011/03/26 このエントリーをはてなブックマークに追加 197 users Instapaper Pocket Tweet Facebook Share Evernote Clip テキストエディタ capsctrldays フォーマット

■ 私の翻訳のやり方秋から半年かけて2冊の本の翻訳をしたので、そのやり方をまとめて書いてみる。翻訳本の宣伝はまた後日。1. テキストデータ化するまずは何はともあれテキストデータにする。私は、テキストエディタと電子辞書を使って翻訳しているので、テキストデータがなければ作業ができない。あまりよくない気もするけど、仕方ない。元の原稿が最初からテキストデータであれば問題ないが、その他のフォーマットだと変換... 続きを読む

Q&A災害時の法律実務ハンドブック 目次

2011/03/25 このエントリーをはてなブックマークに追加 127 users Instapaper Pocket Tweet Facebook Share Evernote Clip 目次 一助 初版 本書 改訂

弊社では、関東弁護士会連合会編集にて「Q&A 災害時の法律実務ハンドブック」を平成18年に発行いたしましたが、このたびの東日本大震災復興の一助として本書の改訂を決定いたしました。関東弁護士会連合会編集にて本年6月頃の発行を予定しております。なお、初版については在庫がございませんので、参考として平成18年の内容をテキストデータでご覧いただけるようにいたしました。お役立ていただければ幸いです。 続きを読む

Linuxコマンドでテキストデータを自在に操る - じっくりコトコト煮込んだみかん

2010/09/16 このエントリーをはてなブックマークに追加 1021 users Instapaper Pocket Tweet Facebook Share Evernote Clip コトコト Linuxコマンド みかん uniq Paste

linuxLinuxでテキストデータを扱うときに、コマンドをパイプで繋げるだけでいろいろな処理ができて面白いのですが、綺麗に整理されていない気がするのでまとめてみます。ここでは、cat, paste, join, grep, head, tail, cut, sed, tr, sort, uniq, wc を取り上げます。ファイルを縦に結合ファイルを縦に結合します。コマンド説明cat file1 ... 続きを読む

Leo's Chronicle: 正規表現に見切りをつけるとき

2009/01/27 このエントリーをはてなブックマークに追加 429 users Instapaper Pocket Tweet Facebook Share Evernote Clip Leo's Chronicle 正規表現 JSON perl

2009年1月27日 正規表現に見切りをつけるとき Perl, Rubyなど手軽に使えるプログラミング言語に慣れてくると、あらゆるテキストデータの処理に正規表現(regular expression)を使ってしまいがちです。 けれど実は、正規表現の処理能力を超えるフォーマットというのが存在します。その典型的な例が、XMLやJSONのように、入れ子になったデータフォーマットです。 例えば、 (a, ... 続きを読む

仕事耕具:入力はテキストデータだけ――折りたたみ式キーボード搭載の「ポメラ」 - ITmedia Biz.ID

2008/10/21 このエントリーをはてなブックマークに追加 231 users Instapaper Pocket Tweet Facebook Share Evernote Clip ITmedia Biz.ID TXT形式 ポメラ キングジム

ニュース 仕事耕具: 入力はテキストデータだけ――折りたたみ式キーボード搭載の「ポメラ」 キングジムは、テキスト入力ツール「ポメラ」を発表した。折りたたみ式キーボードと4インチのモノクロVGA液晶画面を搭載。入力できるデータはテキスト(TXT形式)のみで、日本語入力環境は組み込み向けのATOK 2007を採用した。 2008年10月21日 15時12分 更新 キングジムは10月21日、テキスト入力... 続きを読む

3分LifeHacking:画像内の文字をコピー&ペーストする - ITmedia Biz.ID

2007/10/30 このエントリーをはてなブックマークに追加 577 users Instapaper Pocket Tweet Facebook Share Evernote Clip ITmedia Biz.ID OCR コピー 文字 無償

ニュース 3分LifeHacking: 画像内の文字をコピー&ペーストする 資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 2007年10月30日 13時30分 更新 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像... 続きを読む

void GraphicWizardsLair( void ); // 日本語文の中に混在する英単語の前後に「いわゆる半角スペース」を入れるのはバッドノウハウなので、それを自覚して使う方が良い

2006/06/21 このエントリーをはてなブックマークに追加 638 users Instapaper Pocket Tweet Facebook Share Evernote Clip バッドノウハウ void text 追記 前後

--> [text][www] 日本語文の中に混在する英単語の前後に「いわゆる半角スペース」を入れるのはバッドノウハウなので、それを自覚して使う方が良い (追記:単なる「空白を入れる」という表現だと「JIS X 4051の四分アキを入れて表示すること」なのか「テキストデータに半角スペースを入れること」なのかが混乱するので、この件に関しては出来るだけ区別して正確に表現することをオススメします) (追... 続きを読む

 
(1 - 25 / 25件)