タグ テキストデータ
人気順 5 users 10 users 50 users 500 users 1000 usersAIの進化が止まらない→スクショを送るだけでゲームも作れる、バグも修正できる、宿題もやってくれる、認証システムも……
OpenAIが提供するChatGPT Visionは画像の認識や分析に長けた機能 (要:$20/月のChatGPT Plusアカウント) 例えば、バグが起こっている様子をスクショして送れば、AIがソースコードの問題箇所を検出し、訂正したコードを送ってくれる ほかには手書きの文字を読み込んでテキストデータにしたり、画像を認識してその状況を... 続きを読む
「大規模言語モデル(LLM)カオスマップ」2023年度6月版が公開
株式会社ANOBAKAは、直近の大規模言語モデル(LLM:Large Language Models)の開発競争の激化を受け、Generative AI領域で起業を考えている人への参考情報として「大規模言語モデル(LLM)カオスマップ」2023年度6月版を公開したと発表した。 大規模言語モデル(LLM:Large Language Models)とは、大量のテキストデータ... 続きを読む
ChatGPTで記憶を持たせる|ナッピー通信|note
こんにちは代表のサル君です。今日はChatGPTに記憶を持たせる方法を紹介します。 ChatGPTと記憶力ChatGPTは、大量のテキストデータをトレーニングデータとして使用し、そのデータを元に自然言語テキストを生成することができます。しかし、個別の対話の詳細を長期的に覚えることはできません。これは、ChatGPTが非常に大... 続きを読む
【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) - Qiita
【完全保存版】GPT を特定の目的に特化させて扱う (Fine-tuning, Prompt, Index, etc.) ChatGPT に代表される今日の AI ブームを牽引しているのは 大規模言語モデル(Large-scale Language Model, LLM) と言っても過言ではないでしょう。LLM とは大量のテキストデータを使ってトレーニングされた自然言語処理のモデルで... 続きを読む
幻冬舎が記事をNFT化へ Web3.0系エンジニアとシステム開発
幻冬舎は9月5日、記事をブロックチェーン上に保存するシステム「あたらしい経済 ON-CHAIN WEB APP(NECO)」を開発したと発表した。メディアの廃刊やサイバー攻撃があってもコンテンツデータが消えないとしている。 NFT(非代替性トークン)の発行時に、記事タイトルとサムネイル画像のURL、本文のテキストデータをjson... 続きを読む
[Python]機械学習などでテキストデータを特徴量にする際のソースコード集 | かものはしの分析ブログ
都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト テキスト... 続きを読む
確率的プログラミングPyro入門 | eureka tech blog
確率的プログラミングPyro入門 はじめまして。eureka-BIチームの小林です。 普段は卓球とスプラトゥーンをやっています。 この記事は eureka Engineering Advent Calendar 2017 – Qiita の17日目の記事です。 16日目は サマーインターン参加者かつSREでインターン中のdatchこと原田くんの 「Pairsのテキストデータを学習させたword2v... 続きを読む
【特別企画】もう「Excel」はいらない? 最強CSVエディターと化した「EmEditor」を使いこなす - 窓の杜
【特別企画】もう「Excel」はいらない? 最強CSVエディターと化した「EmEditor」を使いこなす テキストデータを整形するなら「Excel」よりもときに強力で、「Excel」よりもお手軽 7月19日 06:05 続きを読む
Javaで1行ずつテキストデータを読み込むイディオムの変遷 - argius note
2015-06-06 Javaで1行ずつテキストデータを読み込むイディオムの変遷 Java テキストデータを読み込む場合、言語にかかわらず1行ずつ読み込んで処理します。ここではこのイディオムを"read-lines"と呼ぶことにします。 スクリプト言語なんかだと大抵、最初からforeachで済んでしまっていたりしますが、初期のJavaではちょっと面倒な手順が必要でした。 新しいバージョンではだいぶ... 続きを読む
あふれでるアイデアを箇条書き、階層化して整理してみよう! : ライフハッカー[日本版]
Dropbox , Webツール , その他 , 最新テック あふれでるアイデアを箇条書き、階層化して整理してみよう! 2013.04.26 10:00 アウトラインはとても便利なアイデアの整理方法です。テキストデータを箇条書きにし、かつ階層にわけて表示させることで、プロジェクトやTo-Doリストの管理などに役立ちます。 そんなアウトラインを作成、編集して、複数の端末間で同期するシンプルな方法を探... 続きを読む
LTSV FAQ - LTSV って何? どういうところが良いの? - naoyaのはてなダイアリー
LTSV って何?Labeled Tab-Separated Values という、テキストのフォーマットの仕様です。CSV や TSV や JSON そのほかと同じ、テキストデータのフォーマット名。主にログ、特に httpd のアクセスログなどに適用すると便利です。仕様は http://ltsv.org にまとまっています。随時更新中です。LTSV は単なるログのフォーマットであって、それ以上で... 続きを読む
初心者は必見!Evernoteの使い方に迷ってるなら作って欲しい20個のノート | simple days
love notes ♥ / jessgrrrr ■Evernoteには、何でも突っ込んでしまえ!! とりあえず、保存するのに迷ったらEvernoteに突っ込んでます。 どうも、ユースケ(@you_shirasaki)です。 Evernoteって使い始めの時は「どう使えば良いのか分からない!!」という人が結構多いです。 Evernoteには、テキストデータはもちろん、写真やPDF、音声など、とにか... 続きを読む
誠 Biz.ID:3分LifeHacking:EvernoteでOCR処理したテキストデータを抽出する
Evernote上で「WORD」という単語でテキスト検索をしたところ。JPG画像上の「Word」という文字列をハイライト表示していることから、文字列をテキストデータとして認識していることが分かる 「Evernote」は、文字列を含む画像をアップロードするとサーバ側でOCR処理をする。それにより、テキストでの検索が可能となっている。任意の語句で検索をすると、画像上の文字列を黄色くハイライト表示するの... 続きを読む
単語と文字の話 : Preferred Research
4月からPFIで働いてます。海野です。 今日は単語の話をします。読み物的な話なので軽く読んでください。 テキストデータなどの自然文を機械処理するときには、まず最初に単語に分割するということをよく行います。一般的にはMeCabやChasenといった形態素解析エンジンに投げて行います。形態素と単語の区別という話もあるのですが、ここでは大雑把に「連続した文字列の単位」くらいの意味で話します。 検索という... 続きを読む
私の翻訳のやり方 - capsctrldays(2011-03-26)
■ 私の翻訳のやり方秋から半年かけて2冊の本の翻訳をしたので、そのやり方をまとめて書いてみる。翻訳本の宣伝はまた後日。1. テキストデータ化するまずは何はともあれテキストデータにする。私は、テキストエディタと電子辞書を使って翻訳しているので、テキストデータがなければ作業ができない。あまりよくない気もするけど、仕方ない。元の原稿が最初からテキストデータであれば問題ないが、その他のフォーマットだと変換... 続きを読む
Q&A災害時の法律実務ハンドブック 目次
弊社では、関東弁護士会連合会編集にて「Q&A 災害時の法律実務ハンドブック」を平成18年に発行いたしましたが、このたびの東日本大震災復興の一助として本書の改訂を決定いたしました。関東弁護士会連合会編集にて本年6月頃の発行を予定しております。なお、初版については在庫がございませんので、参考として平成18年の内容をテキストデータでご覧いただけるようにいたしました。お役立ていただければ幸いです。 続きを読む
Linuxコマンドでテキストデータを自在に操る - じっくりコトコト煮込んだみかん
linuxLinuxでテキストデータを扱うときに、コマンドをパイプで繋げるだけでいろいろな処理ができて面白いのですが、綺麗に整理されていない気がするのでまとめてみます。ここでは、cat, paste, join, grep, head, tail, cut, sed, tr, sort, uniq, wc を取り上げます。ファイルを縦に結合ファイルを縦に結合します。コマンド説明cat file1 ... 続きを読む
Leo's Chronicle: 正規表現に見切りをつけるとき
2009年1月27日 正規表現に見切りをつけるとき Perl, Rubyなど手軽に使えるプログラミング言語に慣れてくると、あらゆるテキストデータの処理に正規表現(regular expression)を使ってしまいがちです。 けれど実は、正規表現の処理能力を超えるフォーマットというのが存在します。その典型的な例が、XMLやJSONのように、入れ子になったデータフォーマットです。 例えば、 (a, ... 続きを読む
仕事耕具:入力はテキストデータだけ――折りたたみ式キーボード搭載の「ポメラ」 - ITmedia Biz.ID
ニュース 仕事耕具: 入力はテキストデータだけ――折りたたみ式キーボード搭載の「ポメラ」 キングジムは、テキスト入力ツール「ポメラ」を発表した。折りたたみ式キーボードと4インチのモノクロVGA液晶画面を搭載。入力できるデータはテキスト(TXT形式)のみで、日本語入力環境は組み込み向けのATOK 2007を採用した。 2008年10月21日 15時12分 更新 キングジムは10月21日、テキスト入力... 続きを読む
3分LifeHacking:画像内の文字をコピー&ペーストする - ITmedia Biz.ID
ニュース 3分LifeHacking: 画像内の文字をコピー&ペーストする 資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。 2007年10月30日 13時30分 更新 資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像... 続きを読む
void GraphicWizardsLair( void ); // 日本語文の中に混在する英単語の前後に「いわゆる半角スペース」を入れるのはバッドノウハウなので、それを自覚して使う方が良い
--> [text][www] 日本語文の中に混在する英単語の前後に「いわゆる半角スペース」を入れるのはバッドノウハウなので、それを自覚して使う方が良い (追記:単なる「空白を入れる」という表現だと「JIS X 4051の四分アキを入れて表示すること」なのか「テキストデータに半角スペースを入れること」なのかが混乱するので、この件に関しては出来るだけ区別して正確に表現することをオススメします) (追... 続きを読む