はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 学習データ

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 17 / 17件)
 

大規模言語モデルの開発

2024/05/30 このエントリーをはてなブックマークに追加 60 users Instapaper Pocket Tweet Facebook Share Evernote Clip 言語モデル 開発 モテ 人工知能学会全国大会 構築

2024年度 人工知能学会全国大会(第38回)チュートリアル講演1 本講演では、大規模言語モデルの開発に必要な基礎および最新動向を概観する。その後、東京工業大学情報理工学院の岡崎研究室と横田研究室、産業技術総合研究所の研究チームで開発された大規模言語モデルSwallowの開発経験を踏まえ、学習データの構築、モデ... 続きを読む

「レベル4」自動運転事故 カメラが自転車を認識できず 福井 | NHK

2023/11/10 このエントリーをはてなブックマークに追加 198 users Instapaper Pocket Tweet Facebook Share Evernote Clip 運行 ブレーキ 福井 特定 車両

10月に福井県永平寺町で全国で初めて特定の条件のもとで完全な自動運転「レベル4」の運行を行っていた車両が自転車に接触した事故について町は10日、障害物を検知するカメラの事前の学習データが不足していたため、自転車だと認識できず、自動でブレーキがかからなかったことが原因だなどと公表しました。 この事故は10... 続きを読む

OpenAI APIのファインチューニングの学習データのガイドライン|npaka|note

2023/04/16 このエントリーをはてなブックマークに追加 188 users Instapaper Pocket Tweet Facebook Share Evernote Clip ファインチューニング プロンプト 書式 Note 出力

以下の記事を元に、「OpenAI API」のファインチューニングの学習データのガイドラインをまとめました。 1. 学習データの書式ファインチューニングするには、単一の入力「プロンプト」とそれに関連する出力 「コンプリーション」 のペアで構成される学習データが必要です。これは、1回のプロンプトで詳細な手順や複数の... 続きを読む

画像生成AI「Stable Diffusion XL」登場。DreamStudioならもう使えて、日本らしい人物・風景が簡単に生成できる(CloseBox) | テクノエッジ TechnoEdge

2023/04/03 このエントリーをはてなブックマークに追加 293 users Instapaper Pocket Tweet Facebook Share Evernote Clip CloseBox TechnoEdge SDXL 従来 ハード

Stability AIは、同社が提供している画像生成AI「Stable Diffusion」を大幅に強化した「Stable Diffusion XL」(SDXL)をオープンソース公開する計画であることを明らかにしました。 学習データを従来の9億パラメータから、23億パラメータへと大幅に強化。これが次期バージョン3に組み込まれるとしています。現在パート... 続きを読む

ChatGPTは、質問するより作業を依頼する方が良さげ

2023/02/21 このエントリーをはてなブックマークに追加 623 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt 表題 良さげ 筆者 課金

賢いチャットAIとして話題のChatGPT。筆者も試しに課金をして、あれこれチャットを楽しんでいます。それで、ここまでの結論としては表題の通り、ChatGPTは質問をするよりも、作業を依頼する方が良さげだなと思いました。 知識が古くて、質問には使えない なぜかというと、ChatGPTは現状では学習データが若干古く、例えば... 続きを読む

学習データに最適化されすぎて本来の目的が達成できなくなる「過学習」と同様の現象はAIだけでなく社会全体で起こっているという主張

2023/01/01 このエントリーをはてなブックマークに追加 186 users Instapaper Pocket Tweet Facebook Share Evernote Clip 主張 現象 過学習 本来 未知

機械学習における過学習(過剰適合/オーバーフィッティング)とは、AIが学習データのみに最適化されてしまい、未知のデータに対する予測能力が低くなってしまうという現象です。そんな過学習と同様の現象が機械学習分野だけでなく社会全体のさまざまな場面でも発生していると、Google傘下の人工知能研究所・Google Brain... 続きを読む

【大炎上】イラストAIサイト「NovelAI」明確に絵描きの敵だった(danbooru という無断転載サイトを学習データに利用)

2022/10/04 このエントリーをはてなブックマークに追加 219 users Instapaper Pocket Tweet Facebook Share Evernote Clip Danbooru novelAI rem 絵描き 大炎上

NovelAI @novelaiofficial @NilaierMusic Since we are training on Danbooru, it also learns character names and their visuals. You can prompt for "masterpiece portrait of smiling rem, re zero, caustics, textile shading, high resolution illustration" and get this: pic.twitter.com/2wqDmAxCJa 2022-09-2... 続きを読む

「AI学習禁止」を表明しても、現行の法律では対応できない?技術と著作物の今後について議論盛り上がる

2022/08/29 このエントリーをはてなブックマークに追加 399 users Instapaper Pocket Tweet Facebook Share Evernote Clip 現行 議論 AI学習禁止 法律 技術

SmokingWOLF@「片道勇者2」開発中!(シルフェイド/ウディタ開発者) @WO_LF 「AI学習禁止」がトレンドに入っててすごい時代の風を感じる (※「自分のイラストを学習データに使わないで」という話題。個人のイラスト複数枚を入力することで画風をまねた顔イラスト画像を生成できるサービスが今日リリースされた影響) SF小説もびっく... 続きを読む

画像の機械学習が劣化する理由 - Qiita

2022/04/30 このエントリーをはてなブックマークに追加 194 users Instapaper Pocket Tweet Facebook Share Evernote Clip 主旨 Qiita 大半 著者 ヒント

主旨 単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。 はじめに 画像認識の機械学習を改善するためにはデータを追加すればよい。 そう思っている人が大半だろう。 ただ、データを追加したからといって必ずしも機械学習結果は改善しない... 続きを読む

カルビーのポテチを売上1.3倍にしたAIの正体--プラグの「パッケージデザインAI」の実力 - CNET Japan

2021/05/05 このエントリーをはてなブックマークに追加 925 users Instapaper Pocket Tweet Facebook Share Evernote Clip ポテチ カルビー マーケティングリサーチ 森永乳業 プラグ

カルビー、ネスレ日本、森永乳業など、日本を代表する食品メーカー各社が導入しはじめているAIツールがある。マーケティングリサーチとパッケージデザインを展開するプラグが2年前にリリースした「パッケージデザインAI」だ。 590万人の学習データをもとに、AIが商品のパッケージデザインをたった10秒で評価する。商品開... 続きを読む

NEC、従来技術の半分の学習データ量でも高精度に識別可能なディープラーニング技術を開発 (2019年8月19日): プレスリリース | NEC

2019/08/19 このエントリーをはてなブックマークに追加 65 users Instapaper Pocket Tweet Facebook Share Evernote Clip NEC 識別 プレスリリース ディープラーニング技術 半分

NECは、従来の半分程度の学習データ量でも高い識別精度を維持できるディープラーニング技術を新たに開発しました。 識別精度の向上には、識別が難しい学習データをより多く学習することが有効ですが、学習に適した質の良いデータを十分に確保することが重要です。本技術は、ニューラルネットワーク(注1)の中間層で得られ... 続きを読む

落書きをリアルな風景写真にリアルタイムで変換できる驚異的なお絵かき技術「GauGAN」をNVIDIAが発表 - GIGAZINE

2019/03/19 このエントリーをはてなブックマークに追加 526 users Instapaper Pocket Tweet Facebook Share Evernote Clip GIGAZINE GauGAN NVIDIA オブジェクト

Microsoftペイントとマウスを使って描いたようなラフなイラストが、一瞬でリアルな風景写真に変換される画期的な技術をNVIDIA Researchが開発しました。「GauGAN」と呼ばれるインタラクティブなソフトウェアは膨大な学習データを用いたディープラーニングを使ったもの。GauGANを使えば「オブジェクトの形を描くだけ」「... 続きを読む

ソニー、ディープラーニングの学習速度で“世界最高速” 学習時間を短縮へ - ITmedia NEWS

2018/11/13 このエントリーをはてなブックマークに追加 55 users Instapaper Pocket Tweet Facebook Share Evernote Clip ディープラーニング ソニー 短縮 パラメータ数 学習速度

ソニーは、ディープラーニングの学習速度で世界最高速を達成したと発表。学習時間を短縮できる可能性を示したとしている。 ソニーは11月13日、ディープラーニングの学習速度で世界最高速(同社調べ)を達成したと発表した。ディープラーニングの認識精度向上のため、学習データのサイズやモデルのパラメータ数が増え、一... 続きを読む

詳説 人工知能 - ディープラーニングの仕組みと応用:ITpro

2017/01/25 このエントリーをはてなブックマークに追加 354 users Instapaper Pocket Tweet Facebook Share Evernote Clip ITpro ニューラルネットワーク 詳説 模倣 人工知能

脳の神経回路の構造を模倣 ディープラーニングは、大量のデータを学習するために、人間の脳の神経回路の構造を模倣(モデル化)した情報処理の仕組みであるニューラルネットワークを用いる。図3のニューラルネットワークは、「入力層」「隠れ層」「出力層」という3層で構成している。また、学習データは入力データとなる手書き文字の画素データと、正解データがセットになっている。 このニューラルネットワークのモデルを学習... 続きを読む

詳説 人工知能 - ディープラーニングの仕組みと応用:ITpro

2017/01/23 このエントリーをはてなブックマークに追加 354 users Instapaper Pocket Tweet Facebook Share Evernote Clip ITpro ニューラルネットワーク 詳説 模倣 人工知能

脳の神経回路の構造を模倣 ディープラーニングは、大量のデータを学習するために、人間の脳の神経回路の構造を模倣(モデル化)した情報処理の仕組みであるニューラルネットワークを用いる。図3のニューラルネットワークは、「入力層」「隠れ層」「出力層」という3層で構成している。また、学習データは入力データとなる手書き文字の画素データと、正解データがセットになっている。 このニューラルネットワークのモデルを学習... 続きを読む

分散学習用TensorFlowコードの書き方 - めもめも

2016/12/24 このエントリーをはてなブックマークに追加 79 users Instapaper Pocket Tweet Facebook Share Evernote Clip 書き方 Variable TensorFlow 各ノード メモ

2016 - 12 - 24 分散学習用TensorFlowコードの書き方 何の話かというと Google Cloud MLを利用して、TensorFlowの分散学習を行う方法です。取り急ぎ、自分用のメモとして公開しておきます。 分散学習にはいくつかのパターンがありますが、最もシンプルな「データ分散」の場合を説明します。各ノードは同じモデルに対して、個別に学習データを適用して、Variableを修... 続きを読む

みらい翻訳 | イノベーティブな機械翻訳

2015/01/30 このエントリーをはてなブックマークに追加 280 users Instapaper Pocket Tweet Facebook Share Evernote Clip カスタマイズ パートナー 最先端技術 イノベーティブ 機械翻訳

みらい翻訳は 機械翻訳の最先端技術と 最適な学習データを活用した カスタマイズ可能な翻訳ソリューションを パートナーと共に提供します 続きを読む

 
(1 - 17 / 17件)