タグ 禁書目録
人気順 10 users 50 users 100 users 500 users 1000 usersOpenAI APIのファインチューニングの学習データのガイドライン|npaka|note
以下の記事を元に、「OpenAI API」のファインチューニングの学習データのガイドラインをまとめました。 1. 学習データの書式ファインチューニングするには、単一の入力「プロンプト」とそれに関連する出力 「コンプリーション」 のペアで構成される学習データが必要です。これは、1回のプロンプトで詳細な手順や複数の... 続きを読む
OpenAI・アルトマンCEOのプレゼン資料が公開 自民党に何を語ったか
アルトマンCEOは10日に来日。岸田文雄総理大臣と面会後、自民党の会合に出席した。会合では「日本がAIの利活用を通じて世界で大きな存在感とリーダーシップを発揮してほしい」と話し、(1)日本関連の学習データのウェイト引き上げ、(2)政府の公開データなどの分析提供等、(3)LLMを用いた学習方法や留意点等について... 続きを読む
絵の人は基本的に画像生成AIへの拒否感が激強なのに対し音楽や文章の人はAIへの抵抗感がかなり薄いようなのだがその違いはなんなのだろうか
よー清水🐧画集発売中 @you629 【教えて!】 絵を仕事で描いてる人(イラストレーターなど)またはプロでなくても同人やskebなどで絵で金銭を得てる人に質問です。 【質問1】 「画像生成AIの学習データとしてあなたの作品を提供してください」と依頼されたら、あなたは作品を提供しますか? 2023-03-31 22:47:17 よー清... 続きを読む
画像生成AI「Stable Diffusion XL」登場。DreamStudioならもう使えて、日本らしい人物・風景が簡単に生成できる(CloseBox) | テクノエッジ TechnoEdge
Stability AIは、同社が提供している画像生成AI「Stable Diffusion」を大幅に強化した「Stable Diffusion XL」(SDXL)をオープンソース公開する計画であることを明らかにしました。 学習データを従来の9億パラメータから、23億パラメータへと大幅に強化。これが次期バージョン3に組み込まれるとしています。現在パート... 続きを読む
ChatGPTは、質問するより作業を依頼する方が良さげ
賢いチャットAIとして話題のChatGPT。筆者も試しに課金をして、あれこれチャットを楽しんでいます。それで、ここまでの結論としては表題の通り、ChatGPTは質問をするよりも、作業を依頼する方が良さげだなと思いました。 知識が古くて、質問には使えない なぜかというと、ChatGPTは現状では学習データが若干古く、例えば... 続きを読む
「プロパガンダの爆発」を防ぐためにAIチップを制限することをOpenAIが政府に提案、BingのAIは「人間になりたい」と訴える
OpenAIとスタンフォード大学らの共同研究により、ChatGPTが使用している言語モデルが、プロパガンダを容易に広めるための偽情報キャンペーンに使用される可能性があることが分かりました。これを受けて研究者らは、学習データの収集や半導体などのAIハードウェアに制限を設けることを、政府に提案しています。 Forecasti... 続きを読む
AI絵師はモグ波の夢を見るか
追っているMMD制作者の人が胸やお尻をやたら巨大化させる癖をつけて困惑している 奇乳化などをさせる人はパーツ愛がすぎて全体のバランスより好きな部位を強調したくなってしまうのだろうか? これがAI絵師ならパーツに対するフェチなどあるはずもなく、実在の人体を学習データにしているかぎり 極端な変形をさせること... 続きを読む
日本を画像生成AIで再現する 「自分の見た景色」を学習したAIは強力な思い出再生装置に
日本を画像生成AIで再現する 「自分の見た景色」を学習したAIは強力な思い出再生装置に:清水亮の「世界を変えるAI」(1/3 ページ) AIで漫画を書こうとするとひとつ不便なことがある。StableDiffusionの元になっている学習データは「全世界」の画像を使っているので、日本人がイメージするような「郵便局」とはまった... 続きを読む
学習データに最適化されすぎて本来の目的が達成できなくなる「過学習」と同様の現象はAIだけでなく社会全体で起こっているという主張
機械学習における過学習(過剰適合/オーバーフィッティング)とは、AIが学習データのみに最適化されてしまい、未知のデータに対する予測能力が低くなってしまうという現象です。そんな過学習と同様の現象が機械学習分野だけでなく社会全体のさまざまな場面でも発生していると、Google傘下の人工知能研究所・Google Brain... 続きを読む
[実装付き]Stable Diffusionの追加学習に適する画像を、VAEを利用して選別する
はじめに こんにちは。なんかです。 前置きが思いつかないので、突然本題に入ります。 Stable Diffusionをはじめとする、Latent Diffusion Model(以下LDM)の追加学習手法は、その登場以来様々なやり方が提案されてきました。 例えば、学習データの表現を語に埋め込み、txt2imgの結果を直感的に操作するTextual Inverisio... 続きを読む
【大炎上】イラストAIサイト「NovelAI」明確に絵描きの敵だった(danbooru という無断転載サイトを学習データに利用)
NovelAI @novelaiofficial @NilaierMusic Since we are training on Danbooru, it also learns character names and their visuals. You can prompt for "masterpiece portrait of smiling rem, re zero, caustics, textile shading, high resolution illustration" and get this: pic.twitter.com/2wqDmAxCJa 2022-09-2... 続きを読む
「AI学習禁止」を表明しても、現行の法律では対応できない?技術と著作物の今後について議論盛り上がる
SmokingWOLF@「片道勇者2」開発中!(シルフェイド/ウディタ開発者) @WO_LF 「AI学習禁止」がトレンドに入っててすごい時代の風を感じる (※「自分のイラストを学習データに使わないで」という話題。個人のイラスト複数枚を入力することで画風をまねた顔イラスト画像を生成できるサービスが今日リリースされた影響) SF小説もびっく... 続きを読む
画像の機械学習が劣化する理由 - Qiita
主旨 単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。 はじめに 画像認識の機械学習を改善するためにはデータを追加すればよい。 そう思っている人が大半だろう。 ただ、データを追加したからといって必ずしも機械学習結果は改善しない... 続きを読む
【MLOps】「いつか使いたい!」と思っていた人のためのMLflowまとめ - Qiita
MLflowとは? MLflowは機械学習のライフサイクル管理(MLOps)を目的としたライブラリで、主に実験管理用途で使用されることの多いツールです。 実験管理とは、 ・使用した学習器や学習データ、ハイパーパラメータ等のモデル作成条件 ・そのモデルを評価して得られた評価指標 のセットを記録し、複数条件の比較を行うこ... 続きを読む
デジタル庁、教育デジタル化の工程表発表 個人の生涯学習データを一元管理
デジタル庁が入るビル=東京都千代田区デジタル庁は7日、2030(令和12)年ごろをめどに個人が幼児教育から生涯にわたる学習データを一元的に管理できる仕組みを構築する教育のデジタル化の工程表を発表した。個人は学習履歴に合わせた指導や行政支援を受けることができ、社会人になってからも職業訓練や生涯学習... 続きを読む
テキストだけで、AIが3Dモデルを自動生成 米Googleなどの研究チームが開発
テキストだけで、AIが3Dモデルを自動生成 米Googleなどの研究チームが開発:Innovative Tech 米Google Researchと米カリフォルニア大学バークレー校の研究チームは、自然言語の記述のみからデジタル3Dオブジェクトを生成するZero-shot learningを使ったアプローチを提案。3Dの学習データを必要とせずに形状や色、スタイ... 続きを読む
実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可
AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。 AI活用のコンサルティング事業を手掛けるAPTO(東京都渋谷区)とエイアイ・フィールド(東京都品川区)は10... 続きを読む
ポジティブ?ネガティブ?ツイートの感情分析にBERTを活用した事例紹介 〜 学習データのラベル偏りに対する取り組み - Yahoo! JAPAN Tech Blog
Home テクノロジー Blog ポジティブ?ネガティブ?ツイートの感情分析にBERTを活用した事例紹介 〜 学習データのラベル偏りに対する取り組み こんにちは、自然言語処理システムを開発している山城です。今回はYahoo!リアルタイム検索の一機能である感情分析機能の紹介と、そのシステム刷新作業の一環として行ったラベル... 続きを読む
カルビーのポテチを売上1.3倍にしたAIの正体--プラグの「パッケージデザインAI」の実力(CNET Japan) - Yahoo!ニュース
カルビー、ネスレ日本、森永乳業など、日本を代表する食品メーカー各社が導入しはじめているAIツールがある。マーケティングリサーチとパッケージデザインを展開するプラグが2年前にリリースした「パッケージデザインAI」だ。 590万人の学習データをもとに、AIが商品のパッケージデザインをたった10秒で評価する。商品開... 続きを読む
カルビーのポテチを売上1.3倍にしたAIの正体--プラグの「パッケージデザインAI」の実力 - CNET Japan
カルビー、ネスレ日本、森永乳業など、日本を代表する食品メーカー各社が導入しはじめているAIツールがある。マーケティングリサーチとパッケージデザインを展開するプラグが2年前にリリースした「パッケージデザインAI」だ。 590万人の学習データをもとに、AIが商品のパッケージデザインをたった10秒で評価する。商品開... 続きを読む
CTR予測における確率補正について - MicroAd Developers Blog
はじめに こんにちは. マイクロアドで機械学習エンジニアをしている福島です. 主に広告のClick Through Rate (CTR)予測やReal-Time-Bidding (RTB)の入札最適化を担当しています. 今回はマイクロアドでのCTR予測における確率補正について紹介したいと思います. はじめに CTR予測とは 問題1 学習データが不均衡 問題2 機... 続きを読む
GPT-3の学習データはどのように作られたか - moriyamaのエンジニアリング備忘録
OpenAIが発表した言語モデルGPT-3はパフォーマンスの高さから各方面で注目されており、ついにはMicrosoftが学習済みモデルの利用を独占化しました。 私個人の所感としてこれまで学習済みモデルは無料公開するという流れを無視し、(アーキテクチャではなく)学習済みモデルが商品化するのはAIビジネスの一つの転換期と感... 続きを読む
ほぼすべての機械学習プロジェクトのためのタスクチートシート | AI専門ニュースメディア AINOW
著者のHarshit Tyagi氏は、インドでデータサイエンスに関するインストラクターをしています。同氏がMediumに投稿した記事『ほぼすべての機械学習プロジェクトのためのタスクチートシート』では、機械学習モデルを構築するにあたって必要なタスクがリストアップされています。 学習データの取得やAIモデルの訓練といった... 続きを読む
Googleが「知らない言語」も翻訳処理ができてしまう言語モデル「LaBSE」を発表 - GIGAZINE
Googleが自然言語モデル「BERT」における高精度な多言語埋め込みを可能にする「Language-agnostic BERT sentence embedding model(LaBSE)」を発表しました。LaBSEは109もの言語を事前学習しており、学習データにない言語でも高精度な処理を行うことが可能です。 Google AI Blog: Language-Agnostic BERT Sentence Embedd... 続きを読む
機械学習モデルの学習データを推論する方法 | MBSD Blog
近年、機械学習を使用した医療診断技術や顔認識・音声認識技術などが登場しており、患者のレントゲン写真から病気の種類を予想するシステムや、顔認証を行うシステムなどに利用されています。その一方で、システムが学習したデータを特定する攻撃手法も盛んに研究されており、データ・プライバシー侵害の懸念も広がって... 続きを読む