タグ 拡散モデル
人気順 10 users 50 users 100 users 500 users 1000 usersStable Diffusionなどの画像生成AIに用いられる拡散モデルは「進化的アルゴリズム」だという主張
Stable DiffusionやDALL-E 3などの画像生成AIでは、拡散モデルと呼ばれる生成モデルが使用されています。新たにアメリカのハーバード大学やタフツ大学、オーストリアのウィーン工科大学などの研究チームが、「拡散モデルは本質的に進化的アルゴリズムだ」と主張する論文を発表し、話題を呼んでいます。 [2410.02543] Dif... 続きを読む
拡散モデルを用いた2Dバーチャル試着技術について - BASEプロダクトチームブログ
はじめに こんにちは。BASEのデータ分析チーム(Data Strategy Team)で不正対策を行ったり、機械学習モデルを触ったりしている竹内です。 先日チーム内の論文読み会でニューラルネットを用いた画像合成によるバーチャル試着技術というトピックに触れる機会があったので、その最近のトレンドについて改めてブログという... 続きを読む
拡散モデルと最適輸送 - ジョイジョイジョイ
『最適輸送の理論とアルゴリズム』が重版して第 5 刷となりました。皆さまありがとうございます! 漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。 本稿では、最近話題... 続きを読む
拡散モデルとは?Stable Diffusionなど「画像生成AIの学習モデル」をわかりやすく解説
画像生成AIの存在はすでに当たり前のものになりつつあります。広告やメディアに掲載されているイラストや写真のほか、私たちが普段使っている検索エンジンやブラウザにも搭載されるようになり、気軽に新しい画像を作れるようになりました。このような画像生成AIの急速な普及の背景にあるのが、画像生成AIの学習モデルに... 続きを読む
拡散モデルを使用して白黒画像をカラー化する「Color Diffusion」
白黒画像をカラー化する「Color Diffusion」のプロジェクトがGitHubにて公開されています。 ErwannMillon/Color-diffusion: A diffusion model to colorize black and white images https://github.com/ErwannMillon/Color-diffusion Color Diffusion: Colorizing Black and White Images with Diffusion Models | by Er... 続きを読む
拡散モデルで将棋の方策を学習する - TadaoYamaokaの開発日記
拡散モデルで、将棋の方策を学習できないか試してみた。 拡散モデル 拡散モデルは、高品質で多様なサンプルを生成できる生成モデルである。 昨年8月にStable Diffusionが公開されたことで注目を集めている。 拡散モデルは、確率微分方程式によって表される確率分布を近似するモデルで、モード崩壊を起こさず多様な分布を... 続きを読む
Googleショッピングに生成AI(拡散モデル)採用バーチャル試着機能(まず米国で)
Googleは、ショッピング検索の生成AI採用のバーチャル試着機能を発表した。まずは米国で、H&Mなど一部のブランドの女性用衣服で利用できるようになった。「DALL・E2」などのベースになる「拡散モデル」で開発した。 米Googleは6月14日(現地時間)、生成AI採用のバーチャル試着機能「Virtual try-on」(VTO)をまずは米... 続きを読む
統計数理シンポジウム 生成モデル 岡野原
株式会社 Preferred Networks 岡野原 大輔 @hillbig 生成モデルは世界を どのように理解しているのか 「統計的機械学習」の中核としての 統計数理シンポジウム 2023/05/25 アジェンダ • 現在の代表的な生成モデル 大規模言語モデル/ 拡散モデル • 自己教師あり学習 / メタ学習 • 未解決問題 岩波書店 2023 一般向け 関連... 続きを読む
Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表
2023年4月18日にMicrosoft Research AsiaとMicrosoft Azureのカイ・シェン氏らの研究チームが拡散モデルを使用した小品質の音声合成システム(TTS)である「NaturalSpeech 2」を発表しました。NaturalSpeech 2では数秒の短い音声サンプルを利用する事で、人の声だけでなく歌声までも忠実にシミュレートすることが可能にな... 続きを読む
画像生成AIの適正使用及びそれに伴う著作権制度の整備に関する提言(第1版)
背景 近年、人工知能(AI)は加速度的に進化を続け、ノイズから画像を生成する拡散モデルの開発と、それを基盤技術とする画像生成AIモデルであるStable Diffusionの登場により、画像生成AIの一般における使用が爆発的に広がった。一方、このような新しい技術の使用に関する適切なガイドラインや法制度は未成熟であり、様... 続きを読む
「自分の絵を画像生成AIから守る」――学習される前に絵に“ノイズ”を仕込みモデルに作風を模倣させない技術「Glaze」【研究紹介】
米シカゴ大学に所属する研究者らが発表した論文「GLAZE: Protecting Artists from Style Mimicry by Text-to-Image Models」は、テキストから画像を生成する拡散モデルにおいて、絵に仕込んだノイズで学習後のモデルを騙し、作風を模倣した絵を出力させない技術を提案した研究報告である。学習される前に自分で描いた絵... 続きを読む
拡散モデルのアナロジー力 - ニューロサイエンスとマーケティングの間 - Between Neuroscience and Marketing
1.4/50 Summilux ASPH, Leica M10P, RAW Midjourney、ChatGPTと立て続けに強烈なアプリケーションが出てきて、Diffusion model(拡散モデル)に基づくいわゆるGenerative AI(生成系AI)がそこらで話題だ。ガンガン画像を生み出すことで一気に注目を集めたMidjourneyはクリエーター寄りだけれど、11月末、対話型で答えを... 続きを読む
文章から“3Dモデル”をAIが生成 米Googleなどが「DreamFusion」を開発
米Google Researchと米UC Berkeleyの研究チームは、テキストから3Dオブジェクトを生成するシステムを提案した研究報告を発表した。「DreamFusion」と呼ぶこの手法は、テキストから2D画像を生成する拡散モデルを用いて、テキストから3次元への合成を実行する。 続きを読む
【画像生成AI】次は数枚の画像で「あなたのワンちゃん」をどこでも好きに登場させられる技術が誕生→二次創作の規制に関わるのでは?
mi141 @mi141 Googleから凄い論文が出てますね。拡散モデルを数枚でちょっとfinetuneするだけで、「あなたのワンちゃん」を生成画像内に自由に登場させられます! StableDiffusionでやる人めっちゃ出てきそう。 原理としては対象に新しいwordを割り当ててモデルをfinetuneするようです。 dreambooth.github.io pic.twit... 続きを読む
画像生成 AI の最前線!拡散モデル・画像生成モデルの最新研究を解説
テキストの記述にしたがって高品質な画像を生成する「画像生成 AI」が話題です。DALL·E, DALL·E 2, Parti, Imagen など、研究ベースで多くの手法が発表されており、Craiyon, DALL·E 2, Stable Diffusion, Midjourney など、実際に一般消費者が使える AI 画像生成サービスも広く普及してきました。 本ブログでは、昨年の... 続きを読む
Googleが「ガビガビの低解像度画像を高解像度画像に変換するAIモデル」の性能を改善、人間が判別できないレベルに - GIGAZINE
GoogleのAI研究チームであるGoogle AIが、低解像度画像にあえてノイズを追加して「純粋なノイズ」になるまで加工し、そこから高解像度画像を生成する「diffusion model(拡散モデル)」という手法を改善する新たなアプローチを発表しました。「画質の悪い低解像度画像から高解像度画像を生成する技術」には、古い写真の復... 続きを読む
排出された腸内発生ガスの拡散モデルと到達距離に関する考察 ≪ たろ父 blog ~ Flying Zebra blog
ヒトの腸内には体外より取り込まれた窒素、酸素などの気体に加え、微生物により生成されたメタン、水素等より成る腸内gasが存在する。これらの大部分は腸壁より吸収されるが、一部が肛門より排出され、一般には屁、おならなどと呼称される。 平均的な成人で通常0.5から1.5Lを5回から20回に渡って放出するとされ、20times/day程度の頻度は正常範囲内にあると推定される。したがって、この程度の放出回数を... 続きを読む