タグ 画像内
新着順 10 users 50 users 100 users 500 users 1000 usersマルチモーダル画像生成AI「OmniGen」登場、1つのモデルで「ポーズ指定生成」「画像内の物体置換」「被写体指定生成」などが可能
広く使われている画像生成AIのStable Diffusionは「ControlNetを組み合わせてポーズ抽出やポーズ指定生成を実行する」「IP-Adapterを組み合わせて類似画像を生成する」といったように拡張機能を用いて多様な作業を実行できます。「OmniGen」はControlNetなどの拡張機能を使わず単一のモデルだけで多様な生成作業を実行可... 続きを読む
Stable Diffusion 3発表 「画像内でのアルファベット表記」が可能に
画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第23回目は、AIアニメーションを次の段階に進ませる技術と大きな脚光を浴びた「Animate Anyone」... 続きを読む
iOSで文字認識(Text Recognition)
iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 iOS 9からあった「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeText... 続きを読む
Googleドキュメントを使って、2ステップで画像から文字起こしする方法【今日のワークハック】 | ライフハッカー・ジャパン
Googleドキュメントには、画像内に含まれている文字をテキストデータ化してくれる機能が搭載されています。その使い方をご紹介します。 続きを読む
アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー) | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第16回目はアップルが初登場。マルチモーダルのLLM「Ferret」を投入しました。合わせて5つの論文... 続きを読む
ついにPhotoshopへ驚異的AI機能「ジェネレーティブ塗りつぶし」追加へ、「画像の続きを生成する機能」「被写体を生成して画像内に追加」などができベータ版で利用OK
Adobeが画像編集アプリ「Photoshop」にジェネレーティブAI「Firefly」を統合し、AI機能「ジェネレーティブ塗りつぶし」を追加することを発表しました。「ジェネレーティブ塗りつぶし」では「画像の続きを生成」「画像の一部をAIで生成した画像に置き換え」といった操作を実現可能です。 アドビ | Adobe https://www.adob... 続きを読む
「Firefox 106」正式版リリース、画像内のテキスト抽出機能が追加
ウェブブラウザ「Firefox 106」の正式版が公開されました。記事作成時点ではmacOS限定ながら画像内のテキストを抽出する機能が追加されるなど、ユーザーが直接触れる機会が多くなりそうな数々の機能が導入されています。 Firefox 106.0, See All New Features, Updates and Fixes https://www.mozilla.org/en-US/firefox... 続きを読む
macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能に。
macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能になるそうです。詳細は以下から。 Appleは現地時間2 The post macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能に。... 続きを読む
『キルミーベイベー』2期製作決定の画像が出回り騒然とするも画像内のテレビ局ロゴでガセが確定し発端のツイートをした人が凍結、流れ弾で「TBSのロゴ」がトレンド入り - Togetter
AnimeLocal@アニメなどの放送情報・統計メイン @anime_local TBSはここ30年で3度ロゴを変更しています。「筆記体ロゴ」が1991年9月まで、1991年10月~1994年1月は「ミクロコスモスTBS」と呼ばれるゴチャゴチャしたロゴ、1994年1月~2020年3月は「ローマン体ロゴ」で2000年よりシンボルマーク「ジーン」が左側に付いてい... 続きを読む
画像内のオブジェクトを自然に置き換えるAIをMITとIBMが開発 - Engadget 日本版
MITとIBMの研究者チームは、AIを用いて写真などの画像の中に、自然な形で他のオブジェクトを埋め込んだり、消したりできるツールを作成しました。現在、GANpaint Studioとしてオンラインデモが公開されています。 AIの学習にはGAN(敵対的生成ネットワーク)が用いられています。これは、生成ネットワークと識別ネットワ... 続きを読む
“ 画像内に写っている人物 ” を、全自動で切り出してくれるウェブサービス「Remove.bg」 - GIGA!無料通信
今日は、“ 画像内に写っている人物 ” を全自動で切り出してくれるウェブサービス「Remove.bg」を紹介しようと思います。 Remove.bg 「Remove.bg」は、画像内に写っている人物を、全自動で切り出してくれるウェブサービスです。 画像の背景 / 前景(人物)を AI が自動で判別し、画像から背景部分をきれいに削除してくれ... 続きを読む
画像内の人物のみを自動で綺麗に切り取ってくれるWebアプリ・「remove.bg」 | かちびと.net
remove.bg remove.bgは画像内の人物のみを自動で綺麗に切り取ってくれるWebアプリです。画像をアップロードするか画像URLを指定するだけでその画像内の人物だけを切り取り、背景を透過してpngでダウンロードできる、というもの。何度か試してみましたが、なかなかの精度でした。ピントが合ってなかったり、後ろを向いて... 続きを読む
AI画像認識「Google Lens」がGoogle画像検索に統合。検索した画像内のオブジェクト認識し関連情報を紹介 - Engadget 日本版
Googleが、写真内に写るものを認識しその情報を検索するAI機能「Google Lens」をGoogleモバイルアプリの画像検索に統合しました。記事執筆時点では米国内のみの対応ですが、将来的にはワールドワイドで展開していく予定です。 続きを読む
NVIDIA、画像内の一部を削除しリアルに修復するDeep learningを用いた画像修復技術を発表 | Seamless
NVIDIA、画像内の一部を削除しリアルに修復するDeep learningを用いた画像修復技術を発表 2018.04.23 機械学習/人工知能 NVIDIAの研究チームは、画像内の一部を削除し修復するDeep learningを用いた画像修復法を 発表しました。 論文: Image Inpainting for Irregular Holes Using Partial Convolutions... 続きを読む
縦横比を無視したリサイズをしても違和感のない画像に仕上げることができる画像リサイズ用ライブラリ「Caire」 - GIGAZINE
画像ファイルの リサイズ はすべての ピクセル に対して均等に伸縮させるものです。このため、人物や建物が写っている画像に縦横比を無視したリサイズを行うと、被写体のバランスも崩れてしまい、違和感のある画像になってしまいます。画像リサイズ用ライブラリ「 Caire 」は画像内にある人物や建物などの比率を維持したままリサイズでき、違和感のない画像を作り出せます。 GitHub - esimov/cair... 続きを読む
縦横比を無視したリサイズをしても違和感のない画像に仕上げることができる画像リサイズ用ライブラリ「Caire」 - GIGAZINE
画像ファイルの リサイズ はすべての ピクセル に対して均等に伸縮させるものです。このため、人物や建物が写っている画像に縦横比を無視したリサイズを行うと、被写体のバランスも崩れてしまい、違和感のある画像になってしまいます。画像リサイズ用ライブラリ「 Caire 」は画像内にある人物や建物などの比率を維持したままリサイズでき、違和感のない画像を作り出せます。 GitHub - esimov/cair... 続きを読む
SVGのイメージマップでレスポンシブにも対応。Dreamewaverで効率的なイメージマップ作成 | Adobe Creative Station
SVGのイメージマップでレスポンシブにも対応。Dreamewaverで効率的なイメージマップ作成 BY 半田 惇志 2017.11.13 公開 画像内の特定の箇所をクリック可能にするイメージマップ。ユーザーとして、誰もが一度は使用したことがあるのではないでしょうか。 しかし、開発する側にとっては、イメージマップのコードは直感的に記述・理解できるものではないという難点があります。 また、昨今は、レス... 続きを読む
Googleが画像のウォーターマーク(透かし)を一括削除する技術を開発 防止策も発表し技術悪用を先回り - ねとらぼ
Googleがウォーターマーク(透かし)を一括削除するアルゴリズムと、そうした技術の悪用を防止する方法をまとめた論文を発表しました。 ウォーターマーク(透かし)を自動認識して削除してしまうアルゴリズム( 画像はYouTubeより ) 有料の画像サービスではサンプル画像をそのまま使われてしまわないよう、ウォーターマークを画像内に印字している場合がほとんどです。ところがGoogleによると、それだけで... 続きを読む
自分も開発したくなる!楽しすぎるJavaScriptライブラリ7選
JavaScriptを使ってユニークなサイトやアプリを制作したい! そんな時に活用できるのがJavaScriptライブラリです。 本記事では楽しくWeb開発が可能なライブラリを厳選して7つご紹介します! 顔の認識ができるようになる! 【 jQuery Face Detection 】 JavaScriptだけで、画像内に映る顔を検出できちゃいます! 顔の座標位置を検出し、データとして取得できます。... 続きを読む
TensorFlowを使ってシンプルなニューラルネットワークモデルを作ってみる - 株式会社ロカラボ
AI 人工知能 2017.07.14 荒井豊 TensorFlowを使ってシンプルなニューラルネットワークモデルを作ってみる Tensorflowを使ってシンプルなニューラルネットワークの構築について簡単な説明をしてみます。データにMNISTデータを使います。 まず、Tensorflowをインストールしましょう。 1 MNISTデータは、各画像のラベルがその画像内の実際の値を示す手書き数字の集合で... 続きを読む
Google、単一の画像内で複数のオブジェクトを検出するTensorFlow向け機械学習フレームワーク「TensorFlow Object Detection API」をGitHubにて公開 | Seamless
Google、単一の画像内で複数のオブジェクトを検出するTensorFlow向け機械学習フレームワーク「TensorFlow Object Detection API」をGitHubにて公開 2017.06.16 AI Googleは、単一の画像内で複数のオブジェクトを検出するTensorFlow上に構築されたオープンソースの機械学習フレームワーク「TensorFlow Object Detect... 続きを読む
Dev Basics/Keyword:Computer Vision API - @IT
Computer Vision APIを使用すると、マイクロソフトが提供する画像処理アルゴリズムを使って、APIに渡した画像ファイルの解析を行い、さまざまな情報をそこから得られる。 連載目次 Computer Vision API は、マイクロソフトのCognitive Servicesが提供するAPIの1つで、画像の分析、画像内のテキストの読み取り、有名人やランドマークの識別、サムネイル生成など... 続きを読む
画像内から検出した顔領域をImageMagickで固定サイズに切り出す - すぎゃーんメモ
TensorFlowでのDeep Learningによるアイドルの顔識別 のためのデータ作成 - すぎゃーんメモ の記事で書いているけれど、学習用データとして使うために収集した画像から「顔の領域」だけを切り出して「固定サイズ」(112x112など)に切り出す必要があって。 以前にも書いたけど、自撮り画像はけっこう顔が傾いた状態で写っているものが多いので、それも検出できるようにしたりしている。 He... 続きを読む
【やじうまWatch】ご飯を発見すると見境なくカレーをかける画像処理プログラムがシュールと評判 -INTERNET Watch
やじうまWatch ご飯を発見すると見境なくカレーをかける画像処理プログラムがシュールと評判 (2014/7/25 06:00) 食卓の画像からご飯を抽出し、手当たり次第にカレーをかける画像処理プログラムのデモがニコ動に投稿され、そのシュールさが人気を博している。具体的な解析手順としては、画像内から白~ライトグレーに相当する箇所を検出し、明るさのピーク点の分布情報などからお米であると判断した場合、... 続きを読む