はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 画像内

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 34件)

Stable Diffusion 3発表 「画像内でのアルファベット表記」が可能に

2024/02/23 このエントリーをはてなブックマークに追加 6 users Instapaper Pocket Tweet Facebook Share Evernote Clip Stable Diffusion アルファベット表記

続きを読む

画像内のキャラを思うがままに抜群の精度で動かせる「Animate Anyone」、話した声をすぐに翻訳するMeta「Seamless」など重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

2023/12/04 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip Meta seamless TechnoEdge シームレス

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第23回目は、AIアニメーションを次の段階に進ませる技術と大きな脚光を浴びた「Animate Anyone」... 続きを読む

iOSで文字認識(Text Recognition)

2023/11/11 このエントリーをはてなブックマークに追加 9 users Instapaper Pocket Tweet Facebook Share Evernote Clip iOS 待望 Core Image クラス 文字認識

iOS 13以降で、待望だった「文字認識」機能が使えるようになりました。カメラなどで撮影した画像内にある文字を読み取る [1] ことができます。 iOS 9からあった「文字検出」との違い 文字認識は、Visionフレームワークの一機能として追加されました。 一方、Core ImageのCIDetectorというクラスでは、CIDetectorTypeText... 続きを読む

Googleドキュメントを使って、2ステップで画像から文字起こしする方法【今日のワークハック】 | ライフハッカー・ジャパン

2023/10/18 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip ワークハック Googleドキュメント テキストデータ化

Googleドキュメントには、画像内に含まれている文字をテキストデータ化してくれる機能が搭載されています。その使い方をご紹介します。 続きを読む

アップルがマルチモーダル大規模言語モデル「Ferret」を公開。画像内の形や場所を言葉で説明(生成AIウィークリー) | テクノエッジ TechnoEdge

2023/10/16 このエントリーをはてなブックマークに追加 16 users Instapaper Pocket Tweet Facebook Share Evernote Clip Ferret TechnoEdge LLM マルチモーダル

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第16回目はアップルが初登場。マルチモーダルのLLM「Ferret」を投入しました。合わせて5つの論文... 続きを読む

ついにPhotoshopへ驚異的AI機能「ジェネレーティブ塗りつぶし」追加へ、「画像の続きを生成する機能」「被写体を生成して画像内に追加」などができベータ版で利用OK

2023/05/23 このエントリーをはてなブックマークに追加 217 users Instapaper Pocket Tweet Facebook Share Evernote Clip ジェネレーティブ firefly Photoshop 被写体

Adobeが画像編集アプリ「Photoshop」にジェネレーティブAI「Firefly」を統合し、AI機能「ジェネレーティブ塗りつぶし」を追加することを発表しました。「ジェネレーティブ塗りつぶし」では「画像の続きを生成」「画像の一部をAIで生成した画像に置き換え」といった操作を実現可能です。 アドビ | Adobe https://www.adob... 続きを読む

「Firefox 106」正式版リリース、画像内のテキスト抽出機能が追加

2022/10/19 このエントリーをはてなブックマークに追加 8 users Instapaper Pocket Tweet Facebook Share Evernote Clip 正式版リリース 追加 Firefox ウェブブラウザ 数々

ウェブブラウザ「Firefox 106」の正式版が公開されました。記事作成時点ではmacOS限定ながら画像内のテキストを抽出する機能が追加されるなど、ユーザーが直接触れる機会が多くなりそうな数々の機能が導入されています。 Firefox 106.0, See All New Features, Updates and Fixes https://www.mozilla.org/en-US/firefox... 続きを読む

macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能に。

2021/06/15 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip 抽出 Apple 12 Monterey テキスト ツイート

macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能になるそうです。詳細は以下から。  Appleは現地時間2 The post macOS 12 MontereyやiOS 15のSafari 15ではWebサイトやツイートに挿入されている画像内のテキストも「Live Text」で抽出可能に。... 続きを読む

『キルミーベイベー』2期製作決定の画像が出回り騒然とするも画像内のテレビ局ロゴでガセが確定し発端のツイートをした人が凍結、流れ弾で「TBSのロゴ」がトレンド入り - Togetter

2021/02/21 このエントリーをはてなブックマークに追加 70 users Instapaper Pocket Tweet Facebook Share Evernote Clip シーン 流れ弾 Togetter キルミーベイベー ガセ

AnimeLocal@アニメなどの放送情報・統計メイン @anime_local TBSはここ30年で3度ロゴを変更しています。「筆記体ロゴ」が1991年9月まで、1991年10月~1994年1月は「ミクロコスモスTBS」と呼ばれるゴチャゴチャしたロゴ、1994年1月~2020年3月は「ローマン体ロゴ」で2000年よりシンボルマーク「ジーン」が左側に付いてい... 続きを読む

画像内のオブジェクトを自然に置き換えるAIをMITとIBMが開発 - Engadget 日本版

2019/07/03 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip MIT IBM オブジェクト GaN Engadget 日本版

MITとIBMの研究者チームは、AIを用いて写真などの画像の中に、自然な形で他のオブジェクトを埋め込んだり、消したりできるツールを作成しました。現在、GANpaint Studioとしてオンラインデモが公開されています。 AIの学習にはGAN(敵対的生成ネットワーク)が用いられています。これは、生成ネットワークと識別ネットワ... 続きを読む

画像内に写っている人物 ” を、全自動で切り出してくれるウェブサービス「Remove.bg」 - GIGA!無料通信

2018/12/18 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip GIGA ウェブサービス remove.bg 背景 人物

今日は、“ 画像内に写っている人物 ” を全自動で切り出してくれるウェブサービス「Remove.bg」を紹介しようと思います。 Remove.bg 「Remove.bg」は、画像内に写っている人物を、全自動で切り出してくれるウェブサービスです。 画像の背景 / 前景(人物)を AI が自動で判別し、画像から背景部分をきれいに削除してくれ... 続きを読む

画像内の人物のみを自動で綺麗に切り取ってくれるWebアプリ・「remove.bg」 | かちびと.net

2018/12/18 このエントリーをはてなブックマークに追加 22 users Instapaper Pocket Tweet Facebook Share Evernote Clip remove.bg PNG ヒント net 人物

remove.bg remove.bgは画像内の人物のみを自動で綺麗に切り取ってくれるWebアプリです。画像をアップロードするか画像URLを指定するだけでその画像内の人物だけを切り取り、背景を透過してpngでダウンロードできる、というもの。何度か試してみましたが、なかなかの精度でした。ピントが合ってなかったり、後ろを向いて... 続きを読む

AI画像認識「Google Lens」がGoogle画像検索に統合。検索した画像内のオブジェクト認識し関連情報を紹介 - Engadget 日本版

2018/10/25 このエントリーをはてなブックマークに追加 31 users Instapaper Pocket Tweet Facebook Share Evernote Clip オブジェクト ワールドワイド Google 統合 AI機能

Googleが、写真内に写るものを認識しその情報を検索するAI機能「Google Lens」をGoogleモバイルアプリの画像検索に統合しました。記事執筆時点では米国内のみの対応ですが、将来的にはワールドワイドで展開していく予定です。 続きを読む

NVIDIA、画像内の一部を削除しリアルに修復するDeep learningを用いた画像修復技術を発表 | Seamless

2018/04/23 このエントリーをはてなブックマークに追加 191 users Instapaper Pocket Tweet Facebook Share Evernote Clip seamless 論文 人工知能 NVIDIA 機械学習

NVIDIA、画像内の一部を削除しリアルに修復するDeep learningを用いた画像修復技術を発表 2018.04.23 機械学習/人工知能 NVIDIAの研究チームは、画像内の一部を削除し修復するDeep learningを用いた画像修復法を 発表しました。 論文: Image Inpainting for Irregular Holes Using Partial Convolutions... 続きを読む

縦横比を無視したリサイズをしても違和感のない画像に仕上げることができる画像リサイズ用ライブラリ「Caire」 - GIGAZINE

2018/02/04 このエントリーをはてなブックマークに追加 128 users Instapaper Pocket Tweet Facebook Share Evernote Clip GIGAZINE GitHub リサイズ ピクセル 被写体

画像ファイルの リサイズ はすべての ピクセル に対して均等に伸縮させるものです。このため、人物や建物が写っている画像に縦横比を無視したリサイズを行うと、被写体のバランスも崩れてしまい、違和感のある画像になってしまいます。画像リサイズ用ライブラリ「 Caire 」は画像内にある人物や建物などの比率を維持したままリサイズでき、違和感のない画像を作り出せます。 GitHub - esimov/cair... 続きを読む

縦横比を無視したリサイズをしても違和感のない画像に仕上げることができる画像リサイズ用ライブラリ「Caire」 - GIGAZINE

2018/02/04 このエントリーをはてなブックマークに追加 128 users Instapaper Pocket Tweet Facebook Share Evernote Clip GIGAZINE GitHub リサイズ ピクセル 被写体

画像ファイルの リサイズ はすべての ピクセル に対して均等に伸縮させるものです。このため、人物や建物が写っている画像に縦横比を無視したリサイズを行うと、被写体のバランスも崩れてしまい、違和感のある画像になってしまいます。画像リサイズ用ライブラリ「 Caire 」は画像内にある人物や建物などの比率を維持したままリサイズでき、違和感のない画像を作り出せます。 GitHub - esimov/cair... 続きを読む

SVGのイメージマップでレスポンシブにも対応。Dreamewaverで効率的なイメージマップ作成 | Adobe Creative Station

2017/11/13 このエントリーをはてなブックマークに追加 24 users Instapaper Pocket Tweet Facebook Share Evernote Clip SVG レスポンシブ 半田 難点 昨今

SVGのイメージマップでレスポンシブにも対応。Dreamewaverで効率的なイメージマップ作成 BY 半田 惇志 2017.11.13 公開 画像内の特定の箇所をクリック可能にするイメージマップ。ユーザーとして、誰もが一度は使用したことがあるのではないでしょうか。 しかし、開発する側にとっては、イメージマップのコードは直感的に記述・理解できるものではないという難点があります。 また、昨今は、レス... 続きを読む

Googleが画像のウォーターマーク(透かし)を一括削除する技術を開発 防止策も発表し技術悪用を先回り - ねとらぼ

2017/08/22 このエントリーをはてなブックマークに追加 17 users Instapaper Pocket Tweet Facebook Share Evernote Clip ウォーターマーク YouTube アルゴリズム 悪用 論文

Googleがウォーターマーク(透かし)を一括削除するアルゴリズムと、そうした技術の悪用を防止する方法をまとめた論文を発表しました。 ウォーターマーク(透かし)を自動認識して削除してしまうアルゴリズム( 画像はYouTubeより ) 有料の画像サービスではサンプル画像をそのまま使われてしまわないよう、ウォーターマークを画像内に印字している場合がほとんどです。ところがGoogleによると、それだけで... 続きを読む

自分も開発したくなる!楽しすぎるJavaScriptライブラリ7選

2017/07/17 このエントリーをはてなブックマークに追加 242 users Instapaper Pocket Tweet Facebook Share Evernote Clip JavaScriptライブラリ ライブラリ 認識 自分 アプリ

JavaScriptを使ってユニークなサイトやアプリを制作したい! そんな時に活用できるのがJavaScriptライブラリです。 本記事では楽しくWeb開発が可能なライブラリを厳選して7つご紹介します! 顔の認識ができるようになる! 【 jQuery Face Detection 】 JavaScriptだけで、画像内に映る顔を検出できちゃいます! 顔の座標位置を検出し、データとして取得できます。... 続きを読む

TensorFlowを使ってシンプルなニューラルネットワークモデルを作ってみる - 株式会社ロカラボ

2017/07/13 このエントリーをはてなブックマークに追加 48 users Instapaper Pocket Tweet Facebook Share Evernote Clip ニューラルネットワークモデル ニューラルネットワーク 集合

AI 人工知能 2017.07.14 荒井豊 TensorFlowを使ってシンプルなニューラルネットワークモデルを作ってみる Tensorflowを使ってシンプルなニューラルネットワークの構築について簡単な説明をしてみます。データにMNISTデータを使います。 まず、Tensorflowをインストールしましょう。 1 MNISTデータは、各画像のラベルがその画像内の実際の値を示す手書き数字の集合で... 続きを読む

Google、単一の画像内で複数のオブジェクトを検出するTensorFlow向け機械学習フレームワーク「TensorFlow Object Detection API」をGitHubにて公開 | Seamless

2017/06/15 このエントリーをはてなブックマークに追加 58 users Instapaper Pocket Tweet Facebook Share Evernote Clip GitHub seamless オブジェクト API 複数

Google、単一の画像内で複数のオブジェクトを検出するTensorFlow向け機械学習フレームワーク「TensorFlow Object Detection API」をGitHubにて公開 2017.06.16 AI Googleは、単一の画像内で複数のオブジェクトを検出するTensorFlow上に構築されたオープンソースの機械学習フレームワーク「TensorFlow Object Detect... 続きを読む

Dev Basics/Keyword:Computer Vision API - @IT

2017/06/12 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip ランドマーク マイクロソフト API 識別 サムネイル生成

Computer Vision APIを使用すると、マイクロソフトが提供する画像処理アルゴリズムを使って、APIに渡した画像ファイルの解析を行い、さまざまな情報をそこから得られる。 連載目次 Computer Vision API は、マイクロソフトのCognitive Servicesが提供するAPIの1つで、画像の分析、画像内のテキストの読み取り、有名人やランドマークの識別、サムネイル生成など... 続きを読む

画像内から検出した顔領域をImageMagickで固定サイズに切り出す - すぎゃーんメモ

2016/04/29 このエントリーをはてなブックマークに追加 80 users Instapaper Pocket Tweet Facebook Share Evernote Clip TensorFlow ImageMagick すぎゃー 領域

TensorFlowでのDeep Learningによるアイドルの顔識別 のためのデータ作成 - すぎゃーんメモ の記事で書いているけれど、学習用データとして使うために収集した画像から「顔の領域」だけを切り出して「固定サイズ」(112x112など)に切り出す必要があって。 以前にも書いたけど、自撮り画像はけっこう顔が傾いた状態で写っているものが多いので、それも検出できるようにしたりしている。 He... 続きを読む

【やじうまWatch】ご飯を発見すると見境なくカレーをかける画像処理プログラムがシュールと評判 -INTERNET Watch

2014/07/24 このエントリーをはてなブックマークに追加 78 users Instapaper Pocket Tweet Facebook Share Evernote Clip やじうまWatch INTERNET Watch ニコ動

やじうまWatch ご飯を発見すると見境なくカレーをかける画像処理プログラムがシュールと評判 (2014/7/25 06:00) 食卓の画像からご飯を抽出し、手当たり次第にカレーをかける画像処理プログラムのデモがニコ動に投稿され、そのシュールさが人気を博している。具体的な解析手順としては、画像内から白~ライトグレーに相当する箇所を検出し、明るさのピーク点の分布情報などからお米であると判断した場合、... 続きを読む

画像内の文字や数式をコピペ可能なテキスト形式に変換可能な「Mosha」 - GIGAZINE

2014/04/21 このエントリーをはてなブックマークに追加 97 users Instapaper Pocket Tweet Facebook Share Evernote Clip GIGAZINE YouTube 数式 コピペ ムービー

コピー&ペーストが不可能な画像内のテキストや数式を、TeX・Word・MathML形式に変換して出力してくれる無料サービスが「Mosha」です。 Mosha https://www.moshaspot.com/ Moshaを使うとどんなことができるようになるのかは以下のムービーを見るとよく分かります。 Moshaで出来ること - YouTube 画像内のテキストや数式をテキスト形式に変換するために... 続きを読む

 
(1 - 25 / 34件)