タグ 高解像度
新着順 10 users 50 users 100 users 500 users 1000 usersOCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAI『MPLUG-DOCOWL2』登場! - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです!今回は、PDF解析とドキュメントインテリジェンスの最先端技術 「MPLUG-DOCOWL2」 について、解説していきます。このモデルは、高解像度の... 続きを読む
AppleのAI研究チームがAIモデル「Depth Pro」をリリース、単一の画像を使用して標準GPUで225万ピクセルの3D深度マップを0.3秒で生成できる
機械が深度(奥行き)を認識する方法を大幅に進歩させるモデル「Depth Pro」をAppleのAI研究チームがリリースしました。他の方法では見落とされがちな「髪の毛」や「草木」といった細かいディテールを持った物体の深度も正確に認識可能で、高解像度の深度マップをわずか0.3秒で生成することが可能な点が特徴。自動運転車な... 続きを読む
Android・iPhone間で高画質画像を送ったり文章入力中マークを表示したりできる「RCS」がついにiOS 18で実装、今後はエンドツーエンド暗号化の導入に注力
2024年9月16日に正式リリースとなった「iOS 18」で、異なるOS間で多機能なメッセージのやりとりを可能にする規格「リッチコミュニケーションサービス(RCS)」が導入されました。これによりiPhoneの純正メッセージアプリを使ってAndroidスマートフォンに長文や高解像度の写真などを送信することが可能になりましたが、異な... 続きを読む
たった1枚の画像から高解像度の360度画像を生成する「Era3D」
1枚の画像を認識するだけで360度の視点からの姿も立体的に生成する「Era3D」は、従来のマルチビュー手法の問題点である「不正確」「非効率」「低解像度」という問題点を解消したものになっています。Era3Dの詳細について製作者がウェブページで解説しているほか、ブラウザ上で素早く簡単にマルチビューの生成を体験する... 続きを読む
自動で1080p・1分超の動画を生成できるAI「Veo」をGoogleが発表
入力してテキストに応じて高解像度の動画を出力する生成AI「Veo」を、Googleが「Google I/O 2024」で発表しました。 Google I/O 2024: Introducing Veo and Imagen 3 generative AI tools https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/ 発表があったのは基調講演の33分53秒あたりから。Google ... 続きを読む
グーグル、入力文で1分超の高解像度動画を生成するAI「Veo」発表…映画関係者らに提供
【読売新聞】 【ニューヨーク=小林泰裕】米IT大手グーグルは14日、動画生成AI(人工知能)「Veo(ベオ)」を発表した。1分超の長さの動画を高解像度で生成できる。14日から一部の映画関係者らに提供を開始する。 ベオでは入力した文章 続きを読む
世界初の高解像度な「月の地図」を中国科学院が公開、将来の月面探査ミッション必携の書
中国科学院(CAS)の地球化学研究所が、縮尺1:250万の月の地質地図帳を発表しました。この地図は、完全な高精度月地質地図帳としては世界初で、将来の月の研究や探査の基礎となる地図データとして役立てられるとのことです。 China Publishes World's First High-definition Lunar Geologic Atlas----Chinese Academy of ... 続きを読む
従来の技術だと2時間はかかるところわずか4分で高解像度の脳画像を撮影するMRI「イズールト」が開発される
11.7T(テスラ)の磁場強度を持ち、わずか4分で高解像度の脳画像を撮影することが可能なMRI「イズールト(Iseult)」が開発され、初めて人間の脳がスキャンされました。 English Portal - A world premiere: the living brain imaged with unrivaled clarity thanks to the world’s most powerful MRI machine https://www.c... 続きを読む
高解像度のAI画像を0.5秒で吐き出すオープンソースの画像生成モデル「PixArt-δ」が登場
Huawei Noah's Ark Labや大連理工大学、Hugging Faceらの研究者らが、テキストから画像を生成するフレームワークである「PixArt-δ(デルタ)」を発表しました。 [2401.05252] PIXART-δ: Fast and Controllable Image Generation with Latent Consistency Models https://arxiv.org/abs/2401.05252 Meet PIXART-δ: The Next... 続きを読む
ディズニーがその場で歩くことができる不思議な動く床「ホロタイル」を開発、VRコンテンツへの応用にも期待
VR(仮想現実)の技術が進化するにつれて、没入感の高いコンテンツを高解像度で楽しめるようになっていますが、「VR空間内の移動」を現実とリンクさせる方法が大きな課題となっています。ディズニーの研究組織であるDisney Researchが、世界初の多人数対応で全方向対応の拡張可能な動く床「ホロタイル(HoloTile)」を開発中... 続きを読む
たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される
写真から3DCGモデルを作成するにはさまざまな方向から被写体を何枚も撮影する必要があります。クウェート大学・Meta・メリーランド大学の研究者が、たった1枚の写真から高解像度のCGモデルを生成する「Human-SGD」を発表しました。 [2311.09221] Single-Image 3D Human Digitization with Shape-Guided Diffusion https:... 続きを読む
テキストや画像から動画を生成するAI「Stable Video Diffusion」をStability AIが公開へ
画像生成AI「Stable Diffusion」を開発するStability AIが、テキストや画像から高解像度の動画を生成できる潜在動画拡散モデル「Stable Video Diffusion」を公開しました。 Stable Video Diffusion のご紹介 — Stability AI Japan https://ja.stability.ai/blog/stable-video-diffusion Stable Video Diffusion: Scaling... 続きを読む
Google Chromeに「動画のワンシーンを高解像度で撮影する機能」が追加される
Google Chromeに、「動画のワンシーンを高解像度で撮影する機能」が追加されました。通常のスクリーンショット機能で動画のワンシーンを撮影すると、UIが写り込むなどしますが、Chromeの新機能を使えば動画のワンシーンを不要な要素なしにきれいに撮影可能です。 5 Google Chrome tips for college students https://blo... 続きを読む
娘育成シミュレーション『プリンセスメーカー2 リジェネレーション』発表、12月21日発売へ。グラフィックを高解像度かつオリジナル版に近いテイストにリニューアル - AUTOMATON
Bliss Brainは8月10日、育成シミュレーションゲーム『プリンセスメーカー2 リジェネレーション』を発表した。父となって娘を育てる育成シミュレーションゲーム『プリンセスメーカー2』の発売30周年を記念した作品だ。 娘育成シミュレーション『プリンセスメーカー2 リジェネレーション』発表、12月21日発売へ。グラフ... 続きを読む
MetaがVR/MRヘッドセットの新プロトタイプを発表。超高解像度×可変焦点、次世代のパススルー
日本時間8月1日、Metaは研究開発中のVRヘッドセットのプロトタイプを発表しました。人の目レベルの解像度(網膜解像度、Retinal Resolution)に加えて可変焦点機能を搭載した「ButterScotch Varifocal」と、高解像度で低遅延・歪みの少ないパススルーを実現する「Flamera」です。 (左が「Butterscotch Varifocal」、右... 続きを読む
日本初ドラレコ付き自転車ヘルメット「FOXWEAR V6」。高解像度でくっきり録画
iPhone/Androidの写真データをPCで確認・編集する方法 多彩な連携パターンまとめ
スマホのカメラはどんどん高性能化していくが、ディスプレイサイズは大きく変わらない。高解像度の写真をきれいに加工するような場合には、PC上で大きなディスプレイなどを使った方がいいだろう。今回はスマホとPCを接続し、データを遣り取りする方法を紹介する。 スマホカメラがどんどん高性能化しているように、スマホ... 続きを読む
NVIDIAがテキストから高解像度の映像を生成するAIモデル「VideoLDM」を発表
NVIDIAが、アメリカのコーネル大学と共同で開発したAIモデル「Video Latent Diffusion Model(VideoLDM)」を発表しました。VideoLDMは、テキストで入力した説明に基づき、最大2048×1280ピクセルの解像度、24fpsの動画を最長4.7秒生成することができます。 Align your Latents: High-Resolution Video Synthesis with Late... 続きを読む
高解像度の画像を生成できる拡張機能「Tiled Diffusion with Tiled VAE」の使い方【Stable Diffusion web UI】
を一通りまとめてみるという内容になっています。 Stable Diffusion web UIで画像を生成していると高解像度の画像を生成したくなる時があります。しかし使っているグラフィックボードによっては大きいサイズの画像を生成できない場合も多く、悩んでいらっしゃる方も多いのではないでしょうか。 しかしそんな悩みを解決し... 続きを読む
低画質のYouTubeやNetflixなどあらゆるウェブ動画を高解像度にアップスケールできるドライバーをNVIDIAがリリース
YouTube、Twitch、Netflixなどあらゆるウェブサービスにある古いぼやけた動画を、RTX 30シリーズおよびRTX 40シリーズのGPUでアップスケールして視聴できるようにするドライバー「RTX Video Super Resolution(VSR)」をNVIDIAがリリースしました。 Pixel Perfect: RTX Video Super Resolution Now Available | NVIDIA Blo... 続きを読む
ゴースト トリック | CAPCOM
逆転裁判シリーズの生みの親“巧 舟”が手掛けた ミステリーゲームの名作『ゴースト トリック』(2010年発売)が 待望の復活を遂げる。 “死”から始まる、命と記憶をめぐる傑作が、高解像度でより美しく、 新機能でさらに遊びやすくなって、2023年夏に新登場。 《死》から始まる、一夜のミステリー 今夜。街の片隅で、命と... 続きを読む
ブラウザのロゴを高解像度でダウンロードできる! Chrome, Safariの現在のロゴをはじめ、IE, Netscapeなど古いのも
Chrome, Edge, Firefox, Opera, Safariをはじめとする現在のロゴから古いバージョンのロゴをはじめ、デベロッパーツールやCanaryなどのロゴ、古いIE, Netscape, Mosaicな...記事の続きを読む 続きを読む
テキストから高解像度の3Dモデルを生成するAI「Magic3D」をNVIDIAが発表、テキストの微調整やスタイルの模倣も可能
大手半導体メーカーでありAI開発にも力を入れているNVIDIAが、入力したテキストを基に3Dモデルを生成するAI「Magic3D」を発表しました。Magic3Dが生成する3Dモデルは、Google Researchが発表した「DreamFusion」と比較して8倍の解像度を誇り、生成にかかる時間も半分ほどだとのことです。 [2211.10440] Magic3D: High-Re... 続きを読む
画像生成AI「Stable Diffusion」で「画像の続き」を次々に描画して高解像度の画像をサクッと生成できる「Hua」の使い方まとめ
文章を入力するだけで好みの画像を生成できるAI「Stable Diffusion」には、画像の続きを描画する「アウトペインティング」や、画像の一部を生成画像で置き換える「インペインティング」などの機能も搭載されています。そんなアウトペインティングやインペインティングを直感的に利用できるようにしたUI「Hua」が公開され... 続きを読む
「8K解像度に意味はあるか」を問う分析。人間の“目のスペック”に最適なのは - AUTOMATON
ビデオゲームが画面に描かれる際の解像度は、ハードウェアの進歩とともに向上の一途を辿ってきた。高精細な映像が求められ、近年では4K対応の機器も普及し、さらに高解像度な8Kの領域に踏み込む機器も登場してきている。「高い解像度には、どこまで恩恵があるのか」との疑問に応える分析を、海外メディアArs Technicaが... 続きを読む