タグ CloseBox
人気順 10 users 50 users 100 users 500 users 1000 users「史上最軽量Mac」M4 Mac miniセットを背負って外に持ち出し使ってみた結果(CloseBox) | テクノエッジ TechnoEdge
■最小構成のM4 Mac miniセットを背負う11時から開催された「生成AIとアート」のセッションを聴講した後、プレスルームに行きセットアップ。まずは最小構成を試します。 Anker製キーボード(200グラム)、FENIFOXマウス(45.6グラム)、GRAWOOW眼鏡型ディスプレイ(69グラム)、そしてM4 Mac mini(670グラム)。これらを... 続きを読む
M4 Mac miniは史上最軽量モバイルMacにできるのか(CloseBox) | テクノエッジ TechnoEdge
現在使っているM1 iMacとM2 MacBook Airにはストレージがキツキツなの以外は不満がなかったので、新しいMacを買うつもりはまったくありませんでした。それでも買ってしまったのです。Mac miniを。 では、なぜM4 Mac miniを買ったのか。どのモデルにしたのか、思考の変遷をたどりながら書いていきます。 ■M1 Mac miniが動... 続きを読む
HeyGenが進化し、20枚の写真から表現力あるAIアバターを作成。OpenAIの多言語ボイスクローン使用か(CloseBox) | テクノエッジ TechnoEdge
最近では「Fish Speech」という新しいオープンソースのボイスクローンTTSが登場しています。日本語もサポートしているので、使ってみました。イントネーションがかなり変ですが、使えることは使えます。 さて、そんな中、HeyGenのボイスクローンTTSを使う必要性があるかというと、2つポイントがあります。 まず、動画モ... 続きを読む
バーチャルシンガー作り放題・作曲しまくりの新時代到来。AI作曲サービスSunoで「ボーカリスト指名」が可能に(CloseBox) | テクノエッジ TechnoEdge
歌詞や音楽スタイルを入力すればAIがボーカルを含んだ楽曲を自動生成してくれるサービス「Suno」に待望の新機能が追加されました。「Personas」(ペルソナ)です。 この機能はProとPremierの有料ユーザーのみに開放されています。 ■従来のSunoでは歌手を指定できなかったこれはどういうものかというと、気に入ったボーカ... 続きを読む
Suno AIのiPhoneアプリ、日本のApp Storeに登場。「スノー - AI音楽」で写真やビデオをその場で音楽に(CloseBox) | テクノエッジ TechnoEdge
米国App Storeのみで提供されていた、AI作曲サービスSunoのiPhoneアプリが、日本でも提供開始されました。日本語名は「スノー - AI音楽」。 ブラウザでアクセスするデスクトップ版とはかなり違うUIで、iPhoneで撮影した写真を読み取り、歌にしてくれる機能もあります。 ビデオの場合はそれをそのままミュージックビデオ... 続きを読む
TSMCも頼る、コンピュータの守護スナック「乖乖」。AIを組み合わせると何が起こる?(CloseBox) | テクノエッジ TechnoEdge
台湾には「乖乖」(Kuai Kuai、クァイクァイ)というスナック菓子があります。世界のコンピュータ産業の中核をなしているTSMCをはじめとする台湾企業が、この乖乖を機械の守護神として扱っているのはご存知でしょうか? 乖乖は明治のカールや東鳩のキャラメルコーンのような、パフスナックの一種で、台湾ではセブン-イレ... 続きを読む
グラミー受賞の超大物プロデューサーがAI作曲サービスSuno活用を宣言。ティンバランドによるAIツール支持は反AIに動く音楽業界を揺らすか(CloseBox) | テクノエッジ TechnoEdge
主要音楽レーベルがAI作曲サービスのSunoとUdioを提訴したのが6月24日。それから4カ月が過ぎたタイミングで、Sunoがクリエイティブな方向からの反撃を仕掛けました。超大物プロデューサーが活用しているという事例です。 Sunoは、timbaland.suno.comに特設ページを作り、グラミー賞受賞歴のある超大物音楽プロデューサー... 続きを読む
わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) | テクノエッジ TechnoEdge
筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。 ■AIボイチェンの進化どこが画期的なポイントかというと、高い音質を維持しながら、ゼロショット、... 続きを読む
Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox) | テクノエッジ TechnoEdge
AIを使うと好みの楽曲を作ることができますが、細部を詰めようとすると難しい。今回はそんなお話です。 ■架空の1980年代J-POP動画が大人気「AIが奏でる80s Style Jpop / AI plays 80s」というYouTube動画が大きな話題を呼んでいます。冒頭、「悲しみはロンリネス」という80年代っぽい歌詞で始まる「めぐる」がいきなりの... 続きを読む
ChatGPTアドバンスト音声モード公開スタート。まだ来ないのでAIパーソナリティーのポッドキャストを作ってみた(CloseBox) | テクノエッジ TechnoEdge
これが手元にやってくれば、自然な対話ができ、ポッドキャスト番組の対話相手にもなりそうです。 ■AIによるポッドキャストを作ってみたその前準備として、AIが設定したパーソナリティーが、自分で考えた内容をポッドキャスト番組でしゃべる、というのをやってみました。 ChatGPTの4oに、「あなたは新しく誕生したAIキャ... 続きを読む
AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox) | テクノエッジ TechnoEdge
話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。 続きを読む
一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox) | テクノエッジ TechnoEdge
中国産の動画生成AI「Vidu」に、Reference to Videoという新機能が加わりました。AI動画生成でObject Consistency、つまり対象物の一貫性を保つことが可能になったのです。 動画生成AIサービス四天王のRunway Gen-3 Alpha、Luma Dream Machine、KLING、そしてViduはいずれもImage to Videoが可能です。 つまり、動画の始... 続きを読む
高さ1メートルの立体物を印刷できる3Dプリンタが我が家にやってきた(CloseBox) | テクノエッジ TechnoEdge
深圳の3DプリンタメーカーELEGOOが2023年12月にKickstarterで実施していたクラウドファンディングにプレッジ(出資)していたのですが、その現物が届きました。「ELEGOO OrangeStorm Giga」という製品です。 当時は送料込みで1640ドル。日本円で25万円ほどでしたが、現在の暫定価格は2500ドル。35万円を超えます。それで... 続きを読む
プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox) | テクノエッジ TechnoEdge
一見するとゲームセンターにある対戦型ゲーム筐体なのですが、ゲームコントローラーではなく、キーボードで対戦します。 制限時間は200秒。プレイヤーは画面に出題されたテーマに合った画像をプロンプトで生成します。画像生成AIはMidjourneyを使用。AIと対話しながら最終成果物の画像の出来栄えで勝負するします。AI同... 続きを読む
Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox) | テクノエッジ TechnoEdge
■「Suno AIに挑戦する」と発表したサービスが、実はSunoへのスクレイピングで成立している?8月15日にLoudMeが発表したプレスリリースでは、「LoudMe Announces Its Royalty-Free AI Music Generator & Sound Effects Generator to Challenge Suno AI」とうたっていました。 LoudMeはロイヤリティフリーの音楽生成および... 続きを読む
Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox) | テクノエッジ TechnoEdge
非常に高性能な画像生成AI「ImageFX(Imagen 3)」の登場です。 FLUX.1がMidjourneyと並ぶ最高峰の画像生成AIとして注目を浴び始めてから2週間もたたないうちに、新しいAI画像サービスが、なんとGoogleから登場しました。それがImageFXです。 Googleは画像生成AIの新バージョンであるImagen 3をリリースしたばかりですが... 続きを読む
動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox) | テクノエッジ TechnoEdge
AIリップシンクにまた大きな波が訪れました。 続きを読む
高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox) | テクノエッジ TechnoEdge
3カ月ほどベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版が正式発売されたので、購入しました。 ベータ版でもすごく便利に使っていたのですが、さらに改良されているというので、製品版としてのファーストインプレッションをお届けします。 ■ Vocoflex とはDreamtonicsはその品... 続きを読む
高性能動画生成AI「Vidu」の実力を試す。Character to Videoとは何か。KLINGやRunwayとはどこが違うのか(CloseBox) | テクノエッジ TechnoEdge
KLINGのサブスクリプションが開始されたばかりですが、同じ7月30日に早くもライバルが登場しました。これも中国の動画生成AIサービスで、「Vidu」というものです。といってもぽっと出ではなく、4月末にSoraクラスの動画生成AIとして発表。注目されていました。このViduが一般利用可能になったのです。 月額9.99ドルから... 続きを読む
Runway Gen-3でImage to Videoとリップシンク生成可能に。これは現時点最強のAI動画モデルなのか?(CloseBox) | テクノエッジ TechnoEdge
早速試してみました。 ■Runway Gen-3 AlphaのImage to Videoを試す動画生成のユーザーインタフェースは、Gen-3 AlphaとGen-2を画面左上から選択できるようになっています。Gen-3 Alphaを選ぶと、画像を選択する画面が表示されます。 画像を選択すると、Crop image to supported size (1280x768) と、画面をクロップする... 続きを読む
人物Image to Videoの進化がすごい。Luma、Runway、KLING、HeyGenの最新動画生成AIをVision Proの空間ミュージックビデオで見る(CloseBox) | テクノエッジ TechnoEdge
動画生成AIはわずか1カ月ちょっとで急激な進化を遂げました。この期間の進化を、人物Image to Videoに絞ってまとめてみます。 WWDC24でApple Vision Proの日本での発売とApple Intelligenceが発表された直後の6月中旬、Soraに匹敵するレベルの高精度で、写真から動画を生成するLuma AIのDream Machineが登場したのが始ま... 続きを読む
AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox) | テクノエッジ TechnoEdge
AI作曲サービスのトップを競い合っている、大手レコード会社に訴訟され仲間であるSunoとUdioが相次いで機能強化を発表しました。 まず、Sunoに、ステム分離機能が追加されました。 ステム分離とは、楽器のパートごとにトラックを分ける機能。UVR5などの単独アプリや、Logic ProなどのDAWに組み込まれている例もあります... 続きを読む
無限ループ動画が簡単にできる。Luma AIのDream Machineが進化してまた楽しみが増えた(CloseBox) | テクノエッジ TechnoEdge
ポストSoraというか、ビフォーSoraというか、新世代の動画生成AIも老舗であるRunway Gen-3登場以降、目新しいニュースがなかったのですが、Luma AIのDream Machineがちょっとした新機能を追加しました。 ループ機能です。 Dream Machineは2つの画像の中割りができたり、動画を5秒単位で伸ばしていけたりと、便利な機能を... 続きを読む
日本語は外国人話者にとって難しすぎるので、新しい簡易日本語「Japhalbet」をAIに作ってもらった(CloseBox) | テクノエッジ TechnoEdge
仮想的なシステムであり、実際の普及は想定されていない。 言語学習や異文化コミュニケーションのツールとしての可能性がある。 結論ローマ字運動とJaphalbetは、どちらも日本語の表記をラテン文字化する試みという点で共通していますが、その目的、アプローチ、そして想定される使用範囲に大きな違いがあります。ローマ... 続きを読む
万能系Artifacts登場。「Poe Previews」ならGeminiもGPT-4もClaudeもAI共同開発者にできる(CloseBox) | テクノエッジ TechnoEdge
このところプログラミングの楽しみを覚えて毎日Claude ArtifactsとChatGPT Artifactsで遊んでいる筆者ですが、またまた新しいツールに出会ってしまいました。 それは、PoeのPreviewsという新機能。 Poeは、ChatGPT、Claude、Gemini、Mistralといった複数の最新LLM(大規模言語モデル)を呼び出して対話ができる総合窓口... 続きを読む