タグ CloseBox
新着順 10 users 50 users 100 users 500 users 1000 users「登場即ライバル動画生成AI死亡」ではなかった。使ってわかったSoraの品質と限界(CloseBox) | テクノエッジ TechnoEdge
1080p、20秒という、業界最高スペックの動画生成AIとあって、さすがのクォリティとの声がありますが、謳い文句とは異なる部分もあり、触ってみた感想を、実例を示しながら述べていきます。 なお、筆者は月額20ドル(約3万円)のChatGPT Proプランに加入したので、Relax modeと呼ばれるモードで、Sora動画を無制限に生成... 続きを読む
OpenAIのSora、1080p 最大20秒の動画生成AI最高水準でついに一般公開。3万円コースのChatGPT Proユーザーは無制限モードあり(CloseBox) | テクノエッジ TechnoEdge
発表から10カ月。OpenAIの動画生成AI「Sora」がついに一般ユーザーにも利用できます。 アドベントカレンダーのように、日めくりで新しい発表を行うOpenAIの「12 Days of OpenAI」。Day 1は(月額200ドル、約3万円)のChatGPT ProとGPT o1 pro modeが大きな話題となりました。 Day 2ではReinforcement Fine-Tuning(強化... 続きを読む
2024年最大の散財、新しい俺の相棒「M4 Max MacBook Pro」を紹介するぜ(CloseBox) | テクノエッジ TechnoEdge
猫も杓子も128GB M4 Max MacBook Proなのはどういうことでしょうか。 128GB M3 Max構成のMacBook Proを使っているのにサーマルスロットリングでポッドキャスト収録もままならない散財王ドリキンは気にならなかったのに、最新機種であるM4 Max MacBook Proを128GBメモリ構成にした清水亮さん、西川和久さんの話を聞いてい... 続きを読む
AIオリジナル曲のリップシンクミュージックビデオを爆速で作る方法(CloseBox) | テクノエッジ TechnoEdge
「AIオリジナル曲のリップシンクミュージックビデオを爆速で作る方法」について解説します。AIでなければ自分で弾き語りして自撮りするのが一番簡単なんですが、それは置いといて(笑) まず、完成形から。 歌手が一人で歌っているだけのシンプルなミュージックビデオです。作曲・演奏・歌唱はSuno v4ですが、映像はHeyG... 続きを読む
新世代AI読み上げソフトAivisSpeech、Style-Bert-VITS2とHeyGenアバターでレシピ動画を超簡単に料理してみた(CloseBox) | テクノエッジ TechnoEdge
AIによる音声合成は、Diff-SVC、RVC、Vocoflex、Seed-VCなどのボイチェン方面で追いかけてきましたが、最近では商用サービスがTTS(Text To Speech)によるボイスクローニングを充実させてきたことに注目しています。 その一方で、オープンソース、フリーソフト側でもずいぶん進化しているのを見落としていました。そこ... 続きを読む
超軽量折り畳みキーボード「nanoKEY Fold」がコルグから登場。フォルダブルキーボードマニアとしては買わずにいられない(CloseBox) | テクノエッジ TechnoEdge
コルグのMIDIキーボードはかなり所有しています。25鍵「nanoKEY」が1つ、37鍵「microKEY-37」が2つ、61鍵「microKEY-61」が1つ。いずれも本体に音源を持っていない、MIDIキーボードです。 筆者はGarageBandなどのiPadソフトシンセサイザーを外部MIDIキーボードで鳴らすスタイルでライブ演奏をしているので、持ち運びに便... 続きを読む
この画質をローカルマシンで? オープンソース動画生成AI「Pyramid Flow」は商用サービスにどのくらい迫っているのか確かめてみた(CloseBox) | テクノエッジ TechnoEdge
動画生成AIはRunwayを筆頭に、中国系サービスも参入し、激しい開発競争を繰り広げていますが、オープンソースソフトもかなりのレベルに到達しています。 続きを読む
「史上最軽量Mac」M4 Mac miniセットを背負って外に持ち出し使ってみた結果(CloseBox) | テクノエッジ TechnoEdge
■最小構成のM4 Mac miniセットを背負う11時から開催された「生成AIとアート」のセッションを聴講した後、プレスルームに行きセットアップ。まずは最小構成を試します。 Anker製キーボード(200グラム)、FENIFOXマウス(45.6グラム)、GRAWOOW眼鏡型ディスプレイ(69グラム)、そしてM4 Mac mini(670グラム)。これらを... 続きを読む
M4 Mac miniは史上最軽量モバイルMacにできるのか(CloseBox) | テクノエッジ TechnoEdge
現在使っているM1 iMacとM2 MacBook Airにはストレージがキツキツなの以外は不満がなかったので、新しいMacを買うつもりはまったくありませんでした。それでも買ってしまったのです。Mac miniを。 では、なぜM4 Mac miniを買ったのか。どのモデルにしたのか、思考の変遷をたどりながら書いていきます。 ■M1 Mac miniが動... 続きを読む
HeyGenが進化し、20枚の写真から表現力あるAIアバターを作成。OpenAIの多言語ボイスクローン使用か(CloseBox) | テクノエッジ TechnoEdge
最近では「Fish Speech」という新しいオープンソースのボイスクローンTTSが登場しています。日本語もサポートしているので、使ってみました。イントネーションがかなり変ですが、使えることは使えます。 さて、そんな中、HeyGenのボイスクローンTTSを使う必要性があるかというと、2つポイントがあります。 まず、動画モ... 続きを読む
バーチャルシンガー作り放題・作曲しまくりの新時代到来。AI作曲サービスSunoで「ボーカリスト指名」が可能に(CloseBox) | テクノエッジ TechnoEdge
歌詞や音楽スタイルを入力すればAIがボーカルを含んだ楽曲を自動生成してくれるサービス「Suno」に待望の新機能が追加されました。「Personas」(ペルソナ)です。 この機能はProとPremierの有料ユーザーのみに開放されています。 ■従来のSunoでは歌手を指定できなかったこれはどういうものかというと、気に入ったボーカ... 続きを読む
Suno AIのiPhoneアプリ、日本のApp Storeに登場。「スノー - AI音楽」で写真やビデオをその場で音楽に(CloseBox) | テクノエッジ TechnoEdge
米国App Storeのみで提供されていた、AI作曲サービスSunoのiPhoneアプリが、日本でも提供開始されました。日本語名は「スノー - AI音楽」。 ブラウザでアクセスするデスクトップ版とはかなり違うUIで、iPhoneで撮影した写真を読み取り、歌にしてくれる機能もあります。 ビデオの場合はそれをそのままミュージックビデオ... 続きを読む
TSMCも頼る、コンピュータの守護スナック「乖乖」。AIを組み合わせると何が起こる?(CloseBox) | テクノエッジ TechnoEdge
台湾には「乖乖」(Kuai Kuai、クァイクァイ)というスナック菓子があります。世界のコンピュータ産業の中核をなしているTSMCをはじめとする台湾企業が、この乖乖を機械の守護神として扱っているのはご存知でしょうか? 乖乖は明治のカールや東鳩のキャラメルコーンのような、パフスナックの一種で、台湾ではセブン-イレ... 続きを読む
グラミー受賞の超大物プロデューサーがAI作曲サービスSuno活用を宣言。ティンバランドによるAIツール支持は反AIに動く音楽業界を揺らすか(CloseBox) | テクノエッジ TechnoEdge
主要音楽レーベルがAI作曲サービスのSunoとUdioを提訴したのが6月24日。それから4カ月が過ぎたタイミングで、Sunoがクリエイティブな方向からの反撃を仕掛けました。超大物プロデューサーが活用しているという事例です。 Sunoは、timbaland.suno.comに特設ページを作り、グラミー賞受賞歴のある超大物音楽プロデューサー... 続きを読む
わずか10秒の元音声でもリアルな「なりきりボイチェン」できる無料ソフト『Seed-VC』は過去最高レベルの再現度か(CloseBox) | テクノエッジ TechnoEdge
筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。 ■AIボイチェンの進化どこが画期的なポイントかというと、高い音質を維持しながら、ゼロショット、... 続きを読む
Suno AIで80年代J-POP偽コンピを作ってみたけど、歌詞間違いのボツがつらい……いや、簡単に部分修正できるようになってるじゃないか(CloseBox) | テクノエッジ TechnoEdge
AIを使うと好みの楽曲を作ることができますが、細部を詰めようとすると難しい。今回はそんなお話です。 ■架空の1980年代J-POP動画が大人気「AIが奏でる80s Style Jpop / AI plays 80s」というYouTube動画が大きな話題を呼んでいます。冒頭、「悲しみはロンリネス」という80年代っぽい歌詞で始まる「めぐる」がいきなりの... 続きを読む
ChatGPTアドバンスト音声モード公開スタート。まだ来ないのでAIパーソナリティーのポッドキャストを作ってみた(CloseBox) | テクノエッジ TechnoEdge
これが手元にやってくれば、自然な対話ができ、ポッドキャスト番組の対話相手にもなりそうです。 ■AIによるポッドキャストを作ってみたその前準備として、AIが設定したパーソナリティーが、自分で考えた内容をポッドキャスト番組でしゃべる、というのをやってみました。 ChatGPTの4oに、「あなたは新しく誕生したAIキャ... 続きを読む
AI動画生成もローカルマシンで動かす時代に。Image to Video含め生成し放題のCogVideoを一発インストールできるPinokioという選択肢(CloseBox) | テクノエッジ TechnoEdge
話題のオープンソース動画生成AI「CogVideo」をローカルマシンに超簡単インストールできたのです。 続きを読む
一貫したキャラクターAI動画生成が超簡単に。LoRAいらず、参照画像1枚だけでいいなんて(CloseBox) | テクノエッジ TechnoEdge
中国産の動画生成AI「Vidu」に、Reference to Videoという新機能が加わりました。AI動画生成でObject Consistency、つまり対象物の一貫性を保つことが可能になったのです。 動画生成AIサービス四天王のRunway Gen-3 Alpha、Luma Dream Machine、KLING、そしてViduはいずれもImage to Videoが可能です。 つまり、動画の始... 続きを読む
高さ1メートルの立体物を印刷できる3Dプリンタが我が家にやってきた(CloseBox) | テクノエッジ TechnoEdge
深圳の3DプリンタメーカーELEGOOが2023年12月にKickstarterで実施していたクラウドファンディングにプレッジ(出資)していたのですが、その現物が届きました。「ELEGOO OrangeStorm Giga」という製品です。 当時は送料込みで1640ドル。日本円で25万円ほどでしたが、現在の暫定価格は2500ドル。35万円を超えます。それで... 続きを読む
プロンプトで画像生成ストリートファイトするAIアーケードゲーム大会「VS AI街頭對戰」、台湾で世界大会決勝(CloseBox) | テクノエッジ TechnoEdge
一見するとゲームセンターにある対戦型ゲーム筐体なのですが、ゲームコントローラーではなく、キーボードで対戦します。 制限時間は200秒。プレイヤーは画面に出題されたテーマに合った画像をプロンプトで生成します。画像生成AIはMidjourneyを使用。AIと対話しながら最終成果物の画像の出来栄えで勝負するします。AI同... 続きを読む
Suno酷似のAI作曲サービス「LoudMe」、課金サービス開始したが実態はSunoへの違法アクセスか(CloseBox) | テクノエッジ TechnoEdge
■「Suno AIに挑戦する」と発表したサービスが、実はSunoへのスクレイピングで成立している?8月15日にLoudMeが発表したプレスリリースでは、「LoudMe Announces Its Royalty-Free AI Music Generator & Sound Effects Generator to Challenge Suno AI」とうたっていました。 LoudMeはロイヤリティフリーの音楽生成および... 続きを読む
Googleの新画像生成AI『ImageFX』が考える非実在日本アイドル史(1968~83)。超リアルだが全部偽物(CloseBox) | テクノエッジ TechnoEdge
非常に高性能な画像生成AI「ImageFX(Imagen 3)」の登場です。 FLUX.1がMidjourneyと並ぶ最高峰の画像生成AIとして注目を浴び始めてから2週間もたたないうちに、新しいAI画像サービスが、なんとGoogleから登場しました。それがImageFXです。 Googleは画像生成AIの新バージョンであるImagen 3をリリースしたばかりですが... 続きを読む
動画と音声ガッチャンコでなんでもAI口パク「sync.」。リップシンクはVideo to Videoの時代に突入した(CloseBox) | テクノエッジ TechnoEdge
AIリップシンクにまた大きな波が訪れました。 続きを読む
高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に(CloseBox) | テクノエッジ TechnoEdge
3カ月ほどベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版が正式発売されたので、購入しました。 ベータ版でもすごく便利に使っていたのですが、さらに改良されているというので、製品版としてのファーストインプレッションをお届けします。 ■ Vocoflex とはDreamtonicsはその品... 続きを読む