タグ 音声サンプル
人気順 5 users 50 users 100 users 500 users 1000 usersOpenAIがわずか15秒の音声からクローン音声を生成できるAIモデル「Voice Engine」をリリース
OpenAIがわずか15秒の音声サンプルから合成音声を作成できるAIモデル「Voice Engine」への限定的なアクセスを提供開始しました。Voice Engineは、合成音声を作成する際に使用した音声サンプルと同じ言語だけでなく、さまざまな言語で入力したテキストを音声読み上げすることができるというテキスト音声生成ツールです。 ... 続きを読む
OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る
米OpenAIは3月29日(現地時間)、人の声を再現できる生成AIモデル「Voice Engine」を発表した。テキスト入力と15秒分の音声サンプルで、元の話者によく似た自然な音声を生成できる。感情的なリアルな音声で、母国語以外の言語も話せる。 2022年から開発していたこのモデルは、既に同社の「Text-to-Speech API」や「ChatG... 続きを読む
スマホの充電器から“人間のような音声”を発声、音声アシスタントにこっそり入力するサイバー攻撃
「SINGATTACK」と呼ぶ今回の攻撃システムを実現するには、変調した電流から音声アシスタントが反応する自然言語に変換しなければならない。そのため、変調した電流とスイッチング電源から発する音の関係をモデル化するための強化学習モデルを導入する。 このモデルでは、あらかじめ収集した被害者の音声サンプルを用いて... 続きを読む
AIでクローン音声を生成する最新ツールが4chan民により「エマ・ワトソンの声で『わが闘争』を読み上げさせる」など悪用されまくる事態に
ポーランドに拠点を置くAIスタートアップのElevenLabsは、音声サンプルから「声のクローン」を作成してさまざまな文章を読み上げさせるツールを開発しています。ElevenLabsが最新ツールのベータ版を公開したところ、海外掲示板・4chanのユーザーたちにより「有名人の声で人種差別発言や不謹慎なことを言わせる」といった... 続きを読む
Microsoftがたった3秒のサンプルから人の声を再現できる音声合成AI「VALL-E」を発表
2023年1月5日にMicrosoftが新しい音声合成AIモデル「VALL-E」を発表しました。VALL-Eはたった3秒間の音声サンプルで人の声を忠実にシミュレートできる他、一度学習したデータからは、その人の声色だけではなく感情のトーンや録音環境も再現した合成音声を作成することが可能になっています。 VALL-E https://valle-demo.... 続きを読む
マイクロソフト、自然なテキスト読み上げを実現するAI研究を発表。音声サンプルはわずか200 - Engadget 日本版
テキストから音声への変換機能は日進月歩で改良されていますが、自然な音声出力を生成するためには、今なお多くのトレーニング時間と音声サンプルが必要です。そうしたデータを集めるには多大な労力とコストがかかり、ハイテク大手以外の研究者が参入する上で壁となっています。 マイクロソフトの研究者チームは、そうし... 続きを読む