タグ「声質変換」 - はてブログ

タグ声質変換

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 6 / 6件)

音声から顔画像を生成するwav2pixを実行してみる（アニメ顔生成もあるよ） - Qiita

2020/05/13 8 users Qiita GaN Paper text-to-image

はじめに Deep Learningの世界，とりわけGenerative Adversarial Networks(GAN)は近年，飛躍的に成長しており，Text-to-Imageや声質変換，音源分離など様々な分野で研究が進んでいると思います．今回のお話は，その中でも音声から顔画像を生成するwav2pixについて，ゆるく書いていきます． Paper: WAV2PIX: SPEECH-COND... 続きを読む

リアルタイム声質変換ライブラリ「Realtime Yukarin」を公開しました | Hiho's Blog

2019/09/27 315 users Hiho's Blog OSS オープンソースソフトウエア

はじめにリアルタイム声質変換アプリケーション、Realtime Yukarinを開発し、 OSS（オープンソースソフトウェア）として公開しました。ここで言う声質変換とは、「誰でも好きな声になれる」技術のことを指します。好きな声になれる声質変換は夢があって流行りそうなのですが、まだ全然普及していないと思います。それ... 続きを読む

美少女声への変換と合成 – Lento – Medium

2019/05/15 375 users TTS medium text-to-speech 合成変換

Introduction今までは主に可愛い女の子の画像(or 動画)を生成することに取り組んできましたが、画面上に映せるようになったらやはり可愛い声で話して欲しいものです。そこで今回は、別の人の声が与えられた時に美少女声へと変換するための声質変換と、テキストが与えられた時に美少女声を生成するText-to-Speech(TTS)を... 続きを読む

VQ-VAEの追試で得たWaveNetのノウハウをまとめてみた。 - Monthly Hacker's Blog

2018/02/23 19 users WaveNet 追試ノウ知見音質

2018 - 02 - 23 VQ-VAEの追試で得たWaveNetのノウハウをまとめてみた。できることはじめに「膨大な計算資源が必要」に対する回答前処理ネットワーク構造チャンネル数レイヤー数ロスと音質の関係 VQ-VAE特有の知見さいごにできることこの記事では、次のことができるようになります。 VQ-VAEを使った声質変換 WaveNetを使った音声合成を学習させる際のノウ... 続きを読む

ディープラーニングの力で結月ゆかりの声になってみた | Hiho's Blog

2018/02/13 350 users ディープラーニング余地 Hiho's Blog 目次精度

目次（背景）自分の声を結月ゆかりにしたい。前回はあまりクオリティが良くなかったので、手法を変えて質を上げたい。（手法）声質変換を、低音質変換と高音質化の二段階に分けてそれぞれ学習させた。画像分野で有名なモデルを使った。（結果）性能が飛躍的に向上し、かなり聞き取れるものになった。（考察）精度はまだ改善の余地があり、多対多声質変換にすることで精度が向上すると考えられる。今回の結果を論文化したい... 続きを読む

統計的声質変換 (2) ボイスチェンジャーを作ろう - 人工知能に関する断創録

2015/02/25 87 users ボイスチェンジャーソー枠組み本題人工知能

2015-02-25 統計的声質変換 (2) ボイスチェンジャーを作ろう音声信号処理音声合成統計的声質変換 (1) ロードマップ（2015/2/11）の続き。統計的声質変換の第二回ということでまずは統計的じゃない声質変換の枠組みで簡単なボイスチェンジャーを作ってみたい。いきなり本題とずれているけれどここをしっかり理解できていないと統計的な方はまったく歯が立たないため整理しておきたい。ソー... 続きを読む

(1 - 6 / 6件)