タグ 声質変換
人気順 10 users 50 users 100 users 500 users 1000 users音声から顔画像を生成するwav2pixを実行してみる(アニメ顔生成もあるよ) - Qiita
はじめに Deep Learningの世界,とりわけGenerative Adversarial Networks(GAN)は近年,飛躍的に成長しており,Text-to-Imageや声質変換,音源分離など様々な分野で研究が進んでいると思います. 今回のお話は,その中でも音声から顔画像を生成するwav2pixについて,ゆるく書いていきます. Paper: WAV2PIX: SPEECH-COND... 続きを読む
リアルタイム声質変換ライブラリ「Realtime Yukarin」を公開しました | Hiho's Blog
はじめにリアルタイム声質変換アプリケーション、Realtime Yukarinを開発し、 OSS(オープンソースソフトウェア)として公開しました。 ここで言う声質変換とは、「誰でも好きな声になれる」技術のことを指します。 好きな声になれる声質変換は夢があって流行りそうなのですが、まだ全然普及していないと思います。 それ... 続きを読む
美少女声への変換と合成 – Lento – Medium
Introduction今までは主に可愛い女の子の画像(or 動画)を生成することに取り組んできましたが、画面上に映せるようになったらやはり可愛い声で話して欲しいものです。そこで今回は、別の人の声が与えられた時に美少女声へと変換するための声質変換と、テキストが与えられた時に美少女声を生成するText-to-Speech(TTS)を... 続きを読む
VQ-VAEの追試で得たWaveNetのノウハウをまとめてみた。 - Monthly Hacker's Blog
2018 - 02 - 23 VQ-VAEの追試で得たWaveNetのノウハウをまとめてみた。 できること はじめに 「膨大な計算資源が必要」に対する回答 前処理 ネットワーク構造 チャンネル数 レイヤー数 ロスと音質の関係 VQ-VAE特有の知見 さいごに できること この記事では、次のことができるようになります。 VQ-VAEを使った声質変換 WaveNetを使った音声合成を学習させる際のノウ... 続きを読む
ディープラーニングの力で結月ゆかりの声になってみた | Hiho's Blog
目次 (背景)自分の声を結月ゆかりにしたい。前回はあまりクオリティが良くなかったので、手法を変えて質を上げたい。 (手法)声質変換を、低音質変換と高音質化の二段階に分けてそれぞれ学習させた。画像分野で有名なモデルを使った。 (結果)性能が飛躍的に向上し、かなり聞き取れるものになった。 (考察)精度はまだ改善の余地があり、多対多声質変換にすることで精度が向上すると考えられる。今回の結果を論文化したい... 続きを読む
統計的声質変換 (2) ボイスチェンジャーを作ろう - 人工知能に関する断創録
2015-02-25 統計的声質変換 (2) ボイスチェンジャーを作ろう 音声信号処理 音声合成 統計的声質変換 (1) ロードマップ(2015/2/11)の続き。 統計的声質変換の第二回ということでまずは統計的じゃない声質変換の枠組みで簡単なボイスチェンジャーを作ってみたい。いきなり本題とずれているけれどここをしっかり理解できていないと統計的な方はまったく歯が立たないため整理しておきたい。 ソー... 続きを読む