タグ Text to Speech
人気順 5 users 50 users 100 users 500 users 1000 usersOpenAIのGPT-4oを日本語OCRとして使ってみる
昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCR... 続きを読む
自動文字起こしや自動音声読み上げモデルをオープンソースで開発する「Coqui」メンバーは元Mozillaエンジニア
収録した音声をそのままテキストに自動で文字起こしするSpeech to Text(STT、音声テキスト変換)モデルや、入力したテキストを自動音声で読み上げるText to Speech(TTS、テキスト音声変換)モデルをオープンソースで開発する企業が「Coqui」です。 Coqui https://coqui.ai/ Coquiの創設者たちはもともとFirefoxやThunderbi... 続きを読む
月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita
何をした? Youtube上に公開されている動画の音声から、ディープラーニング技術を用いた音声合成ツールを構築しました。 今回対象にしたのは、バーチャルユーチューバー・にじさんじの委員長こと 月ノ美兎 さん(Youtubeチャンネル) です。 ※選出理由は、単純に私がYoutube上で一番推している方だからです。 成果 動画... 続きを読む
コエステーション あなたのコエがしゃべり出す。
あなたのコエがしゃべり出す。コエステーションは、人間の声を人工的につくれる音声合成技術を使ったサービスです。文字から音声のコミュニケーションへ。デジタルだけどアナログなコミュニケーションを。あなたの声をデータ化することで、音声による新たな時代が始まります。あなたのコエが しゃべり出す。 コエステーションは、 人間の声を人工的につくれる音声合成技術を使ったサービスです。 Text to speech... 続きを読む
Amazon EchoがKindle本の読み上げに対応。「アレクサ、本を読んで」 - AV Watch
ニュース Amazon EchoがKindle本の読み上げに対応。「アレクサ、本を読んで」 臼田勤哉 2018年2月22日 09:58 Amazon.co.jpは、スマートスピーカー「Amazon Echo」シリーズの読み上げ機能(Text to Speech:TTS)に、電子書籍のKindle本を読み上げる機能を追加した。Kindleストアで購入した電子書籍や、Kindle Unlimited... 続きを読む
認識系API活用入門(3):テキスト→音声変換の「Text To Speech API」の使い方と、2017年3月現在のWatsonとの違い (1/3) - @IT
認識系API活用入門(3): テキスト→音声変換の「Text To Speech API」の使い方と、2017年3月現在のWatsonとの違い (1/3) コグニティブサービスのAPIを用いて、「現在のコグニティブサービスでどのようなことができるのか」「どのようにして利用できるのか」「どの程度の精度なのか」を検証していく連載。今回は、Text To Speech APIの概要と使い方を解説し、他の... 続きを読む
iOSで使える日本語OKな音声読み上げエンジン8種(TTS,音声合成) - Qiita [キータ]
iOS7 から AVSpeechSynthesizer クラスが追加 され、音声合成(読み上げ/Text to Speech)が手軽に使えるようになりました。 既に 日本語を含む36種の言語に対応したvoice が用意されていて、音質もなかなかです。ひらがなも漢字も読んでくれるので、テキストをまるっと渡せば読んでくれます。 が、ひとつ物足りなかったのが、 読み上げのチューニングができない こと。 ... 続きを読む