タグ「Text to Speech」 - はてブログ

タグ Text to Speech

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 7 / 7件)

OpenAIのGPT-4oを日本語OCRとして使ってみる

2024/05/14 88 users OpenAI GPT-4o 生成AI 応答速度音声合成

昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成（Text To Speech）の表現力について非常に興味を持っています。私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCR... 続きを読む

自動文字起こしや自動音声読み上げモデルをオープンソースで開発する「Coqui」メンバーは元Mozillaエンジニア

2022/06/14 18 users TTS Firefox オープンソースメンバー自動文字

収録した音声をそのままテキストに自動で文字起こしするSpeech to Text(STT、音声テキスト変換)モデルや、入力したテキストを自動音声で読み上げるText to Speech(TTS、テキスト音声変換)モデルをオープンソースで開発する企業が「Coqui」です。 Coqui https://coqui.ai/ Coquiの創設者たちはもともとFirefoxやThunderbi... 続きを読む

月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita

2020/05/29 22 users YouTubeチャンネルバーチャルユーチューバー音声

何をした？ Youtube上に公開されている動画の音声から、ディープラーニング技術を用いた音声合成ツールを構築しました。今回対象にしたのは、バーチャルユーチューバー・にじさんじの委員長こと月ノ美兎さん（Youtubeチャンネル）　です。 ※選出理由は、単純に私がYoutube上で一番推している方だからです。成果動画... 続きを読む

コエステーション　あなたのコエがしゃべり出す。

2018/03/28 127 users こえコエステーション音声コミュニケーション音声合成技術

あなたのコエがしゃべり出す。コエステーションは、人間の声を人工的につくれる音声合成技術を使ったサービスです。文字から音声のコミュニケーションへ。デジタルだけどアナログなコミュニケーションを。あなたの声をデータ化することで、音声による新たな時代が始まります。あなたのコエがしゃべり出す。コエステーションは、人間の声を人工的につくれる音声合成技術を使ったサービスです。 Text to speech... 続きを読む

Amazon EchoがKindle本の読み上げに対応。「アレクサ、本を読んで」 - AV Watch

2018/02/22 31 users アレクサ TTS Kindle本 Kindleストア電子書籍

ニュース Amazon EchoがKindle本の読み上げに対応。「アレクサ、本を読んで」臼田勤哉 2018年2月22日 09:58 　Amazon.co.jpは、スマートスピーカー「Amazon Echo」シリーズの読み上げ機能(Text to Speech:TTS)に、電子書籍のKindle本を読み上げる機能を追加した。Kindleストアで購入した電子書籍や、Kindle Unlimited... 続きを読む

認識系API活用入門（3）：テキスト→音声変換の「Text To Speech API」の使い方と、2017年3月現在のWatsonとの違い (1/3) - ＠IT

2017/04/04 11 users WATSON API 精度音声変換連載

認識系API活用入門（3）：テキスト→音声変換の「Text To Speech API」の使い方と、2017年3月現在のWatsonとの違い (1/3) コグニティブサービスのAPIを用いて、「現在のコグニティブサービスでどのようなことができるのか」「どのようにして利用できるのか」「どの程度の精度なのか」を検証していく連載。今回は、Text To Speech APIの概要と使い方を解説し、他の... 続きを読む

iOSで使える日本語OKな音声読み上げエンジン8種（TTS,音声合成） - Qiita [キータ]

2013/12/02 97 users VOICE チューニング音質キータ漢字

iOS7 から AVSpeechSynthesizer クラスが追加され、音声合成（読み上げ／Text to Speech）が手軽に使えるようになりました。既に日本語を含む36種の言語に対応したvoice が用意されていて、音質もなかなかです。ひらがなも漢字も読んでくれるので、テキストをまるっと渡せば読んでくれます。が、ひとつ物足りなかったのが、読み上げのチューニングができないこと。 ... 続きを読む

(1 - 7 / 7件)