はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ Text to Speech

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 7 / 7件)
 

OpenAIのGPT-4oを日本語OCRとして使ってみる

2024/05/14 このエントリーをはてなブックマークに追加 88 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI GPT-4o 生成AI 応答速度 音声合成

昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCR... 続きを読む

自動文字起こしや自動音声読み上げモデルをオープンソースで開発する「Coqui」メンバーは元Mozillaエンジニア

2022/06/14 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip TTS Firefox オープンソース メンバー 自動文字

収録した音声をそのままテキストに自動で文字起こしするSpeech to Text(STT、音声テキスト変換)モデルや、入力したテキストを自動音声で読み上げるText to Speech(TTS、テキスト音声変換)モデルをオープンソースで開発する企業が「Coqui」です。 Coqui https://coqui.ai/ Coquiの創設者たちはもともとFirefoxやThunderbi... 続きを読む

月ノ美兎さんの音声合成ツール(Text To Speech) を作ってみた - Qiita

2020/05/29 このエントリーをはてなブックマークに追加 22 users Instapaper Pocket Tweet Facebook Share Evernote Clip YouTubeチャンネル バーチャルユーチューバー 音声

何をした? Youtube上に公開されている動画の音声から、ディープラーニング技術を用いた音声合成ツールを構築しました。 今回対象にしたのは、バーチャルユーチューバー・にじさんじの委員長こと 月ノ美兎 さん(Youtubeチャンネル) です。 ※選出理由は、単純に私がYoutube上で一番推している方だからです。 成果 動画... 続きを読む

コエステーション あなたのコエがしゃべり出す。

2018/03/28 このエントリーをはてなブックマークに追加 127 users Instapaper Pocket Tweet Facebook Share Evernote Clip こえ コエステーション 音声 コミュニケーション 音声合成技術

あなたのコエがしゃべり出す。コエステーションは、人間の声を人工的につくれる音声合成技術を使ったサービスです。文字から音声のコミュニケーションへ。デジタルだけどアナログなコミュニケーションを。あなたの声をデータ化することで、音声による新たな時代が始まります。あなたのコエが しゃべり出す。 コエステーションは、 人間の声を人工的につくれる音声合成技術を使ったサービスです。 Text to speech... 続きを読む

Amazon EchoがKindle本の読み上げに対応。「アレクサ、本を読んで」 - AV Watch

2018/02/22 このエントリーをはてなブックマークに追加 31 users Instapaper Pocket Tweet Facebook Share Evernote Clip アレクサ TTS Kindle本 Kindleストア 電子書籍

ニュース Amazon EchoがKindle本の読み上げに対応。「アレクサ、本を読んで」 臼田勤哉 2018年2月22日 09:58  Amazon.co.jpは、スマートスピーカー「Amazon Echo」シリーズの読み上げ機能(Text to Speech:TTS)に、電子書籍のKindle本を読み上げる機能を追加した。Kindleストアで購入した電子書籍や、Kindle Unlimited... 続きを読む

認識系API活用入門(3):テキスト→音声変換の「Text To Speech API」の使い方と、2017年3月現在のWatsonとの違い (1/3) - @IT

2017/04/04 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip WATSON API 精度 音声変換 連載

認識系API活用入門(3): テキスト→音声変換の「Text To Speech API」の使い方と、2017年3月現在のWatsonとの違い (1/3) コグニティブサービスのAPIを用いて、「現在のコグニティブサービスでどのようなことができるのか」「どのようにして利用できるのか」「どの程度の精度なのか」を検証していく連載。今回は、Text To Speech APIの概要と使い方を解説し、他の... 続きを読む

iOSで使える日本語OKな音声読み上げエンジン8種(TTS,音声合成) - Qiita [キータ]

2013/12/02 このエントリーをはてなブックマークに追加 97 users Instapaper Pocket Tweet Facebook Share Evernote Clip VOICE チューニング 音質 キータ 漢字

iOS7 から AVSpeechSynthesizer クラスが追加 され、音声合成(読み上げ/Text to Speech)が手軽に使えるようになりました。 既に 日本語を含む36種の言語に対応したvoice が用意されていて、音質もなかなかです。ひらがなも漢字も読んでくれるので、テキストをまるっと渡せば読んでくれます。 が、ひとつ物足りなかったのが、 読み上げのチューニングができない こと。 ... 続きを読む

 
(1 - 7 / 7件)