はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ TadaoYamaoka

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 2 / 2件)
 

PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記

2022/10/16 このエントリーをはてなブックマークに追加 215 users Instapaper Pocket Tweet Facebook Share Evernote Clip whisper OpenAI Pythonスクリプト 音声

PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイ... 続きを読む

Stable Diffusionを「いらすとや」で追加学習する - TadaoYamaokaの開発日記

2022/09/18 このエントリーをはてなブックマークに追加 213 users Instapaper Pocket Tweet Facebook Share Evernote Clip キャプション Clip ギャ 前回 データセット

前回、Stable Diffusionをdanbooruデータセットを使用して追加学習することを試した。 今回は、自分でデータセットを作成して追加学習することを試す。 データセットには、画像とキャプションが揃っている必要があり、キャプションがない場合はCLIPで疑似ラベルを生成するなどする必要がある。 今回は、画像に対するキャ... 続きを読む

 
(1 - 2 / 2件)