タグ 音声ファイル
人気順 10 users 50 users 100 users 500 users 1000 users開発元も「使うな」 OpenAIの文字起こしツールがヤバイ?:804th Lap
「ChatGPT」で知られるOpenAIの文字起こしツールが物議を醸している。開発元のOpenAIでさえ「使うな」と警告するほどだ。一体、どんな問題を抱えているのか。 議事録の作成やセミナー講演内容のテキスト化などに役立つ「AI文字起こしツール」。動画や音声ファイルから音声を認識し、生成AIを活用してテキスト化する。業... 続きを読む
Googleの自分専用AI作成サービス「NotebookLM」で学習データにYouTubeの動画を指定可能に
GoogleのカスタムAI作成サービス「NotebookLM」に、YouTubeのURLや音声ファイルを追加できる機能が搭載されました。これにより、YouTubeや音声ファイルの情報に基づいて質問に答えたり要約したりできるAIを作成できるようになります。 NotebookLM adds audio and YouTube support, plus easier sharing of Audio Overvie... 続きを読む
AWS Step Functionsで、音声ファイルがS3バケットに保存される度にAmazon Transcribeで文字起こしし、内容をメール送信してみた | DevelopersIO
はじめに AWS Step Functionsを利用し、音声ファイルがS3バケットに保存されるたびにAmazon Transcribeで文字起こしを行い、文字起こし内容をメール送信する方法を紹介します。 今回構築する構成は以下の通りです。 処理の流れは以下の通りです。 音声ファイル(WAV)をS3バケットにアップロードする アップロードをトリ... 続きを読む
30年前のノートPCからファイルをコピーする方法
1994年製のAppleのノートPC「PowerBook Duo 280c」に保存された音声ファイルを、現代のPCにコピーする方法をソフトウェアエンジニアのルークさんが解説しています。 How to Copy a File From a 30-year-old Laptop - Unterminated https://www.unterminated.com/random-fun/how-to-copy-a-file-from-a-30-year-old-lapto... 続きを読む
無料&セルフホスト可能なブラウザ上で操作できる文字起こしツール「Transcription Stream」レビュー
「Transcription Stream」は音声ファイルをアップロードするだけで自動で文字起こしと要約を作成してくれる上、シークバーと文字起こし結果が連動するため人間による聞き取りが必要な場所を一目で見つけられる便利なツールです。無料で使用でき、セルフホスト可能なオープンソース版として「Transcription Stream Commun... 続きを読む
YouTubeでの配信中に流れた「洗濯機のチャイム音」が著作権侵害とみなされて収益化を停止される事態に
YouTubeには、著作権所有者から送信された音声ファイルと映像ファイルのデータベースをもとに、著作権で保護されたコンテンツと一致するものを自動的に特定する「Content ID」という仕組みが導入されています。YouTuberのAlbino氏が、配信中に流れた洗濯機のチャイム音がContent IDによって著作権違反と見なされ、動画の... 続きを読む
「LINE Keep」終了へ 自分専用トーク「Keepメモ」は継続
LINEは、LINEアプリにトーク内容や動画などを保存できる「LINE Keep」を8月28日に終了すると発表した。「より良いサービスの提供に注力し、アプリ全体の最適化のため」としている。 LINE Keepは、トーク内容や動画、画像、音声ファイルなどを1GBまで、期間無制限で保存できる機能。2015年8月にスタートした。利用してい... 続きを読む
『スカイリム』にて、“AIによる生成音声”を含むポルノModの存在が問題視される。声優コミュニティから批判続出 - AUTOMATON
Mod制作者のRobbie氏は7月1日に、『The Elder Scrolls V: Skyrim』(以下、スカイリム)にてユーザーが制作するポルノModに関する注意喚起を投稿。同氏は一部のポルノModには、ゲームの音声ファイルを無断で利用したAIによる生成音声が含まれている点に強い懸念を表明している。この投稿は海外の声優コミュニティからも... 続きを読む
PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイ... 続きを読む
Spotifyが無料で音声ファイルからMIDIへ変換できるAI搭載ツール「Basic Pitch」を公開
Spotifyが無料で使えるオープンソースのAI搭載ツール「Basic Pitch」を公開しています。 Basic Pitchは、SpotifyのAudio Intelligence LabとSpotify傘下のSoundtrapが共同で開発したオーディオをMIDIに変換してくれるツール。ユーザーが楽器や声といったオーディオファイルをBasic Pitchのサイト上にアップロードすると... 続きを読む
1時間300円の文字起こしアプリが無料に 音声・動画ファイルをテキスト化 ソースネクストが期間限定で
ソースネクストが、動画や音声ファイルの文字起こしアプリ「AutoMemo 文字起こしサービス」を期間限定で無料提供する。通常は1時間300円の従量課金制だが、同日にサービス名を変更したことから、「ユーザーが利用を始める第一歩にする」として無料化する。 ソースネクストは6月2日、動画や音声ファイルの文字起こしアプ... 続きを読む
Googleが発音のチェックを行う音声認識サービスを開始 - GIGAZINE
By Prostock-studio Googleが単語の発音チェックを行う新しいサービスを2019年11月14日(木)から開始しました。音声ファイルをAIが認識して文字起こしをしたり、声を出さずに音声入力をしたりと音声認識の技術は日々進化しています。Googleによる発音チェック機能は機械学習を用いた技術となっており、英語学習を格段に効... 続きを読む
無料でYouTubeから動画と音声ファイルをダウンロードできるFirefox向け拡張機能「YouTube Video and Audio Downloader」 - GIGAZINE
動画や音声データをダウンロードしてオフラインでも使用できるようにしたり、フォーマットや解像度を変更してダウンロードしたりすることが可能な、Firefox向けの拡張機能が「YouTube Video and Audio Downloader」です。 YouTube Video and Audio Downloader (WebEx) ? Firefox (ja) 向け拡張機能を入手 https://addons... 続きを読む
LINEでボイスメッセージを送信し、その音声ファイルをGoogle Homeに喋らせる - Qiita
背景 会社を出たときに妻に「今から帰る」LINEをするが、料理中で気づかないことが多いので、 LINEでメッセージを送ってGoogle Homeに読み上げてもらっていた。 ところが読み上げられるメッセージは、テキストから生成した音声でいかにも機械が喋ってる感じがして、なんとなく温かみがない。 そこで、LINEにはボイスメッ... 続きを読む
MySpace、「12年分のユーザ-コンテンツが事故で消失した」と告知 - ITmedia NEWS
MySpaceが、「サーバ移行の過程で3年以上前にアップロードされたコンテンツができなくなった」とサイト上で告知した。 米MySpaceは3月18日(現地時間)、サービスのトップページに「サーバ移行の過程で、3年以上前にアップロードされた写真、動画、音声ファイルがMySpaceで利用できない可能性がある」というバナーを表示... 続きを読む
NHK メール誤送信問題 停職や出勤停止などの処分 | NHKニュース
NHK札幌放送局のディレクターがオウム真理教から名前を変えたアレフに対し、住民のインタビューの音声ファイルをダウンロードできるメールを誤って送信した問題で、NHKはこのディレクターを停職にするとともに上司4人を出勤停止などの懲戒処分にしました。 NHKがファイル転送システムの運営会社の協力を得て調... 続きを読む
NHK、アレフに取材音声誤送信 札幌、住民インタビューのURL | 共同通信 - This kiji is
NHK札幌放送局は2日、オウム真理教の後継団体主流派「アレフ」に関する取材で、住民インタビューの音声ファイルをダウンロードできるURLを、アレフに誤送信していたと発表した。インタビューには、身元が特定される可能性がある内容も含まれていた。アレフ信者がダウンロードしたかどうかは不明という。 札幌市には、国... 続きを読む
取材音声アレフに誤送信=NHK、住民のインタビュー-札幌:時事ドットコム
取材音声アレフに誤送信=NHK、住民のインタビュー-札幌 NHK札幌放送局は2日、札幌市にあるオウム真理教の後継団体「Aleph(アレフ)」の施設周辺で行った住民インタビューの音声ファイルをダウンロードできるURLを、アレフ本部の広報に誤送信したと発表した。アレフ側がファイルを開いたどうかは確認で... 続きを読む
住民の音声データ アレフに誤送信 NHK札幌放送局 | NHKニュース
オウム真理教から名前を変えた「アレフ」に関連する取材で、NHK札幌放送局が行った住民のインタビューの音声ファイルを取り込めるメールを、担当のディレクターが誤ってアレフ側に送信しました。NHKは関係者に謝罪するとともに情報の取り扱いを一層厳格にし、再発防止に努めていきます。 このメールには住民6人の... 続きを読む
取材した住民の音声データ、NHKが「アレフ」に誤送信:朝日新聞デジタル
NHK札幌放送局は2日、オウム真理教の後継団体「アレフ」に関する取材で、住民のインタビューの音声ファイルがダウンロードできるURLを、アレフ側に誤送信したと発表した。NHKは住民に謝罪し、記者会見で「あってはならないこと」と陳謝した。 NHKによると、同局のディレクターが1日午後5時前、住民6人分... 続きを読む
NHK、取材音声ファイルをアレフに誤送信 | 共同通信 - This kiji is
NHK札幌放送局は2日、オウム真理教の後継団体「アレフ」に関する取材で、住民インタビューの音声ファイルをダウンロードできるURLを、誤ってアレフ側に送信していたと発表した。 続きを読む
会議音声を自動でテキスト化 話者も識別 日立が新サービス - ITmedia NEWS
会議を録音した音声ファイルから自動で書き起こすクラウドサービスを日立製作所がスタート。音源の方向から話者を識別し、話者ごとに会話をテキスト化する。 日立製作所は10月16日、会議などの音声ファイルから自動でテキストを書き起こすクラウドサービス「音声書き起こし支援サービス」の販売を始めた。音源の方向から... 続きを読む
Microsoft 365でOneDrive内の映像/音声ファイルの自動テキスト起こしが可能に - PC Watch
Googleの音声認識エンジンを使って音声ファイルから文字起こししてみた - GIGAZINE
Googleがクラウドサービスとして提供している「Google Cloud Platform」の中に、「Cloud Speech-to-Text」というサービスがあります。このサービスは音声ファイルをAIが認識して文字にしてくれるというものなのですが、一体AIはどれくらい正確に文字起こししてくれるものなのか実際に使って試してみました。 Cloud Speec... 続きを読む
21世紀の文字起こし(3) 〜 Cloud Speech-to-Text 編 〜 - the code to rock
ここまでのあらすじ 免責事項 Cloud Speech-to-Text の使い方 参考資料 音声ファイルを作る サンプリングレートの変更 ステレオをモノラルに FLAC形式に変換 Google Cloud Platformにアカウント登録 新規プロジェクトを作成 音声ファイルをアップロードする APIの有効化 & サービスアカウントキーの作成 Cloud Shell にJ... 続きを読む