タグ whisper
人気順 5 users 10 users 100 users 500 users 1000 users爆速でローカル動作する日本語特化の文字起こしAI『kotoba-whisper-v2.0』の実力は?/実際にローカルで実行してOpenAIの「Whisper」と比較してみた【レビュー】
OpenAIの文字起こしAI「Whisper」、医療現場での利用に研究者らが警鐘
米OpenAIが2022年に発表した音声テキスト変換AI「Whisper」に、文章の一部または全部を捏造してしまういわゆる「幻覚」による重大な欠陥があると、米Associated Pressは10月26日(現地時間)、多数のエンジニアや研究者へのインタビューに基づいて報じた。 Whisperは、インタビューの翻訳や文字起こし、消費者向け技術で... 続きを読む
[電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 | DevelopersIO
[電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 はじめに Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(電話番号,日時,名前,人数)を正しく抽出できるか検証しました。 コールセンターでは、有人対応から無人対応に変更したい... 続きを読む
Amazon Connect + Whisper + GPT-4 Turboで、発話から個人情報(名前、住所、生年月日)を正しく認識できるか試してみた | DevelopersIO
構成 構成としては、下記の通りです。 Connectのフローの詳細は下記の通りです。 例として、発話で住所を認識させる処理の流れは以下のとおりです。 コンタクトフロー内で「メディアストリーミングの開始」ブロックを使って、Kinesis Video Stream(KVS)への音声のストリーミングを開始します。 顧客は、住所を含めた発... 続きを読む
Whisper、ChatGPTを活用した、テキスト入力不要な新感覚メモ日記アプリの紹介と、開発における学び|nyosu
日常生活の中で生まれた「できごと」や「思ったこと」を、楽しく記録できるメモ日記アプリを開発しました! しゃべったら、あとは丸投げして良い感じにメモを残してくれる「シャべマル」です!(笑) シャべマルの紹介具体的には、、 絵文字で見返せるメモアプリあんまりないですが、良いですよ…!音声入力でメモ内容を... 続きを読む
WhisperとChatGPTで文字起こし | ドクセル
2023/06/24 ChatGPT のAPIを使ったハンズオン #機械学習名古屋 LTにて発表 続きを読む
ポッドキャストをAIで書き起こし「LISTEN」 近藤淳也氏が立ち上げ
OpenAIが提供する書き起こしAPI「Whisper」を使い、配信済みのポッドキャストの内容を文字起こしして公開する。テキストを指定してその部分から音声を再生することもできる。 番組にコメントを書き込んだり星を付けて出演者と交流する機能も備えた。 約20人のポッドキャスターが既に登録しており、徐々に拡大していく。 ... 続きを読む
文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK
会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai... 続きを読む
OpenAI API で提供されている モデル まとめ|npaka|note
「OpenAI API」で提供されているモデルをまとめました。 1. OpenAI APIのモデル「OpenAI API」は、用途に応じて「GPT-3.5」をはじめとする様々なモデル を提供しています。 ・GPT-3.5 : 自然言語とコードを理解および生成する最新モデル。 ・DALL-E : 自然言語から画像を生成・編集するモデル ・Whisper : 音声をテキス... 続きを読む
超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた
東京に拠点を置くテクノロジー企業「レアゾン・ホールディングス」が、1万9000時間に及ぶ国内最大級の日本語音声コーパス「ReazonSpeech」を無償公開しました。同時に、OpenAIが開発した超高性能音声認識AI「Whisper」に匹敵する性能をアピールする文字起こしサービスも公開されていたので、実際に使ってみました。 超高... 続きを読む
「サイバーパンク2077」のようなリアルタイム翻訳システムをWhisperやDeepLを駆使して実現した猛者が現る
「サイバーパンク2077」をプレイしたというエンジニアのマルチン・エランコウスキ氏が、同作で登場するリアルタイム翻訳システムのような「話者の上にリアルタイムで会話内容が表示され翻訳まで行ってくれる翻訳システム」の開発に取り組んでいます。 GitHub - elanmart/cbp-translate https://github.com/elanmart/cbp-... 続きを読む
バフェット・コード on Twitter: "最近OpenAIが発表した高性能文字起こしAI「Whisper」を使って動画の文字起こしをしているのですが、あまりの精度の高さに口をあんぐりしてます。 これまで60分
最近OpenAIが発表した高性能文字起こしAI「Whisper」を使って動画の文字起こしをしているのですが、あまりの精度の高さに口をあんぐりしてます。 これまで60分の文字起こしをクラウドソーシング系で依頼しようとすると安くても… https://t.co/wF5FBEYOgQ 続きを読む
自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告
AI研究団体のOpenAIが開発した「Whisper」は非常に高い精度で録音から文字起こしを行うAIモデルで、オープンソースで無料公開されています。エンジニアのロバー・ダム氏が自身のブログで、毎日スマートフォンに行動を逐一吹き込み、その録音をWhisperで文字起こしすることで「全自動口述日記」を残すことができるシステ... 続きを読む
PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイ... 続きを読む
高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉
どうもこんにちは、あんどう(@t_andou)です。 今回はOpenAIの高精度な文字起こしAI「whisper」を試してみました。 ただ試すだけでは面白くないのでもう少し実用的なことを…と言うことで、Youtube用の字幕を作ってみました。 実行環境 使用した動画と結果 まずはモデルごとに精度確認 small 処理時間 結果 所感 medium ... 続きを読む
OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる
OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper Contribute to openai/whisper development by creating an account on GitHub. github.com Python仮想環境を... 続きを読む
成田 修造 / Shuzo Narita on Twitter: "またやっばいAIでた。OpenAI社が出したWhisperというモデル 信じられない早口もKPopも、全部正確に聞き取りすぐテキスト化して英語に翻訳してくれる。68万時間
またやっばいAIでた。OpenAI社が出したWhisperというモデル 信じられない早口もKPopも、全部正確に聞き取りすぐテキスト化して英語に翻訳してくれる。68万時間分学習して30分動画も20秒とかで翻訳。 音声→テキスト… https://t.co/14jmqLe0fh 続きを読む
OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能
画像生成AI「DALL・E 2」や文章生成AI「GPT-3」といった高性能AIを開発してきたAI開発組織のOpenAIが、新たに音声を超高精度で認識して文章に書き起こせるAI「Whisper」を発表しました。発表と同時に公開されたサンプルでは「早口のセールストーク」や「ハイテンポな曲の歌詞」などの音声でも問題なく文字起こしできる性... 続きを読む
生理用ナプキンの『ウィスパー』が日本国内で販売している全製品の販売を終了していた「ショック」「現代の生理用ナプキンの革命児だった」 - Togetter
リンク www.myrepi.com 生理用品・ナプキンのブランド【ウィスパー(whisper)】 生理用品・ナプキンのブランド、【ウィスパー(whisper)】のオフィシャルサイトです。各製品の詳細や最新情報のほか、女性のライフステージ別に生理に関するお悩みにお答えするコンテンツをお届けしています。 続きを読む
Twitter、つぶやきならぬ「ささやき」(Whisper)モードを検討中。特定の会話だけプライベートに - Engadget Japanese
Twitter の CEO Dick Costolo氏は Bloomberg とのインタビューで、ツイッターに「Whisper モード」の追加を検討していることを明らかにしました。Costolo氏によれば、ウィスパーモードは公開が前提のツイートとプライベートな会話を両立させる仕組み。 CEOの説明によると、Whisper Mode は公開のツイートを起点として、その話題についてフレンド間だけで非公... 続きを読む
秘密共有アプリのWhisperが月間15億ページビューを達成、Android版も公開 | TechCrunch Japan
秘密共有アプリのWhisperは、昨年秋の公開以来著しい成長を遂げてきた。しかし最近までiOSのみでしか利用できなかった。今週Google PlayストアでAndroid版が公開され、Whisperは多くの新しいユーザー、特に重要な年齢層である18~24歳のヤングアダルトにも利用可能になった。 ご存じない方のために説明すると、Whisperは、他のユーザーと簡単に匿名で秘密を共有するために作られた... 続きを読む
技術系の非喫煙者で喫煙室が羨ましいと思った事が無い人っているのかな? - gobbledygook
whisper | 13:49 | 最近のはてな系な飲みで度々話題になるのだけど、喫煙室で交わされる情報って、普段とは違う情報が含まれる事が多々ある。それが非常に有効な場合もある。社内では、喫煙室という虐げられた環境だが、逆に違う部署の違う肩書きの方々と様々な会話を交わす切っ掛けになっている。で、自分が抱えている問題とかを違う視点でみてくれるとか、今まではそういう機会はあまり無かったけど、喫煙室と... 続きを読む