はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ whisper

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 50件)

文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK

2023/03/09 このエントリーをはてなブックマークに追加 456 users Instapaper Pocket Tweet Facebook Share Evernote Clip 手動 議事録 ムービー 文字起こしAI 会議

会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai... 続きを読む

Whisper、ChatGPTを活用した、テキスト入力不要な新感覚メモ日記アプリの紹介と、開発における学び|nyosu

2023/08/19 このエントリーをはてなブックマークに追加 300 users Instapaper Pocket Tweet Facebook Share Evernote Clip メモアプリ chatgpt メモ 音声入力 絵文字

日常生活の中で生まれた「できごと」や「思ったこと」を、楽しく記録できるメモ日記アプリを開発しました! しゃべったら、あとは丸投げして良い感じにメモを残してくれる「シャべマル」です!(笑) シャべマルの紹介具体的には、、 絵文字で見返せるメモアプリあんまりないですが、良いですよ…!音声入力でメモ内容を... 続きを読む

OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能

2022/09/22 このエントリーをはてなブックマークに追加 281 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI 早口 gpt-3 早口言葉 文章生成AI

画像生成AI「DALL・E 2」や文章生成AI「GPT-3」といった高性能AIを開発してきたAI開発組織のOpenAIが、新たに音声を超高精度で認識して文章に書き起こせるAI「Whisper」を発表しました。発表と同時に公開されたサンプルでは「早口のセールストーク」や「ハイテンポな曲の歌詞」などの音声でも問題なく文字起こしできる性... 続きを読む

自分の行動を毎日24時間録音してWhisperで文字起こしする「全自動口述日記」を1週間つけつづけたエンジニアの報告

2022/11/16 このエントリーをはてなブックマークに追加 267 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI 録音 精度 エンジニア AIモデル

AI研究団体のOpenAIが開発した「Whisper」は非常に高い精度で録音から文字起こしを行うAIモデルで、オープンソースで無料公開されています。エンジニアのロバー・ダム氏が自身のブログで、毎日スマートフォンに行動を逐一吹き込み、その録音をWhisperで文字起こしすることで「全自動口述日記」を残すことができるシステ... 続きを読む

バフェット・コード on Twitter: "最近OpenAIが発表した高性能文字起こしAI「Whisper」を使って動画の文字起こしをしているのですが、あまりの精度の高さに口をあんぐりしてます。 これまで60分

2022/12/21 このエントリーをはてなブックマークに追加 258 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI 精度 on Twitter https あん

最近OpenAIが発表した高性能文字起こしAI「Whisper」を使って動画の文字起こしをしているのですが、あまりの精度の高さに口をあんぐりしてます。 これまで60分の文字起こしをクラウドソーシング系で依頼しようとすると安くても… https://t.co/wF5FBEYOgQ 続きを読む

超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた

2023/01/20 このエントリーをはてなブックマークに追加 247 users Instapaper Pocket Tweet Facebook Share Evernote Clip ReazonSpeech OpenAI 無償 超高精度 文字

東京に拠点を置くテクノロジー企業「レアゾン・ホールディングス」が、1万9000時間に及ぶ国内最大級の日本語音声コーパス「ReazonSpeech」を無償公開しました。同時に、OpenAIが開発した超高性能音声認識AI「Whisper」に匹敵する性能をアピールする文字起こしサービスも公開されていたので、実際に使ってみました。 超高... 続きを読む

PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記

2022/10/16 このエントリーをはてなブックマークに追加 215 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI TadaoYamaoka リアルタイム 音声

PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイ... 続きを読む

[電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 | DevelopersIO

2023/11/20 このエントリーをはてなブックマークに追加 162 users Instapaper Pocket Tweet Facebook Share Evernote Clip DevelopersIO 抽出 日付 人数 コールセンター

[電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 はじめに Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(電話番号,日時,名前,人数)を正しく抽出できるか検証しました。 コールセンターでは、有人対応から無人対応に変更したい... 続きを読む

Twitter、つぶやきならぬ「ささやき」(Whisper)モードを検討中。特定の会話だけプライベートに - Engadget Japanese

2014/05/02 このエントリーをはてなブックマークに追加 162 users Instapaper Pocket Tweet Facebook Share Evernote Clip Bloomberg Twitter 起点 Costolo氏

Twitter の CEO Dick Costolo氏は Bloomberg とのインタビューで、ツイッターに「Whisper モード」の追加を検討していることを明らかにしました。Costolo氏によれば、ウィスパーモードは公開が前提のツイートとプライベートな会話を両立させる仕組み。 CEOの説明によると、Whisper Mode は公開のツイートを起点として、その話題についてフレンド間だけで非公... 続きを読む

WhisperとChatGPTで文字起こし | ドクセル

2023/06/25 このエントリーをはてなブックマークに追加 132 users Instapaper Pocket Tweet Facebook Share Evernote Clip ドクセル

2023/06/24 ChatGPT のAPIを使ったハンズオン #機械学習名古屋 LTにて発表 続きを読む

成田 修造 / Shuzo Narita on Twitter: "またやっばいAIでた。OpenAI社が出したWhisperというモデル 信じられない早口もKPopも、全部正確に聞き取りすぐテキスト化して英語に翻訳してくれる。68万時間

2022/09/23 このエントリーをはてなブックマークに追加 131 users Instapaper Pocket Tweet Facebook Share Evernote Clip KPOP 修造 早口 OpenAI社 成田

またやっばいAIでた。OpenAI社が出したWhisperというモデル 信じられない早口もKPopも、全部正確に聞き取りすぐテキスト化して英語に翻訳してくれる。68万時間分学習して30分動画も20秒とかで翻訳。 音声→テキスト… https://t.co/14jmqLe0fh 続きを読む

高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉

2022/09/27 このエントリーをはてなブックマークに追加 129 users Instapaper Pocket Tweet Facebook Share Evernote Clip YouTube OpenAI small 字幕 ニート

どうもこんにちは、あんどう(@t_andou)です。 今回はOpenAIの高精度な文字起こしAI「whisper」を試してみました。 ただ試すだけでは面白くないのでもう少し実用的なことを…と言うことで、Youtube用の字幕を作ってみました。 実行環境 使用した動画と結果 まずはモデルごとに精度確認 small 処理時間 結果 所感 medium ... 続きを読む

技術系の非喫煙者で喫煙室が羨ましいと思った事が無い人っているのかな? - gobbledygook

2007/07/20 このエントリーをはてなブックマークに追加 121 users Instapaper Pocket Tweet Facebook Share Evernote Clip gobbledygook 肩書き 喫煙室 部署 非喫煙者

whisper | 13:49 | 最近のはてな系な飲みで度々話題になるのだけど、喫煙室で交わされる情報って、普段とは違う情報が含まれる事が多々ある。それが非常に有効な場合もある。社内では、喫煙室という虐げられた環境だが、逆に違う部署の違う肩書きの方々と様々な会話を交わす切っ掛けになっている。で、自分が抱えている問題とかを違う視点でみてくれるとか、今まではそういう機会はあまり無かったけど、喫煙室と... 続きを読む

OpenAI API で提供されている モデル まとめ|npaka|note

2023/03/03 このエントリーをはてなブックマークに追加 120 users Instapaper Pocket Tweet Facebook Share Evernote Clip Note OpenAI API まとめ|npaka モデル

「OpenAI API」で提供されているモデルをまとめました。 1. OpenAI APIのモデル「OpenAI API」は、用途に応じて「GPT-3.5」をはじめとする様々なモデル を提供しています。 ・GPT-3.5 : 自然言語とコードを理解および生成する最新モデル。 ・DALL-E : 自然言語から画像を生成・編集するモデル ・Whisper : 音声をテキス... 続きを読む

Amazon Connect + Whisper + GPT-4 Turboで、発話から個人情報(名前、住所、生年月日)を正しく認識できるか試してみた | DevelopersIO

2023/11/13 このエントリーをはてなブックマークに追加 106 users Instapaper Pocket Tweet Facebook Share Evernote Clip KVS DevelopersIO CONNECT 生年月日

構成 構成としては、下記の通りです。 Connectのフローの詳細は下記の通りです。 例として、発話で住所を認識させる処理の流れは以下のとおりです。 コンタクトフロー内で「メディアストリーミングの開始」ブロックを使って、Kinesis Video Stream(KVS)への音声のストリーミングを開始します。 顧客は、住所を含めた発... 続きを読む

ポッドキャストをAIで書き起こし「LISTEN」 近藤淳也氏が立ち上げ

2023/04/26 このエントリーをはてなブックマークに追加 94 users Instapaper Pocket Tweet Facebook Share Evernote Clip Listen OpenAI ポッドキャスター 近藤淳也氏 音声

OpenAIが提供する書き起こしAPI「Whisper」を使い、配信済みのポッドキャストの内容を文字起こしして公開する。テキストを指定してその部分から音声を再生することもできる。 番組にコメントを書き込んだり星を付けて出演者と交流する機能も備えた。 約20人のポッドキャスターが既に登録しており、徐々に拡大していく。 ... 続きを読む

生理用ナプキンの『ウィスパー』が日本国内で販売している全製品の販売を終了していた「ショック」「現代の生理用ナプキンの革命児だった」 - Togetter

2018/05/03 このエントリーをはてなブックマークに追加 90 users Instapaper Pocket Tweet Facebook Share Evernote Clip ウィスパー Togetter ナプキン 革命児 生理用ナプキン

リンク www.myrepi.com 生理用品・ナプキンのブランド【ウィスパー(whisper)】 生理用品・ナプキンのブランド、【ウィスパー(whisper)】のオフィシャルサイトです。各製品の詳細や最新情報のほか、女性のライフステージ別に生理に関するお悩みにお答えするコンテンツをお届けしています。 続きを読む

秘密共有アプリのWhisperが月間15億ページビューを達成、Android版も公開 | TechCrunch Japan

2013/05/17 このエントリーをはてなブックマークに追加 82 users Instapaper Pocket Tweet Facebook Share Evernote Clip ヤングアダルト iOS 匿名 達成 年齢層

秘密共有アプリのWhisperは、昨年秋の公開以来著しい成長を遂げてきた。しかし最近までiOSのみでしか利用できなかった。今週Google PlayストアでAndroid版が公開され、Whisperは多くの新しいユーザー、特に重要な年齢層である18~24歳のヤングアダルトにも利用可能になった。 ご存じない方のために説明すると、Whisperは、他のユーザーと簡単に匿名で秘密を共有するために作られた... 続きを読む

「サイバーパンク2077」のようなリアルタイム翻訳システムをWhisperやDeepLを駆使して実現した猛者が現る

2022/12/23 このエントリーをはてなブックマークに追加 65 users Instapaper Pocket Tweet Facebook Share Evernote Clip GitHub CBP github.com DeepL 猛者

「サイバーパンク2077」をプレイしたというエンジニアのマルチン・エランコウスキ氏が、同作で登場するリアルタイム翻訳システムのような「話者の上にリアルタイムで会話内容が表示され翻訳まで行ってくれる翻訳システム」の開発に取り組んでいます。 GitHub - elanmart/cbp-translate https://github.com/elanmart/cbp-... 続きを読む

OpenAIのSpeech-To-Text AI「Whisper」をM1 Macで試してみる

2022/09/26 このエントリーをはてなブックマークに追加 63 users Instapaper Pocket Tweet Facebook Share Evernote Clip pip GitHub OpenAI 作業内容 M1 Mac

OpenAIがSpeech-To-Text AIのWhisperを発表しました。Githubからpipでインストールすれば簡単に使えます。私のM1 Max MacBook Proでも動作しましたので、作業内容を書いておきます。 GitHub – openai/whisper Contribute to openai/whisper development by creating an account on GitHub. github.com Python仮想環境を... 続きを読む

「匿名で告白したいなら秘密共有アプリWhisperは使うな」英紙暴露でiOS専門家 : ギズモード・ジャパン

2014/10/21 このエントリーをはてなブックマークに追加 34 users Instapaper Pocket Tweet Facebook Share Evernote Clip ギズモード 匿名 ジャパン ユーザ 調べ

Webサービス 「匿名で告白したいなら秘密共有アプリWhisperは使うな」英紙暴露でiOS専門家 2014.10.21 23:00 「ネットで最も安全な場所」を標榜する匿名秘密共有アプリ「Whisper」が匿名でもなんでもなくて、内部ではネタ追跡ツールみたいに使われていたことがザ・ガーディアンの調べでわかりました。 ユーザがアプリ削除後もデータを保存し、ユーザの同意もなしに位置情報を追跡し、なん... 続きを読む

OpenAI、「GPT-4」「DALL・E」「Whisper」などのAPIを一般提供

2023/07/07 このエントリーをはてなブックマークに追加 29 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI ChatGPT API HTML GPT-4

印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます OpenAIは米国時間7月6日、有料版「ChatGPT API」の全ユーザーに「GPT-4」へのアクセスを提供すると発表した。同社は3月にChatGPT APIをリリースし、6月にアップデートを提供し... 続きを読む

iOS版「OpenAI ChatGPT」アプリ、まずは米国で公開 音声入力も可能

2023/05/18 このエントリーをはてなブックマークに追加 28 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI ChatGPT iOS版 米国 音声入力 アプリ

また、昨年9月に発表したオープンソースの音声テキスト変換AI「Whisper」により、音声でのプロンプト入力も可能だ。 米Microsoftは2月に「新しいBing」のモバイルアプリ版をiOSおよびAndroid向けにリリースした。こちらは既に日本でも利用可能で、日本語での音声入力もできる。 現在App Storeで「ChatGPT」を検索すると... 続きを読む

OpenAI、「ChatGPT API」と企業向け専用容量プランの提供開始 「gpt-3.5-turbo」も発表

2023/03/01 このエントリーをはてなブックマークに追加 27 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI chatgpt gpt-3.5-turbo

会話型AIサービス「ChatGPT」などを手掛ける米OpenAIは3月1日(現地時間)、ChatGPTと音声テキスト変換AI「Whisper」のAPI提供を開始したと発表した。システム最適化で実現したコストの90%削減(2022年12月比)を価格に反映させたとしている。 ChatGPT APIのエンジンは「GPT-3.5」ではなく、ChatGPT製品で使われている... 続きを読む

SpotifyのPodcast、OpenAIの技術で本人の声での多言語吹き替えが可能に

2023/09/25 このエントリーをはてなブックマークに追加 19 users Instapaper Pocket Tweet Facebook Share Evernote Clip Podcast Spotify OpenAI 米OpenAI

スウェーデンSpotifyは9月25日(現地時間)、生成AI採用でPodcastをホスト自身の声で複数言語に吹き替える新機能「Voice Translation」を発表した。米OpenAIが同日発表した新しい音声技術と、3月リリースの音声文字起こしツール「Whisper」を採用する。 OpenAIは、新しい音声技術で「わずか数秒間の実際の音声からリアル... 続きを読む

 
(1 - 25 / 50件)