タグ 文字起こしAI
人気順 10 users 50 users 100 users 500 users 1000 usersほぼリアルタイム!?爆速で動作する日本語特化の文字起こしAI!『kotoba-whisper-v2.0』 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? みなさんこんにちは!私は株式会社ulusageの、技術ブログ生成AIです!これからなるべく鮮度の高い情報や、ためになるようなTipsを展開していきます。よろしくお願いします!(AIに... 続きを読む
爆速でローカル動作する日本語特化の文字起こしAI『kotoba-whisper-v2.0』の実力は?/実際にローカルで実行してOpenAIの「Whisper」と比較してみた【レビュー】
OpenAIの文字起こしAI「Whisper」が幻覚を起こし文章を捏造すると研究者が指摘
OpenAIは文字起こしAIのWhisperを「人間レベルの堅牢性と正確性を持ったツール」と宣伝していますが、これには大きな欠点があると専門家たちが指摘しています。十数人のソフトウェアエンジニア、開発者、学術研究者にインタビューしたというAP通信によると、Whisperは文字起こしにおいて一部のテキストや文章全体を捏造... 続きを読む
OpenAIの文字起こしAI「Whisper」、医療現場での利用に研究者らが警鐘
米OpenAIが2022年に発表した音声テキスト変換AI「Whisper」に、文章の一部または全部を捏造してしまういわゆる「幻覚」による重大な欠陥があると、米Associated Pressは10月26日(現地時間)、多数のエンジニアや研究者へのインタビューに基づいて報じた。 Whisperは、インタビューの翻訳や文字起こし、消費者向け技術で... 続きを読む
MozillaがOpenAIのWhisperベースの高性能文字起こしAI「Whisperfile」を開発中
ウェブブラウザ「Firefox」などを開発するMozillaが、OpenAIの「Whisper」ベースの文字起こしAI「Whisperfile」を開発中であることを発表しました。Whisperfileでは、英語以外の音声を英語に翻訳することも可能とのことです。 Mozilla/whisperfile · Hugging Face https://huggingface.co/Mozilla/whisperfile Mozilla D... 続きを読む
文字起こしAI「オートメモ」に要約機能 議事録作成時間を8割削減
ZHD、OpenAIのAPIを全て契約 LINEとヤフーの従業員2万人に展開
Zホールディングス(ZHD)は7月27日、米OpenAIが提供する全てのAPIについて利用契約を結んだと発表した。LINEグループとヤフーに所属する2万人の従業員用に、APIを活用した社内チャットbotの提供も始めた。 契約したAPIはチャットAI「GPT-4」、画像生成AI「DALL・E」、文字起こしAI「Whisper」など。ZHDは「文書やメール... 続きを読む
無料で使えるChatGPT公式のiOSアプリ登場、文字起こしAIのWhisperで音声入力も可能
OpenAIが高性能チャットAI「ChatGPT」のiOSアプリを公開しました。アプリではChatGPTとチャットできるほか、文字起こしAI「Whisper」を用いた音声入力にも対応しています。 Introducing the ChatGPT app for iOS https://openai.com/blog/introducing-the-chatgpt-app-for-ios ChatGPTの公式iOSアプリは、以下のリンク先... 続きを読む
文字起こしAI「Whisper」を誰でも簡単に使えるようにした超高精度文字起こしアプリ「writeout.ai」使い方まとめ、オープンソースでローカルでも動作OK
会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai... 続きを読む
OpenAIがチャットAI「ChatGPT」を1トークン当たり0.2円でアプリに導入できるAPI提供開始
AI開発団体のOpenAIは、超高性能なチャットAI「ChatGPT」や文字起こしAI「Whisper」を開発しており、話題を集めています。そんなOpenAIが、新たに「ChatGPTとWhisperをアプリに統合できるAPI」の提供を発表しました。 Introducing ChatGPT and Whisper APIs https://openai.com/blog/introducing-chatgpt-and-whisper-ap... 続きを読む
話題の文字起こしAI「Whisper」、ニュース記事を読み上げて試したら驚きの精度だった
インタビューや会議の際に発言内容をメモしながら、後で間違えないよう録音もする人は少なくないだろう。だが、録音した音声を聞いてテキストに起こす作業はかなりの手間がかかる。筆者の場合は聞き取りづらい箇所を繰り返し再生したり、パソコンに文字を打ち込む操作が遅れて音声の再生を一時停止したりしているうちに... 続きを読む
「無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた!」――急遽テレワークを導入した中小企業の顛末記(118)【急遽テレワーク導入!の顛末記】
文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉
どうもこんにちは、あんどう(@t_andou)です。 前回宣言した通りに誰でも簡単にYoutubeの字幕ファイルを作る方法を書きます。 「Youtubeの」と書いていますが、実際はどの動画でも対応してます。 前回の記事 blog.takuya-andou.com まずはGoogleColabの共有 colab.research.google.com 使い方 GoogleColabに記載してい... 続きを読む
無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)... 続きを読む
高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉
どうもこんにちは、あんどう(@t_andou)です。 今回はOpenAIの高精度な文字起こしAI「whisper」を試してみました。 ただ試すだけでは面白くないのでもう少し実用的なことを…と言うことで、Youtube用の字幕を作ってみました。 実行環境 使用した動画と結果 まずはモデルごとに精度確認 small 処理時間 結果 所感 medium ... 続きを読む
音声から文字起こし、AWSのAIサービス「Amazon Transcribe」が日本語に対応 | 日経 xTECH(クロステック)
米アマゾン・ウェブ・サービス(Amazon Web Services)は2019年11月21日(米国時間)、音声からの文字起こしAI(人工知能)サービス「Amazon Transcribe(トランスクライブ)」の対応言語に、日本語など7言語を追加したと発表した。Amazon Transcribeを利用すると、コールセンターや動画配信などのシステムに日本語の文... 続きを読む
リアルタイムで機密情報を隠しながら音声の文字起こしができるオープンソースAIモデル「WhisperNER」
近年では「Whisper」などの文字起こしAIが数多く生まれています。しかし、これらの文字起こしAIに対して一部の企業は「機密情報が流出する」とのリスクを懸念し警戒感を強めています。そんな中、イスラエルのAIスタートアップ「aiOla」が開発した文字起こしAIの「WhisperNER」では、機密情報を自動的に識別して隠すこと... 続きを読む