タグ 認識精度
人気順 10 users 50 users 100 users 500 users 1000 userssuperwhisperでの音声入力を試す
superwhisperという、whisper.cppを使った音声入力ができるmacOSアプリケーションを最近使っています。 基本的にはggerganov/whisper.cppのモデルを使って、音声認識しながら文字入力ができるアプリケーションです。 特徴 Whisperの認識精度が高い かなり早く喋っても認識してくれる 日本語も認識してくれるモデルがある... 続きを読む
AWS Lambda でOpenAI の Whisper API を 認識精度の改善も含めて試してみた | DevelopersIO
はじめに AWS LambdaでOpenAIのWhisper APIを試してみました。 OpenAIには音声データから文字起こししてくれる「Whisper」という音声認識モデルがあり、WhisperをAPIの形で呼び出すWhisper APIが存在します。日本語ももちろん対応してます。 今回は、AWS LambdaがS3バケットに保存された音声データを元にWhisper APIで文... 続きを読む
音声認識が急激に進化、実用レベルになったフリーの文字起こしソフト
会議録を作る際、録音を繰り返し聞いて文字起こしするのは大変だ。最近は音声認識の技術が急速に進化し、無料でテキスト化できるアプリもある。使わないのは損だ。 「LINE CLOVA Note」は認識精度が高く、複数の話者を区別できるので実用性が高い(図1)。利用にはLINEアカウントが必要(図2、図3)。スマホアプリ版はそ... 続きを読む
ZOZO、10年分のファッションデータをオープンソース化 流行に左右されないAI研究に期待 - ITmedia NEWS
ZOZOテクノロジーズが10年分のファッションのデータセットをオープンソース化。流行が変化してもAIの認識精度を高く保つ研究への活用を見込む。 ZOZOテクノロジーズは9月2日、服のコーディネート約255万件とアイテム約200万件などを含むデータセット「Shift15M」をオープンソースとしてGitHubで公開したと発表した。服の... 続きを読む
Alexaの録音内容はアマゾン従業員に聞かれている──認識精度向上に利用 - Engadget 日本版
リリース直後こそ、プライバシー問題などが懸念されていたスマートスピーカーですが、いまではかなり受け入れられている感もあります。音声アシスタントも徐々に進化し、音声や文脈の認識精度も向上しているのですが、その精度向上には、ユーザーが実際に話した録音データが使われているようです。しかも、機械的に処理... 続きを読む
Google Document の音声認識入力が思ってたよりすごかった - mizchi's blog
2017 - 09 - 04 Google Document の音声認識入力が思ってたよりすごかった はいえーとあの google の音声入力のテストをやってみてるんですけどこれめっちゃすごいですねなんかここまで認識精度良いと思わなかったあの文字の改行とかそこだけちょっと自分でやんないといけないんですけどそれ以外は全然不満がないですねこれなにかコマンドとかあるのかなやそうでもないか何がやりたいかと... 続きを読む
府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまった論文を読んだ - Qiita
Deep Learning Advent Calendar 2016 の20日目の記事です。 背景 府大生が趣味で世界一の認識精度を持つニューラルネットワークを開発してしまったようです。 M2の学生が趣味でやっていたCIFAR10とCIFAR100の認識タスクで,現時点での世界最高性能の結果を出したそうだ…趣味でっていうのが… https://t.co/HKFLXTMbzx — ニーシェス (@l... 続きを読む
AIによる物件の不整合画像検出を開始 | 株式会社ネクスト
株式会社ネクストは、この度ディープラーニングを活用した物件データベースの不整合画像検出を開始いたします。 ■ディープラーニング ( 深層学習 ) による不整合画像検出の概要 ディープラーニングとは、人間の脳の神経回路の仕組みを模して開発されたアルゴリズムです。予め定義したルールに基づく従来の機械学習とは異なり、自動で特徴を識別することで、認識精度の飛躍的な向上が可能となりました。 この度導入する物... 続きを読む
ニュース - [ITpro EXPO 2015]日本を救う「子どもの人工知能」とは、東大の松尾氏が講演:ITpro
「今年に入って、ディープラーニング(多層ニューラルネットによる機械学習)が実現する画像認識の精度が、人間の認識精度を超えてしまった。これは何を意味するのだろうか――」 東京大学大学院 工学系研究科 准教授の松尾豊氏は、2015年9月30日から10月2日まで東京ビッグサイトで開催している「ITpro EXPO 2015」の特別講演「人工知能は人間を超えるか~ディープラーニングの先にあるもの」の中で聴... 続きを読む
ヤフー、各種サービスの「音声認識」精度を改善--ディープラーニングを活用 - CNET Japan
ヤフーは5月19日、同社の音声認識エンジン「YJVOICE(ワイジェイボイス)」にディープラーニング(深層学習。人工知能技術の1つ)を取り入れ、認識精度を大幅に改善したと発表した。特に向上したのは、騒音下における認識精度。これまで、駅のホームや街頭などの騒音がある場所で誤認識されていた「声」が、正しく認識されやすくなったという。 同日、「音声検索」や「Yahoo!音声アシスト」、「Yahoo!乗換... 続きを読む
指を空中で動かすだけでスマホを操作できる指輪型ウェアラブル端末「Ring ZERO」レビュー - GIGAZINE
人差し指にはめて空中ジェスチャーすることで、スマートフォンを操作して写真を撮影したり音楽を再生したり、さらにはスマート家電と連携させることで照明やテレビのON/OFFまでできる指輪型ウェアラブル端末「Ring」が、より軽量になり認識精度も大幅にアップさせた「Ring ZERO」にバージョンアップしたとのことなので、さっそく使ってみて進化のほどを確かめてみました。 Ring ZERO by Logb... 続きを読む
人力でレシートを読み取る家計簿アプリ「Dr.Wallet」運営元が1億円調達 | TechCrunch Japan
レシートをOCRで自動読み取りする家計簿アプリといえば、クックパッドが出資した「zaim」や「ReceReco」などが人気だが、人間の手の力を借りてレシートを読み取ることで認識精度を高めようとしているアプリが「Dr.Wallet」だ。今年8月のローンチ時にも紹介したこのサービスを運営するBearTailが27日、第三者割当増資を実施して約1億円を調達した。引受先はニッセイ・キャピタル、インキュベイ... 続きを読む
[PR] ReceReco: レシートを自動で読み取って簡単に家計簿がつけられます。無料。 - たのしいiPhone! AppBank
レシートをカメラで読み取って自動的に家計簿が付けられるReceReco(レシレコ)のご紹介です。 iPhoneのカメラでレシートを撮影するだけで、品目、値段、購入日時などが自動的に入力される執事のようなアプリです。 文字の認識精度が高く、正確に値段を読み込んでくれます。誤認識が発生しても、レシートに書かれた合計の値段と、読み込んだ各品目の値段の合計を比較して値段を補正してくれます。 さらに支出状況... 続きを読む
SEO対策を意識した商品紹介文の書き方を考える | ネットショップニュースなう!
まずはこちらの記事を紹介させてもらいます。 SEOを意識せずにGoogleに評価される記事の書き方 (海外SEO情報ブログ) 要するに、「Googleのクローラーはテキストの認識精度が非常に高くなってきており、意識的にSEO対策になるワードを敷き詰めなくとも、しっかりとワードを認識するようになっています」と言うことに他ならないのですが、だからと言って、言葉を簡略したり、無意味に長文を書いてもOKと... 続きを読む
iOS 5.1で登場した日本語版「Siri」でメモをとるコツ | iPhone | iPad iPhone Wire
iPad*iPhone Hacks iOS 5.1で登場した日本語版「Siri」でメモをとるコツ 海上忍 2012/03/08 日本時間の3月8日にリリースされた「iOS 5.1」では、音声アシスタント機能「Siri」の対応言語が増加、ついに日本語のサポートが開始された。これまでの英語同様、その認識精度は高く、十分に実用的との評価も高い。ふだんの話し言葉で命令できるだけに、さっそく使いこなしている... 続きを読む
【NEWリリース】 MetaMoji、手書き日本語入力システム「mazec」のAndroid版提供開始
株式会社MetaMojiは8月1日、手書き日本語入力システムアプリ『mazec (J) for Android [β版]』の提供を開始した。 同社はジャストシステムの創業者、浮川和宣・初子夫妻が設立した会社で、既にiOS向けに手書き日本語入力を活用した「7notes」等のアプリを提供している。 『mazec (J) for Android [β版]』は、変換速度と認識精度の高さが特徴の手書き日本語... 続きを読む
暇人\(^o^)/速報 : Googleのトップページがキモいと話題に - ライブドアブログ
Googleのトップページがキモいと話題に Tweet 1:名無しさん@涙目です。(愛知県):2011/05/11(水) 00:20:14.85 ID:kmUg24tk0● 米Googleは5月9日(現地時間)、同社画像認識ツールの最新版「Google Goggles 1.4」の 提供を開始した。認識精度の向上や検索結果へのコメント機能などが付与されたほか、 名刺読み取り機能の強化など、地味ながら... 続きを読む