タグ 音声認識
新着順 10 users 50 users 100 users 500 users 1000 users培養脳でコンピューター 神経細胞で音声認識に成功、米インディアナ大学 - 日本経済新聞
米インディアナ大学ブルーミントン校などは、人の幹細胞から作った神経細胞を集積した「培養脳」を用いて簡易なコンピューターを開発した。従来のコンピューターより少ない電力で計算できると期待される。実用化できれば、電力消費の拡大に対応する手段の一つとなる。人工知能(AI)の普及などデジタル化の急速な進展は... 続きを読む
人間の脳細胞を電極の上に置いてつくった人工知能。日本語の音声認識を実現【研究紹介】
人間の脳細胞を電極の上に置いてつくった人工知能。日本語の音声認識を実現【研究紹介】 2023年12月13日 山下 裕毅 先端テクノロジーの研究を論文ベースで記事にするWebメディア「Seamless/シームレス」(https://shiropen.com/)を運営。 米Indiana University Bloomingtonなどに所属する研究者らが発表した論文「Brain... 続きを読む
培養したヒトの脳組織を使ってコンピューターを構築することに成功、日本語の音声認識にも対応
人間の幹細胞を基に作られた脳オルガノイド(ミニ脳)を電子チップに接続した「ブレイノウェア」と呼ばれるセットアップを構築して、簡単な計算タスクを実行することに成功したことが、インディアナ大学ブルーミントン校のエンジニアであるフェン・グオ氏らの研究チームによって報告されました。 Brain organoid reservoir... 続きを読む
ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に
米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。 米OpenAIは9月25日(現地時間)、同社のチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載されたと発表した。今後2週間かけて、PlusユーザーとEnterpr... 続きを読む
トヨタ、車載OS「アリーン」を既存車種から搭載 次世代EVに先駆けて|自動車メーカー|紙面記事
トヨタ自動車は、開発中の車載OS(基本ソフト)「アリーン」を次世代型電気自動車(EV)に先駆けて既存の車両に搭載する方針だ。人工知能(AI)技術を活用した高度な音声認識やレコメンド(推薦)機能、販売後の機能更新サービスなどを顧客にいち早く体験してもらうのが狙い。車両開発でSDV(ソフトウエア・デ... 続きを読む
Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表
Googleが「AudioPaLM」を発表しました。AudioPaLMはテキストベースの言語モデルである「PaLM 2」と音声ベースの言語モデルである「AudioLM」を統合したマルチモーダルアーキテクチャであり、テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用できるとのことです。 [2306.12925] AudioPaLM:... 続きを読む
GPTの仕組みをちゃんと勉強したい本 - きしだのHatena
やっぱGPTを仕組みから勉強したい、という本をいくつか見つけたのでまとめておきます。 まず理論的な概要。 機械学習からニューラルネットワーク、CNNでの画像処理、トランスフォーマーでの自然言語処理、音声認識・合成、そしてそれらを組み合わせたマルチモーダルと章が進むので、理論的な概観を得るのにいいと思いま... 続きを読む
デザイナーの仕事は AI でラクになる?実際に試してみた|Goodpatch Blog グッドパッチブログ
こんにちは。Goodpatch UIデザイナーの金谷です。 最近、ChatGPTで話題沸騰のAI。機械学習、ディープラーニングなどの技術の進歩が著しく、自然言語処理、画像認識、音声認識などの分野で、驚異的な精度と高速な処理能力を発揮しています。 ChatGPTにいろいろな「仕事」をさせる実験が流行っていますが、私自身もAIに負... 続きを読む
「poiq」とAlexaの性能が良すぎて少し困ってる話
「poiq」とAlexaの性能が良すぎて少し困ってる話:ソニーのゆるふわロボット「poiq」との日々(1/2 ページ) 今回は、poiqの頭脳の部分の話である音声認識とかAIとの対話の話。実はAlexaとの連携機能もあり、poiq経由でAlexaの処理をするのは、poiqオーナーにとってすごく自然なことでもあります。 日常生活にある音声認... 続きを読む
「Skype」に「ほんやくコンニャク」機能? 音声認識+自然言語処理で異言語対話を容易に/話した言葉を即座に翻訳して自分の声とテキストで伝達。2023年にリリースへ
PayPayのやり方を友達に聞いたら「音声認識だからレジに向かって大きめの声で『PayPay』って言えばいい」と教えられた話
うっちー©︎ @saso_______unko PayPayやった事なくて、やっと登録したんだけど使い方がわからず、友達に聞いたら「音声認識だからレジ機に向かって大きめの声でPayPayって言うと自動的に支払われる」と教えられたので、コンビニレジ機に向かって大きな声でPayPay!と言い放った後、店員さんが苦笑いで解説してくれた辺りか... 続きを読む
[速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開
[速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開 GitHubは、年次イベント「GitHub Universe 2022」の基調講演で、音声によるGitHubの操作やコーディングを可能にする実験的機能「Hey, GitHub!」をプレビュー公開しました。 'Hey, GitHub!' is an experimen... 続きを読む
無料でOpenAIの「Whisper」を使って録音ファイルから音声認識で文字おこしする方法まとめ
画像生成AI「DALL・E2」や文章生成AI「GPT-3」「InstructGPT」などを開発するAI研究団体のOpenAIが、2022年9月に高性能な文字起こしAI「Whisper」を発表しました。オープンソースのWhisperはリポジトリが一般公開されており、日本語にも対応しているとのことで、オンライン実行環境のGoogle Colaboratory(Google Colab)... 続きを読む
音声認識が急激に進化、実用レベルになったフリーの文字起こしソフト
会議録を作る際、録音を繰り返し聞いて文字起こしするのは大変だ。最近は音声認識の技術が急速に進化し、無料でテキスト化できるアプリもある。使わないのは損だ。 「LINE CLOVA Note」は認識精度が高く、複数の話者を区別できるので実用性が高い(図1)。利用にはLINEアカウントが必要(図2、図3)。スマホアプリ版はそ... 続きを読む
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた | DevelopersIO
OpenAIがリリースした高精度な音声認識モデル”Whisper”を使って、オンライン会議の音声を書き起こししてみた こんちには。 データアナリティクス事業本部 機械学習チームの中村です。 2022/09/22の夕方ごろ、OpenAIが音声認識ですごいものを出したらしいというニュースが社内のSlackをにぎわせていました。 個人的には、... 続きを読む
iOSのBuild In Sound Analysisを使った音声認識で著作権侵害を防ぐ!
こんにちは。PayPayフリマでiOSアプリ開発を担当している續橋(@tsuzuki817)です。 PayPayフリマは2021年に画像の代わりに動画で商品の動きや細部を伝えられる動画出品機能をリリースしました。(プレスリリース:PayPayフリマ、5~30秒の動画で商品の動きや細部を伝える「動画出品」機能を提供開始) 動画投稿できるとい... 続きを読む
iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)
アプリや専用デバイスを使った、日本語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識のテクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応す... 続きを読む
Googleマップから電話があり普通に応対したところ、最後の最後で自動電話と分かり、音声認識の進歩に驚いた話
稲田エイジ|BtoB/Web戦略・Webマーケティング・HubSpot @inada_h 電話を取ると「Google マップです」と男性から電話。 Google「この電話はGoogle マップの店舗様の営業時間を自動で確認しております」 ぼく「はい」 Google「そちらの営業時間を教えてください」 ぼく「月曜から金曜の9時〜18時です」 Google「土曜日と... 続きを読む
OracleのIaaS向けAIサービス群、日本でも提供へ テキスト分析や音声認識など6種類
日本オラクルが、AIサービス群「Oracle Cloud Infrastructure AI」を日本でも提供する。一部サービスについては既に提供を始めているという。 日本オラクルは11月22日、米Oracleが3日(現地時間)に発表したAIサービス群「Oracle Cloud Infrastructure AI」(OCIAI)について、日本でも提供すると明かした。 OCIAIは、Ia... 続きを読む
音声認識とは?基礎知識とコールセンターへの導入メリット・注意点
音声認識とはコンピューターに音声を自動認識させる技術です。人間が発する音声をコンピューターに理解させることで、話し言葉をテキストに変換したり、音声の特徴から発声者を識別したりする技術を、音声認識と呼びます。 私たちにとって身近な音声認識はスマホの音声入力ですが、実は、現在さまざまな業界において新た... 続きを読む
中国が進める世界規模のデータ収集 「リスク認識を」:朝日新聞デジタル
監視、検閲、諜報(ちょうほう)、世論工作――。中国は権威主義国家ならではのデータ収集体制を築き、国内統治や対外影響力を強化する。たとえば、中国のデータ分析会社「中訳語通科技(GTCOM)」は、翻訳や音声認識などを通じて世界規模で事業を展開。中国はこうした企業が収集した膨大なデータを吸い上げ、権力強化のた... 続きを読む
【RaspberryPi】Amazon Echoを使った音声認識でNode-REDの処理を行う - uepon日々の備忘録
以前のエントリーの続きになります。今回はAmazon Echoの音声認識を使用してNode-REDの処理を行います。 Node-REDでAmazon Echoを使用するノードは実は80番ポートでしか待機ができないようになっています(昔は別ポートでもできたみたいな感じ?)そのため、ポート80を別のプロセスで使用していると使用できないという状... 続きを読む
「このアニメキャラの声優は?」をAIが解決 音声認識でせりふを分析 21年に新サービス - ITmedia NEWS
ディップが、AIによる音声認識を利用してアニメキャラクターのせりふから声優を検索するアプリを発表。利用料は無料で、2021年春に提供を始める。 人材事業などを手掛けるディップは12月23日、アニメの視聴中にスマートフォンをテレビなどにかざすと、キャラクターを担当する声優を検索・表示するアプリ「ANIVO」を発表... 続きを読む
「この声、どの声優さん?」聞かせて判定しちゃうアプリ 精度に関心集まる | ニコニコニュース
2020年12月23日、アプリに声を聞かせるだけで声優の名前と作品がすぐに分かるとうたう「ANIVO|アニボ」の事前登録がスタートした。 ライトファンのニーズに応える 「ANIVO」は、求人情報の「バイトル」などで知られるディップ(東京都港区)が提供するスマートフォン向けアプリ。音声認識によるAIの音声分析で、声から... 続きを読む
「未来はまだまだ先かな」先日発売されたばかりの新型電気自動車「ホンダe」で音声認識によるナビ設定しようとしたら漫才になった - Togetter
リンク Honda公式ホームページ Honda e 公式情報ページ こちらはHonda eの公式情報ページです。最新のWEBカタログで、スタイリングやインテリア、荷室をはじめとする、Honda eの様々な魅力をチェックいただけます。 6 users 2477 続きを読む