タグ 音声認識
人気順 5 users 50 users 100 users 500 users 1000 users人間の脳細胞を電極の上に置いてつくった人工知能。日本語の音声認識を実現【研究紹介】
人間の脳細胞を電極の上に置いてつくった人工知能。日本語の音声認識を実現【研究紹介】 2023年12月13日 山下 裕毅 先端テクノロジーの研究を論文ベースで記事にするWebメディア「Seamless/シームレス」(https://shiropen.com/)を運営。 米Indiana University Bloomingtonなどに所属する研究者らが発表した論文「Brain... 続きを読む
培養したヒトの脳組織を使ってコンピューターを構築することに成功、日本語の音声認識にも対応
人間の幹細胞を基に作られた脳オルガノイド(ミニ脳)を電子チップに接続した「ブレイノウェア」と呼ばれるセットアップを構築して、簡単な計算タスクを実行することに成功したことが、インディアナ大学ブルーミントン校のエンジニアであるフェン・グオ氏らの研究チームによって報告されました。 Brain organoid reservoir... 続きを読む
ChatGPT、“目”と“耳”の実装を発表 写真の内容を認識、発話機能でおしゃべりも可能に
米OpenAIのチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載された。今後2週間かけて、PlusユーザーとEnterpriseユーザーに展開するという。 米OpenAIは9月25日(現地時間)、同社のチャットAI「ChatGPT」に、画像認識、音声認識、発話機能が搭載されたと発表した。今後2週間かけて、PlusユーザーとEnterpr... 続きを読む
トヨタ、車載OS「アリーン」を既存車種から搭載 次世代EVに先駆けて|自動車メーカー|紙面記事
トヨタ自動車は、開発中の車載OS(基本ソフト)「アリーン」を次世代型電気自動車(EV)に先駆けて既存の車両に搭載する方針だ。人工知能(AI)技術を活用した高度な音声認識やレコメンド(推薦)機能、販売後の機能更新サービスなどを顧客にいち早く体験してもらうのが狙い。車両開発でSDV(ソフトウエア・デ... 続きを読む
Googleが音声から「テキストと音声の両方」に翻訳できる大規模言語モデル「AudioPaLM」を発表
Googleが「AudioPaLM」を発表しました。AudioPaLMはテキストベースの言語モデルである「PaLM 2」と音声ベースの言語モデルである「AudioLM」を統合したマルチモーダルアーキテクチャであり、テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用できるとのことです。 [2306.12925] AudioPaLM:... 続きを読む
GPTの仕組みをちゃんと勉強したい本 - きしだのHatena
やっぱGPTを仕組みから勉強したい、という本をいくつか見つけたのでまとめておきます。 まず理論的な概要。 機械学習からニューラルネットワーク、CNNでの画像処理、トランスフォーマーでの自然言語処理、音声認識・合成、そしてそれらを組み合わせたマルチモーダルと章が進むので、理論的な概観を得るのにいいと思いま... 続きを読む
デザイナーの仕事は AI でラクになる?実際に試してみた|Goodpatch Blog グッドパッチブログ
こんにちは。Goodpatch UIデザイナーの金谷です。 最近、ChatGPTで話題沸騰のAI。機械学習、ディープラーニングなどの技術の進歩が著しく、自然言語処理、画像認識、音声認識などの分野で、驚異的な精度と高速な処理能力を発揮しています。 ChatGPTにいろいろな「仕事」をさせる実験が流行っていますが、私自身もAIに負... 続きを読む
「Skype」に「ほんやくコンニャク」機能? 音声認識+自然言語処理で異言語対話を容易に/話した言葉を即座に翻訳して自分の声とテキストで伝達。2023年にリリースへ
[速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開
[速報]「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開 GitHubは、年次イベント「GitHub Universe 2022」の基調講演で、音声によるGitHubの操作やコーディングを可能にする実験的機能「Hey, GitHub!」をプレビュー公開しました。 'Hey, GitHub!' is an experimen... 続きを読む
音声認識が急激に進化、実用レベルになったフリーの文字起こしソフト
会議録を作る際、録音を繰り返し聞いて文字起こしするのは大変だ。最近は音声認識の技術が急速に進化し、無料でテキスト化できるアプリもある。使わないのは損だ。 「LINE CLOVA Note」は認識精度が高く、複数の話者を区別できるので実用性が高い(図1)。利用にはLINEアカウントが必要(図2、図3)。スマホアプリ版はそ... 続きを読む
iOSのBuild In Sound Analysisを使った音声認識で著作権侵害を防ぐ!
こんにちは。PayPayフリマでiOSアプリ開発を担当している續橋(@tsuzuki817)です。 PayPayフリマは2021年に画像の代わりに動画で商品の動きや細部を伝えられる動画出品機能をリリースしました。(プレスリリース:PayPayフリマ、5~30秒の動画で商品の動きや細部を伝える「動画出品」機能を提供開始) 動画投稿できるとい... 続きを読む
iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)
アプリや専用デバイスを使った、日本語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識のテクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応す... 続きを読む
Googleマップから電話があり普通に応対したところ、最後の最後で自動電話と分かり、音声認識の進歩に驚いた話
稲田エイジ|BtoB/Web戦略・Webマーケティング・HubSpot @inada_h 電話を取ると「Google マップです」と男性から電話。 Google「この電話はGoogle マップの店舗様の営業時間を自動で確認しております」 ぼく「はい」 Google「そちらの営業時間を教えてください」 ぼく「月曜から金曜の9時〜18時です」 Google「土曜日と... 続きを読む
音声認識とは?基礎知識とコールセンターへの導入メリット・注意点
音声認識とはコンピューターに音声を自動認識させる技術です。人間が発する音声をコンピューターに理解させることで、話し言葉をテキストに変換したり、音声の特徴から発声者を識別したりする技術を、音声認識と呼びます。 私たちにとって身近な音声認識はスマホの音声入力ですが、実は、現在さまざまな業界において新た... 続きを読む
「この声、どの声優さん?」聞かせて判定しちゃうアプリ 精度に関心集まる | ニコニコニュース
2020年12月23日、アプリに声を聞かせるだけで声優の名前と作品がすぐに分かるとうたう「ANIVO|アニボ」の事前登録がスタートした。 ライトファンのニーズに応える 「ANIVO」は、求人情報の「バイトル」などで知られるディップ(東京都港区)が提供するスマートフォン向けアプリ。音声認識によるAIの音声分析で、声から... 続きを読む
「マイクロソフト」史上初の「完全ワイヤレスイヤホン」がすごすぎる! | TABI LABO
「マイクロソフト」からワイヤレスイヤホン「Surface Earbuds」が発売。Windows10と連携することで操作をおこなえるなど、画期的なモノになっているらしい! 同社初となるこの完全ワイヤレスイヤホンは、タッチセンサーと音声認識に対応するマイクを搭載。大きな円盤のような外見が印象的で、ファッション性の高さも抜群... 続きを読む
グーグル最新AI、読解力も人間超え 驚異の学習法 :日本経済新聞
画像認識や音声認識などに続き、文章読解の分野でも人工知能(AI)が人間の平均レベルを超え始めた。米グーグルの新AI技術「BERT(バート)」が壁を突き破った。検索や情報収集などの効率が飛躍的に高まる可能性が出てきた。 AIに文章読解は不可能――。数年前までこれが常識だった。日本の国立情報学研究所(NII)が2011... 続きを読む
[速報] 医療に特化した音声認識の新サービス Amazon Transcribe Medical が発表されました #reinvent | Developers.IO
LINE、AIが電話応対する「LINE AiCall」、一部店舗で予約受付の実証実験を開始 - CNET Japan
LINEは11月20日、エビソルと「俺のGrill&Bakery 大手町」において、AI電話応対サービス「LINE AiCall」の実証実験を開始したと発表した。 これは、LINEが保有する音声認識、チャットボット、音声合成の技術を組み合わせることで、自然な会話が可能なAI電話応対サービスを実現する、AIソリューションサービス事業「LINE ... 続きを読む
グーグル担当者が明かす、「Pixel 4」の音声認識の実力 | 日経 xTECH(クロステック)
米グーグル(Google)は、2019年10月に発売したスマートフォン「Pixel」シリーズの最新機種「Pixel 4」に、さまざまな新機能を搭載した(関連記事)。この中で、「仕事に役立つ」と報道関係者やビジネスパーソンなどから注目を集めた機能が、新しい音声レコーダーアプリである。現状で対応するのは英語だけにとどまるも... 続きを読む
OKでもHeyでもない。「ねぇ」で勝負に出たアイリスオーヤマの音声認識テレビ | Forbes JAPAN(フォーブス ジャパン)
OKでもなければ、Heyでもない。“ねぇ” で黒物家電に乗り込んできたアイリスオーヤマ。同社初となる液晶テレビは「音声認識」を携えての登場となった。 大画面薄型液晶テレビ「LUCA」(るか)は、11月20日よりフロントスピーカーモデル、12月5日よりベゼルレスモデルを発売する。価格は、上位モデル55型でフロントスピー... 続きを読む
Googleが発音のチェックを行う音声認識サービスを開始 - GIGAZINE
By Prostock-studio Googleが単語の発音チェックを行う新しいサービスを2019年11月14日(木)から開始しました。音声ファイルをAIが認識して文字起こしをしたり、声を出さずに音声入力をしたりと音声認識の技術は日々進化しています。Googleによる発音チェック機能は機械学習を用いた技術となっており、英語学習を格段に効... 続きを読む
音声認識とは|最新技術や基礎知識・仕組み・現在の事例を解説 | Ledge.ai
ディープラーニングの登場やスマートフォンへの搭載により、急速に普及したAI(人工知能)の技術に「音声認識」があります。本稿では、「音声認識」の定義から仕組み、事例、技術動向について詳しく解説します。 Photo by Kristin Baldeschwiler on Pixabay 音声認識とは、コンピュータにより音声データをテキストデータ... 続きを読む
安易にAIを使って大丈夫? AIにまつわる法と倫理と社会課題 (1/2) - ITmedia NEWS
AIの活用が進む一方で、法的、倫理的な観点からAIの課題が明らかなってきました。AIから減らすべき性質について、法とITに詳しい中央大学の平野晋教授に話を聞きました。 今、AIがさまざまな分野で注目を集めています。自動運転や音声認識、人間を打ち負かすようなAI囲碁プレイヤーなど、AIを活用したモノやサービスが続... 続きを読む
AIが声からウソを見抜く 劇的に進化する音声認識が変える世界 (1/5) - ITmedia NEWS
ビジネスに役立つAIの基礎知識について分かりやすく解説する本連載。前回の記事から、いまAIが具体的にどのようなアプリケーションに使われているかを紹介している。今回は音声認識の分野について考えてみよう。 連載:よくわかる人工知能の基礎知識 いまや毎日のようにAI(人工知能)の話題が飛び交っている。しかし、... 続きを読む