タグ「音声認識」 - はてブログ

タグ音声認識

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 56件)

培養したヒトの脳組織を使ってコンピューターを構築することに成功、日本語の音声認識にも対応

2023/12/12 122 users コンピューターひと脳組織成功日本語

人間の幹細胞を基に作られた脳オルガノイド(ミニ脳)を電子チップに接続した「ブレイノウェア」と呼ばれるセットアップを構築して、簡単な計算タスクを実行することに成功したことが、インディアナ大学ブルーミントン校のエンジニアであるフェン・グオ氏らの研究チームによって報告されました。 Brain organoid reservoir... 続きを読む

トヨタ、車載OS「アリーン」を既存車種から搭載　次世代EVに先駆けて｜自動車メーカー｜紙面記事

2023/09/07 84 users SDV レコメンドトヨタ自動車車載OS 人工知能

トヨタ自動車は、開発中の車載ＯＳ（基本ソフト）「アリーン」を次世代型電気自動車（ＥＶ）に先駆けて既存の車両に搭載する方針だ。人工知能（ＡＩ）技術を活用した高度な音声認識やレコメンド（推薦）機能、販売後の機能更新サービスなどを顧客にいち早く体験してもらうのが狙い。車両開発でＳＤＶ（ソフトウエア・デ... 続きを読む

GPTの仕組みをちゃんと勉強したい本 - きしだのHatena

2023/04/25 449 users GPT ニューラルネットワーク概観 CNN 機械学習

やっぱGPTを仕組みから勉強したい、という本をいくつか見つけたのでまとめておきます。まず理論的な概要。機械学習からニューラルネットワーク、CNNでの画像処理、トランスフォーマーでの自然言語処理、音声認識・合成、そしてそれらを組み合わせたマルチモーダルと章が進むので、理論的な概観を得るのにいいと思いま... 続きを読む

［速報］「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開

2022/11/09 64 users GitHub コーディング HEY プレビュー基調講演

［速報］「Hey, GitHub! 」、GitHubが音声認識による操作とコーディングを可能にする実験的機能をプレビュー公開 GitHubは、年次イベント「GitHub Universe 2022」の基調講演で、音声によるGitHubの操作やコーディングを可能にする実験的機能「Hey, GitHub!」をプレビュー公開しました。 'Hey, GitHub!' is an experimen... 続きを読む

iPhone対応“自動文字起こし”アプリ「UDトーク」賢い使い方を開発者に聞いた (1/5)

2022/05/21 574 users UDトーク iPhone対応 iPhone コロナ禍自動文字

アプリや専用デバイスを使った、日本語の「自動文字起こし」に関連するサービスには、近年多くの関心が集まっている。背景にはスマホやAIを活用する音声認識のテクノロジーが飛躍を遂げたことや、コロナ禍の影響を受けてリモートワークが普及したことなどがある。iPhoneに対応する「UDトーク」も自動文字起こしに対応す... 続きを読む

Googleマップから電話があり普通に応対したところ、最後の最後で自動電話と分かり、音声認識の進歩に驚いた話

2022/01/25 391 users 進歩 Googleマップ Hubspot 最後 BtoB

稲田エイジ｜BtoB／Web戦略・Webマーケティング・HubSpot @inada_h 電話を取ると「Google マップです」と男性から電話。 Google「この電話はGoogle マップの店舗様の営業時間を自動で確認しております」ぼく「はい」 Google「そちらの営業時間を教えてください」ぼく「月曜から金曜の9時〜18時です」 Google「土曜日と... 続きを読む

「マイクロソフト」史上初の「完全ワイヤレスイヤホン」がすごすぎる！ | TABI LABO

2020/05/18 165 users マイクロソフト TABI LABO 円盤ワイヤレスイヤホン

「マイクロソフト」からワイヤレスイヤホン「Surface Earbuds」が発売。Windows10と連携することで操作をおこなえるなど、画期的なモノになっているらしい！同社初となるこの完全ワイヤレスイヤホンは、タッチセンサーと音声認識に対応するマイクを搭載。大きな円盤のような外見が印象的で、ファッション性の高さも抜群... 続きを読む

Googleが発音のチェックを行う音声認識サービスを開始 - GIGAZINE

2019/11/15 92 users 格段単語音声ファイル機械学習 GIGAZINE

By Prostock-studio Googleが単語の発音チェックを行う新しいサービスを2019年11月14日(木)から開始しました。音声ファイルをAIが認識して文字起こしをしたり、声を出さずに音声入力をしたりと音声認識の技術は日々進化しています。Googleによる発音チェック機能は機械学習を用いた技術となっており、英語学習を格段に効... 続きを読む

Data Associate - Japanese（契約社員） - ジョブID：804692 | Amazon.jobs

2019/04/15 54 users Annotation Japanese メタデータテキスト

説明Amazonではご自宅で日本語のデータ処理を行うData Associateを募集しています。このチームではAlexaの音声認識を支える様々なデータ処理に携わっています。Data Associateは音声データをテキストとして入力するTranscription、そのテキストにメタデータを付与するAnnotationなど、データを分析するチームからの様々... 続きを読む

Google Chrome上でマイクから録音した声をリアルタイムで文字に書き起こしてくれる「The Recording Studio」 - GIGAZINE

2019/01/22 583 users GIGAZINE ウェブツールマイクリアルタイム文字

「Recording Studio」は、Chromeに対応している音声認識API「SpeechRecognition API」を利用してマイクから録音した声を音声認識によってその場で文字に起こしてくれるウェブツールです。オンラインのブラウザ上で動作するのでダウンロードやインストールは不要で、開発したみずちさんが無料で公開しています。 Recordin... 続きを読む

ブラウザでマイク入力から書き起こしを行うツールを作った - mizchi's blog

2019/01/20 443 users mizchi's blog マイク入力ツールブラウザ音声

Chrome でマイクからの音声を録音して、その音声認識で書き起こしも同時に行うツールを作った。 recording-studio.netlify.com で遊べる。 Chrome に搭載されてる Web Standard Proposal? の SpeechRecognition API を使っている。 developer.mozilla.org Chrome のみだが、 PC Chrome だけではなく Android Chrome でも... 続きを読む

ほぼ無音の「吸った声」で音声認識　マイクロソフト研究 - ITmedia NEWS

2018/10/18 77 users ITmedia News 無音人前ひそひそ声音声入力

「音声入力は楽だが、人前で話すのは恥ずかしいし聞かれたくない」――こんな問題を解決してくれるかもしれない、新しい音声認識技術を米Microsoft Researchが10月5日（現地時間）に発表した。ひそひそ声よりも小さな声での音声認識を可能にする。「サイレントボイス」と名付けられたこの技術は、一般的な「息を吐いての... 続きを読む

動的なDeepLearningによる時系列データの予測 | Amazon Web Services ブログ

2018/08/24 74 users deeplearning アプリケーション予測進行経過

Amazon Web Services ブログ動的なDeepLearningによる時系列データの予測時間の経過とともに展開していくイベントを予測することは、オプション価格決定や、病気の進行、音声認識、サプライチェーン管理などを扱う多くのアプリケーションにとって不可欠な機能です。と同時に、こうした予測は難しいことでも知られてい... 続きを読む

AI人材争奪、世界で70万人不足　日本勢は米中に後れ: 日本経済新聞

2018/06/24 292 users ＡＩ人材争奪火花日本勢日本経済新聞米中

世界で人工知能（ＡＩ）の専門家の争奪戦が過熱している。車の自動運転や顧客データの解析、音声認識や顔認証システム――。経済のデジタル化が進むなか、ビジネスの多くの場面でＡＩに精通した技術者が求められる。世界では70万人のＡＩ人材が不足しているとの調査もあり、21世紀の技術覇権を争う米中は人材獲得に火花を... 続きを読む

音声認識を使った「文字起こしの自動化」を3つの方法で試して比較！夢の「寝て起きたらテキスト化」は可能なのか？一晩寝たら、これがテキストになっていれば…。インタビューや座談会、講演会のスピーチ、身近なところでは会議の議事録など、会話を録音する機会もあります。そしてもれなく、その後の用途のため、録音音声を聞きながらテキスト化するといった「文字起こし」作業が必要になるでしょう。通常であれば、... 続きを読む

［速報］「Amazon Transcribe」発表、音声認識でテキスト変換、複数話者も予定。翻訳機能「Amazon Translate」も発表。AWS re:Invent 2017 － Publickey

2017/11/29 62 users AWS 米ラスベガス Publickey 音声年次イベント

Amazon Web Services（AWS）は、米ラスベガスで開催中の年次イベント「AWS re:Invent 2017」で、音声認識サービス「Amazon Transcribe」を発表しました。 Amazon Transcribeは、MP3の音声ファイルを読み込んで音声認識を行い、その内容をテキストに変換するというもの。電話の音声のような品質のよくない音声にも対応。今後、複数の話者にも対応... 続きを読む

米IBM、ＡＩ「ワトソン」無料に　アマゾンに対抗　　：日本経済新聞

2017/10/26 291 users ワトソン裾野 IBM ゴム米IBM

米ＩＢＭは11月から主力製品である人工知能（ＡＩ）「ワトソン」の無料提供に踏み切る。企業などは翻訳や性格分析など６つの基本機能を期間の制限なく世界中で利用できるようになる。米アマゾン・ドット・コムが音声認識などに強いＡＩで先行するが、ＩＢＭは汎用性の高い基盤システムとして業界標準化を目指す。無料にすることで開発者の裾野が広がり、ＡＩ活用の動きが産業界で加速しそうだ。　米ＩＢＭは、ワトソンの「会話... 続きを読む

かくしてグーグルは、独自の「AI専用チップ」を開発した──音声認識や「AlphaGo」を支える驚異の技術｜WIRED.jp

2017/04/18 52 users AlphaGo グーグル驚異人工知能領域

INSIGHT 2017.04.18 TUE 17:00 かくしてグーグルは、独自の「AI専用チップ」を開発した──音声認識や「AlphaGo」を支える驚異の技術あらゆる領域で人工知能（AI）の可能性を探るグーグルが直面したのは、AIの性能が高くなればなるほど膨大な規模のデータセンターが必要になるということだった。彼らの解決策は「AI専用チップ」をつくること。巨大なインターネット帝国を支える小さ... 続きを読む

自宅IoTのため家にある電子機器をRaspberry Pi+Homebridge使ってSiriの音声認識で繋ぎまくってみた - karaage. [からあげ]

2017/03/01 460 users 電波部員 KARAAGE おうちハック生活向上

2017 - 03 - 02 自宅IoTのため家にある電子機器をRaspberry Pi+Homebridge使ってSiriの音声認識で繋ぎまくってみた電波生活向上自宅IoTに挑戦引越しを機に家庭内IoTに挑戦しようと思い立ちました。なんせ自宅IoT友の会の部員ですからね！というわけで、「家庭内IoT」とか「おうちハック」と名前が付く記事を見かけるとひたすらブクマし続ける日々を過ごしてい... 続きを読む

スマートリモコンの価格破壊。eRemote(RM mini)なら1300円で家電をSiriで操作できる - おばかさんよね

2017/02/04 418 users Siri IoT HomeKit alexa 室温

IoT スマートリモコンの価格破壊。eRemote(RM mini)なら1300円で家電をSiriで操作できる WiFi対応学習リモコンが欲しくなった。やりたいことはシンプル。 Homekit(Siriの音声認識)で家電をコントロールしたい室温や時間などに応じてIFFT経由でエアコンを自動制御したい Alexa(Amazon echo）でも制御したい Google Homeにも対応しと... 続きを読む

Amazonの音声認識「Alexa」は世界のIoTを席巻し「スマートフォンの次」のプラットフォームの覇者となりつつある - GIGAZINE

2017/01/17 481 users GIGAZINE ALEX IoT 手中 Echo

Amazonが販売するスピーカー型の音声アシスタント端末「 Amazon Echo 」は、 Amazonのハードウェア史上最大のヒット作になりました。しかし、本当の大ヒットはEchoではなくその中身である音声認識機能「 Alexa 」によってこれからもたらされるのであって、Alexaを武器に「スマートフォンの次」のプラットフォームをAmazonが手中に収めつつあるという指摘があります。 Alex... 続きを読む

プログラマとしてのキャリアを脅かす反復運動過多損傷の痛みをどう解消したか | キャリア・働き方 | POSTD

2016/12/13 73 users プログラミング POSTD 理論手段実行

タイピング時に痛みを感じつつ、プログラマとして働き続けるのは非常に辛いことでしょう。私は痛みが消えるまで何年もの間、プログラミングなしの生活を余儀なくされました。そんなある日、私は何が起きているのかに気付いたのです。そして自らの理論を検証する手段を思い付き、それを実行に移すと、痛みは消え去りました。タイピング時に痛みを感じつつ、プログラマとして働き続けるのは非常に辛いことでしょう。音声認識という代... 続きを読む

［速報］「Amazon AI」として、画像認識／テキスト音声変換／音声認識と自然言語理解の3つを発表。AWS re:Invent 2016 － Publickey

2016/11/30 111 users 傘下ラスベガス Publickey イメージ同社

Amazon Web Servicesは、ラスベガスで開幕した同社のイベント「AWS re:Invent 2016」で、「Amazon AI」傘下のサービスとして、画像認識、テキスト音声変換、音声認識と自然言語理解の3つを発表しました。「Amazon Rekognition」はイメージをAPIかSDK経由で渡すと、その画像に何が写っているのかを検出するサービス。例えばある画像を渡すと、女性が写... 続きを読む

(1 - 25 / 56件)

次の25件 »