タグ 発話
人気順 5 users 50 users 100 users 500 users 1000 usersAmazon Bedrockで発話での注文から、商品名と数量を抽出し、商品マスタの商品名と突合してみた[AIチャットボット] | DevelopersIO
Amazon Bedrockで発話での注文から、商品名と数量を抽出し、商品マスタの商品名と突合してみた[AIチャットボット] はじめに Amazon Connect、Amazon Bedrock、Whisper APIを組み合わせて、電話で発話された注文内容(商品名と数量)を認識し、商品マスタと突合する方法とその精度を検証しました。 精度の確認方法は、発... 続きを読む
声帯の損傷やマヒがある人でも話せるようになる「喉に貼るパッチ」が開発される
by Jun Chen Lab at UCLA 咽喉がんの手術や声帯ポリープなどの影響で声帯が使えなくなってしまった人でも話せるようになる「喉に貼るパッチ」を、カリフォルニア大学ロサンゼルス校の研究チームが開発しました。このパッチは小さくて伸縮性があり、発話に伴う筋肉の動きのみで発電するためバッテリーやプラグも不要との... 続きを読む
[電話予約の無人化]Amazon Connect + GPT-4 Turboで、発話の「時刻と日付」の言い回しをどの程度認識してくれるか調査 – Amazon Connect アドベントカレンダー 2023 | DevelopersIO
[電話予約の無人化]Amazon Connect + GPT-4 Turboで、発話の「時刻と日付」の言い回しをどの程度認識してくれるか調査 – Amazon Connect アドベントカレンダー 2023 Amazon Connect アドベントカレンダー 2023、4日目の記事です! クラスメソッドとギークフィードさん、スカイアーチHRソリューションズ さんの有志が募っ... 続きを読む
[電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 | DevelopersIO
[電話予約の無人化]Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(日付,時間など)を抽出 はじめに Amazon Connect + GPT-4 JSONモード + Whisperで、1回の発話から予約情報(電話番号,日時,名前,人数)を正しく抽出できるか検証しました。 コールセンターでは、有人対応から無人対応に変更したい... 続きを読む
Amazon Connect + Whisper + GPT-4 Turboで、発話から個人情報(名前、住所、生年月日)を正しく認識できるか試してみた | DevelopersIO
構成 構成としては、下記の通りです。 Connectのフローの詳細は下記の通りです。 例として、発話で住所を認識させる処理の流れは以下のとおりです。 コンタクトフロー内で「メディアストリーミングの開始」ブロックを使って、Kinesis Video Stream(KVS)への音声のストリーミングを開始します。 顧客は、住所を含めた発... 続きを読む
Amazon ConnectとKinesis Data Streamsを使用し、エージェントの介在がないIVRの場合でも電話中のユーザーの発話を録音する方法 | DevelopersIO
Amazon ConnectとKinesis Data Streamsを使用し、エージェントの介在がないIVRの場合でも電話中のユーザーの発話を録音する方法 はじめに この記事では、Amazon ConnectとKinesis Data Streams(以下、KDS)を用いて、エージェントが介在しなくても、ユーザーの発話を録音する方法を紹介します。 Connectでは、下記のコ... 続きを読む
Amazon ConnectとLexでのコールセンター向けチャットボットの構築において、「音声入力の最大時間」「発話の最大待機時間」「発話終了判定の最大時間」の仕様を確認してみた | DevelopersIO
Amazon ConnectとLexでのコールセンター向けチャットボットの構築において、「音声入力の最大時間」「発話の最大待機時間」「発話終了判定の最大時間」の仕様を確認してみた はじめに 最近、下記の記事にある、クラウド型コンタクトセンターサービスであるAmazon Connectと、高度な自然言語モデルを備えたフルマネージド... 続きを読む
「知らんけど」はそういうことじゃねーよ!
関西人の間で「知らんけど」が流行るワケ。日本語研究者に聞いてみた https://news.yahoo.co.jp/articles/cba6f55eb98978a08ee000017b34e9dc01378431 用例も解説も適当すぎる。全然ダメ! 関西はボケとツッコミの文化といわれるがフリとツッコミという方がより正確だと思う 誰かの発話に対して話の中に「ツッコミどころ... 続きを読む
進化する音声合成技術は声優の敵か味方か、大手事務所トップが本音で語る | 日経クロステック(xTECH)
音声合成技術の進化が目覚ましい。人間に近い“自然な発話”が可能になったことで、用途が急速に広がった。歌声合成技術や声質変換技術といった派生技術も実用化に向けた動きが進んでいる。 今の音声合成技術では、声優などによる良質な収録音声が欠かせない。声をなりわいとする声優からすると、音声合成技術の普及は声優... 続きを読む
VTuberなどに使われる主要なリップシンク方式の比較メモ - Qiita
はじめに (この記事はエンジニア以外の方でも分かるような内容になっています) VTuberで使われる技術の一つにリップシンクというものがあります。発話に併せてアバターの口を人と同じように動かす技術のことです。 また、二次元寄りの表現をする場合には、本物の人と同じように滑らかに動かすよりも、緩急を付けてアニメ... 続きを読む
3歳児のYouTubeからの言語習得と小笠原混合言語のあいさつ - 誰がログ
3歳児のおやすみのあいさつ さいきんの我が家の3歳児の就寝時のあいさつが「おやすみバイバイまた見てね」になっています(私はこの後も起きることが多いため。寝室からの召喚はたまに発生)。 「バイバイ」の後に「また見てね」と続けるのは明らかにYouTubeで見ている動画からの影響です(動画に出てくるこどもの発話を... 続きを読む
日本の「発話阻害銃」が話題(動画)|WIRED.jp
誰かの発話を阻害(Jam)して話をやめさせる装置『SpeechJammer』のプロトタイプをふたりの日本人研究者が開発し、その効果を紹介する動画を公開した。 彼らは論文[PDFファイル。日本語PDFはこちら]で、われわれは「適切に発言権の交代ルールを規定し、それを遵守しなければならない」と述べている。しかし、「いたずら... 続きを読む
ChainerでWaveNetによる音声合成のチュートリアルを書いてみた - 金融と工学のあいだ
Introduction このチュートリアルではWaveNetを使ったボコーダーにより人の音声を合成します。 ボコーダーとは、音声をパラメータ化した入力を元に音声を合成することです。例えば、ロボットボイスは、人の音声からその発話の特徴量をパラメータとして取得し、それを元にロボットの音色の音声を合成しています。そのため... 続きを読む
コミュニケーション実践「話す=発話」編〜コミュニケーションのアンテナ〜 - Forkwell Press
ワールドカップが終わり寝不足の日々が解消されて、皆さんご機嫌よくお過ごしでしょうか?連載「コミュニケーションのアンテナ」二回目となりました。 前回はエンジニアこそコミュニケーション能力が大事である、コミュニケーション能力には三段階あり 今までやったこと、できることが相手に伝えられない 今までやったこ... 続きを読む
日常会話の言語においては、「すべて」や「かならず」などの文言を入れて..
日常会話の言語においては、「すべて」や「かならず」などの文言を入れていなければ全称命題ではなくて傾向論であるほうが一般的なんだけど、 ちょくちょくそこのところを勘違いして「そうじゃない人もいる! 主語が大きい!」みたいに発狂してる人が少なくないのも事実だ。 「沖縄の人は色黒だ」という発話に「沖縄にいると 必ず 色黒になる」「沖縄に色白な人間は 一切 存在しない」とかそういう意図は通常含まれてい... 続きを読む
ソニーと共同通信デジタル、バーチャルアナウンサー「沢村碧」を商用サービス化 - CNET Japan
ソニーと共同通信デジタルは8月3日、文字情報を音声に変換し、バーチャルアナウンサー「沢村碧」(さわむらみどり)が自動で読み上げるという、情報読み上げ動画作成システム「 アバターエージェントサービス 」の提供を開始すると発表した。 これはテキスト原稿と素材画像を用意し、文字情報を入力すると音声合成エンジンによって自然な発話に変換。それと同時にCGキャラクターが生成され、連動した形で表現を行う映像と音... 続きを読む
東芝、声のプラットフォーム「コエステーション」を開発--SNSやゲームの発話に活用 - CNET Japan
東芝デジタルソリューションズは7月20日、東芝コミュニケーションAI「RECAIUS(リカイアス)」の音声合成技術を活用した「声」のプラットフォーム「コエステーション(ベータ版)を開発したと発表した。声を使ってもらいたい人と使いたい人をつなぐ。 コエステーションは、一般ユーザーがスマートフォンのアプリを使用し、指定の文章を読み上げて声の特徴を学習させることで、自分の声の分身である「コエ」を生成。S... 続きを読む
雑談の技術について③ 上級編 傾聴と発話について - 発達障害就労日誌
2017 - 06 - 30 雑談の技術について③ 上級編 傾聴と発話について 本エントリの前に告知です www.onecareer.jp ワンキャリア様でまた文章を書かせていただきました。是非ご一読ください。ちょっとした思い出語りですが、仕事のモチベーションの持ち方、欲望の肯定みたいなお話をしました。働いていくためのモチベーションコン トロール 、重要なところだと思います。よろしくお願いします。... 続きを読む
ヘイトスピーチと言論の自由につき思いつき - インタラクティヴ読書ノート別館の別館
生煮えで恥を晒すところが多いがちょっと書いてみた。 == 応用哲学会のシンポで若い人たちが報告したヘイトスピーチの言語哲学的解剖はとても面白くて論文になるのが待たれるけど、帰りにちょっと大庭弘継君と話した通りいろいろ難しいところもある。 言語行為論を用いてヘイトスピーチを発話行為であり、通常「言論の自由」が想定している発話と行為の切断、行為から切断された独立の言論空間の設定を悪用したものである、と... 続きを読む
KDDIら、産学官連携で「アクティブ・ラーニング」の実証実験--記述や発話を分析 - CNET Japan
KDDI総合研究所、静岡大学、今治市、京セラドキュメントソリューションズは1月24日、ICTを活用したアクティブ・ラーニングの授業において、記述や発話といった学習記録データを収集・分析し、それらに基づいた学習評価や授業評価につながるソリューションの有用性を検証するための実証研究を開始すると発表した。 研究期間は2017年1月~3月(準備期間は2016年9月~12月)。実施校は、今治市立の波止浜小学... 続きを読む
対話破綻検出チャレンジ
トップページ 対話破綻検出チャレンジでは,対話の破綻(システムが文脈的に不適切な応答をした箇所)を検出する技術(対話破綻検出)に焦点を絞り,参加者が各自開発した手法や技術を持ち寄ることで互いの技術を高め合うことを目的とします. 対話破綻検出は将来の対話システムにとって極めて有用な技術となり得ます.たとえば,システムがある発話をすると対話が破綻するという可能性を事前に推定できれば,それが回避できる可... 続きを読む
【レビュー】歌って話せるフリーの音声合成ライブラリ「MikoVoice」 - 窓の杜
レビュー 歌って話せるフリーの音声合成ライブラリ「MikoVoice」 ひらがなのテキストをそのまま発話。音声記号を加えれば高低・強弱などを加えることも (2015/6/3 06:00) 「MikoVoice」v1.20に同梱のテストツール 「MikoVoice」は、音声合成のAPIを提供するライブラリ。Windows Vista/7に対応しており、編集部にてWindows 8.1で動作を確認した... 続きを読む
音声認識でリアルタイムに会議をテキスト化 富士通、聴覚障害者支援ツール「LiveTalk」開発 - ITmedia ニュース
音声認識で会議をリアルタイムにテキスト化し、発言や参加もできるようにすることで聴覚障害者を支援する「LiveTalk」を富士通が開発した。 富士通と富士通ソーシャルサイエンスラボラトリ(富士通SSL)は4月14日、聴覚障害者参加型コミュニケーションツール「FUJITSU Software LiveTalk」を発表した。リアルタイムに発話をテキストにすることで、聴覚に障害を持つ人の会議や授業への参加... 続きを読む
方言とコミュニケーション――「ヴァーチャル方言」とその効能 / 田中ゆかり / 日本語学 | SYNODOS -シノドス-
「方言」の効能 こんにちのコミュニケーションおいては、「何を」伝えるのかよりも、「どう」伝えるのかということがより重要視されている、といっていいかも知れない。わたしたちは、何を伝えるかよりも、どうやって伝えるか、に腐心することの方が多いのではないだろうか? そんな時代の日本語社会において、ホンネらしく響く、あるいは発話の意図をふんわりと伝わるという幻想を共有できる「方言」に注目が集まるのは、いわば... 続きを読む