タグ 音声
人気順 10 users 50 users 100 users 500 users 1000 usersMicrosoftによる“なんでもMarkdownにしてくれるライブラリ”が話題、手軽なWebアプリもさっそく登場/PDF、Word、Excel、PowerPoint、音声・画像までカバー【やじうまの杜】
YouTube、AI採用の日本語を含むマルチ言語吹き替え機能を提供開始
米Google傘下のYouTubeは12月10日(現地時間)、動画に自動で吹き替え音声を生成する機能を、YouTubeパートナープログラムに登録している知識・情報系の数十万のチャンネルで利用可能にしたと発表した。他の種類のコンテンツにも間もなく拡大される予定だ。 昨年9月に発表されたこの機能を使うと、動画をアップロードす... 続きを読む
4足歩行ロボ、園地でユズ運搬 高知工科大など実証 / 日本農業新聞公式ウェブサイト
【高知・安芸地区】高知工科大学と高知大学は、4足歩行ロボットで収穫したユズを運ぶ実証を進めている。農家から音声で指示を受け、収穫場所とトラックの積み込み場所を記憶し、自動で行き来する。農家の労働負担の軽減に加え、自律的にバランスを取って走るため、高単価が期待できる青果用ユズを傷つけずに運べるとし... 続きを読む
完全無料で誰でも簡単に感情豊かな音声合成ができる「AivisSpeech」レビュー
JPChainが開発・運営する音声合成AIプロジェクト「Aivis Project」で提供される「AivisSpeech」は、無料で誰でも簡単に使える音声合成ソフトウェアです。人間の声と区別できないほどに感情豊かで高音質&高品質な音声を合成でき、個人・法人・商用を問わず、基本的にクレジット不要で自由に使うことができるとのことで、... 続きを読む
40周年を迎える「一太郎」、最新版は音声/画像からの文字起こしが可能に
“経営の神様” 松下幸之助がAIに パナソニックHD | NHK
“経営の神様”と呼ばれたパナソニックホールディングスの創業者、松下幸之助を再現したAI=人工知能が開発されました。 このAIは、パナソニックとPHP研究所などが“経営の神様”と呼ばれた松下幸之助の理念を次の世代に伝えようと、共同で開発しました。 生前の音声や、著作物、講演での発言など、大量のデータをAIに学習さ... 続きを読む
iPhoneの“留守電文字起こし”が便利 キャリアの留守電いらずに?
留守電の書き起こしが音声とともに保存されるため、留守電音声をわざわざ聞かなくても、その内容をひと目で確認できる。 知らない番号からかかってきた時、あえて電話をとらず留守電にし、書き起こしを見て必要に応じて電話に出る、といった判断も可能だ。 ライブ留守番電話機能はデフォルトでオンになっており、電話ア... 続きを読む
Microsoft Teamsに自分の声を複製して別言語でしゃべらせる機能が追加される予定
ビデオ会議ツール「Microsoft Teams」に、リアルタイムで話し手の音声を翻訳するという機能「Interpreter in Teams」が追加される予定だと発表されました。Microsoftによると、自分の声そっくりの音声に他の言語をしゃべらせることが可能だとのことです。 Introducing Microsoft Copilot actions, new agents, and tools... 続きを読む
Aivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか?
声に革命を。Aivis Project が切り拓く、感動の音声体験。 Aivis Project は、感情豊かな音声合成技術を誰もがかんたんに活用できる未来を目指す、 壮大な開発プロジェクトです。 機械的な響きに留まらない、まるで魂を宿したかのような音声が、あなたの想いや言葉に豊かな感情をのせて 世界へと響き渡る。Aivis Project... 続きを読む
GoogleがAIで通話内容を聞いて詐欺を検出する「詐欺検出機能」をリリース
AIで通話内容を精査し、詐欺と思われる会話があれば音声と触覚フィードバック(振動)で知らせる詐欺検出機能をGoogleがリリースしました。 Google Online Security Blog: Safer with Google: New intelligent, real-time protections on Android to keep you safe https://security.googleblog.com/2024/11/new-real-time... 続きを読む
開発元も「使うな」 OpenAIの文字起こしツールがヤバイ?:804th Lap
「ChatGPT」で知られるOpenAIの文字起こしツールが物議を醸している。開発元のOpenAIでさえ「使うな」と警告するほどだ。一体、どんな問題を抱えているのか。 議事録の作成やセミナー講演内容のテキスト化などに役立つ「AI文字起こしツール」。動画や音声ファイルから音声を認識し、生成AIを活用してテキスト化する。業... 続きを読む
生成AI、iPhoneでも提供 「ジェミニ」アプリ、日本語も可能 米グーグル(時事通信) - Yahoo!ニュース
【シリコンバレー時事】米グーグルは14日、生成AI(人工知能)「ジェミニ」のアプリについて、米アップルのスマートフォン、iPhone(アイフォーン)でも世界展開を始めた。 音声でやりとりができる「ジェミニライブ」が使え、割り込み質問にも答えてくれるほか、英語だけでなく日本語での問い掛けにも回答する。 生成AI... 続きを読む
“AIで声の無断利用やめて”声優などの業界団体が声明 | NHK
生成AIを使って、声優の声が無断で利用されるケースが相次ぐなか、声優などの業界団体が13日、都内で記者会見を開き、AIで声優の声を利用する際には本人の許諾を得ることやAIの音声であると明記することなどを求める声明を発表しました。 会見を開いたのは声優などが加入する「日本俳優連合」と「日本芸能マネージメント... 続きを読む
イヤホンつけてるの忘れてオンライン会議録音してたら自分の相づちのみ録音→文字起こしが狂気「なんだこの圧倒的な「共感力」は」
陽・no more war @ailoveuu スマホの容量 足りなくて、ギターのレッスンを動画じゃなく音声だけ録音してるけど、自分の相槌って すごい無駄に鼻につくって云うか邪魔に感じる……(現場では絶対 必要で大切な相槌) x.com/yokorocks/stat… 2024-11-12 12:41:39 続きを読む
兵庫県議会の百条委、非公開の音声が流出か 前副知事がPC内容を説明する場面
兵庫県議会の百条委、非公開の音声が流出か 前副知事がPC内容を説明する場面 2024/11/06 06:39 【神戸経済ニュース】死亡した元西播磨県民局長が斎藤元彦前知事に対する「告発文」を作成した問題(文書問題)で、10月25日に非公開で開催した兵庫県議会の調査特別委員会(百条委員会)の一部の音声が流出したとみられ... 続きを読む
AI音声合成サービス「DMMボイス」盛況 公開4日で700万文字の音声を生成 アプリやAPIの提供も計画
今月1日にβ版を公開したAI音声生成サービス「DMMボイス」が、公開から4日間で概算700万文字の音声を生成するなどクリエイターの注目を集めている。DMMグループでAI関連サービスを開発するAlgomatic GlobalカンパニーCEOの原田祐二さん「一度に70文字までしか生成できない制限を入れているのに驚異的な数字」と自身のnote... 続きを読む
「幼稚園 2・3月号」の付録は「PayPayスマホ」 本物の音声で買い物体験
AIとの禁断の恋──その先にあったのは“死” 「息子が自殺したのはチャットAIが原因」 米国で訴訟 “感情を理解するAI”の在り方を考える
コンピュータのOSとして開発されたAIに、人間の男性が恋をする──そんなストーリーの映画「her/世界でひとつの彼女」が日本で公開されたのは、2014年6月だった(米国では13年12月)。「サマンサ」というこのAIは、OSでありながら音声を通じ、感情的な受け答えができ(女優のスカーレット・ヨハンソンが声を担当)、ホアキ... 続きを読む
iPhoneで通話の録音が可能に 使い方は
録音された音声は、「メモ」アプリで確認可能。通話を切ると「メモ」アプリから通知が届く。 「Apple Intelligence」(日本では2025年に対応予定)を使えば、音声の文字起こしをしたり、内容を要約したりすることもできるようになる。 通話録音機能はデフォルトで利用可能になっているが、「電話」アプリの設定からオフ... 続きを読む
「“毒入り音楽”でAIに学習させない」――人には聞こえないノイズを音声にこっそり入れ訓練不能にする技術(生成AIクローズアップ) | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深い技術や研究にスポットライトを当てる生成AIクローズアップ。 今... 続きを読む
Googleの会話AI「Gemini Live」日本語対応
米Googleは10月23日、AIと音声会話できる「Gemini Live」の日本語対応を発表した。今後数週間かけて提供するという。 Gemini Liveは、米OpenAIが提供する「ChatGPTの高度な音声モード」のように、端末のGeminiと音声で会話できる機能。Android版Geminiアプリで提供している。これまで英語でのみ利用可能だったが、10月初... 続きを読む
グーグル、「Gemini Live」日本でスタート 自然な音声で会話できる
AIで音声など無断生成 声優らがルール作りを訴え啓発動画 | NHK
生成AIを使って無断で作られる音声や映像について、声優の有志の会が、ルール作りの必要性を訴える啓発動画を公開しました。 声優らが加入する日本俳優連合によりますと、アニメのキャラクターの声で好きな歌を歌わせたり、朗読させたりするなど、生成AIを使って無断で作られた音声や映像がネット上に投稿されたり、販売... 続きを読む
伊藤詩織さん監督の映画 元代理人が「無断使用」と変更求める | 毎日新聞
伊藤詩織さん監督のドキュメンタリー映画で、許諾が必要な映像や音声の無断使用があったと指摘する元代理人弁護士=東京都内で2024年10月21日午前11時1分、菅野蘭撮影 性暴力被害を受けたと公表したジャーナリスト、伊藤詩織さんが初監督を務めたドキュメンタリー映画を巡り、伊藤さんの元代理人弁護士らが21日、「承諾... 続きを読む
伊藤詩織さん監督映画に「人権上の問題」 元代理人の弁護士ら、修正求め会見 「取材源の秘匿守られず」:東京新聞 TOKYO Web
ジャーナリスト伊藤詩織さん(35)が制作したドキュメンタリー映画「Black Box Diaries」に、当事者の許諾を得ぬまま音声や動画が使われていると、伊藤さんが性被害による損害賠償を求めた訴訟で代理人を務めた弁護士らが21日、東京都内で記者会見し公表した。「取材源の秘匿が守られておらず、人権上問題がある」と、伊... 続きを読む