タグ 音声
人気順 10 users 50 users 100 users 500 users 1000 users好きなポッドキャストについてまとめる
そもそもポッドキャストって何?映像のない YouTube のような存在が ポッドキャストです。 つまり、ラジオのようなものです。 YouTube のように、素人も投稿できる音声 メディアです。 どうやって聞けるの?iOSからであれば、Apple Podcast Androidからであれば、Googleポッドキャスト ※Googleポッドキャストは、YouTube... 続きを読む
新・必須ガジェット。テレワークのストレスを全部解決してくれました | ライフハッカー・ジャパン
もう手放せない。 最近毎日のように行なっているオンライン会議。自宅や好きな場所で、いろいろな人と打ち合わせができるのはたいへんありがたいもの。しかし、オンラインならではのストレスもあります。 たとえば音声の問題。お互いの使っているデバイスや周囲の環境などにより、声が聞こえづらくなると、何度も聞き返... 続きを読む
宇都宮駅に「当駅では収益性のある動画共有サイトなどへの投稿を目的とした撮影行為はお断りしております」という貼り紙があったが実効性はあるのか?
知らない所へ @ShiranaiTokoroe 最近のテレビ番組、JR東日本の構内は写真と音声だけになってる。つまり宇都宮駅に限らず一切の撮影許可が下りない事になってる。その原因は、まあ迷惑者の仕業だよな。ホント、末代まで滅びて欲しい。 x.com/Amausa_Samma/s… 2024-04-15 08:37:19 続きを読む
自民党・長谷川岳議員の“叱責”音声を入手「ありがとうもクソもメールもない」札幌市の職員に約30分間 | TBS NEWS DIG
自民党 長谷川岳参院議員「あんたから1回も、ありがとうもクソもメールもない、ありがとうもない!結果もない!誰だお前は!?って感じだよね」市職員「はい、申し訳ございません」これは自民党の長谷川岳参院議… 続きを読む
自民党・長谷川岳議員の“叱責”音声を入手「ありがとうもクソもメールもない」札幌市の職員に約30分間(TBS NEWS DIG Powered by JNN) - Yahoo!ニュース
自民党 長谷川岳参院議員 「あんたから1回も、ありがとうもクソもメールもない、ありがとうもない!結果もない!誰だお前は!?って感じだよね」 市職員 「はい、申し訳ございません」 これは自民党の長谷川岳参院議員が先月、札幌市の職員をおよそ30分間にわたり叱責した時の音声。 長谷川議員は客室乗務員への威圧的... 続きを読む
自民党派閥の裏金「森元総理が会長の時にスキームが作られた」と示唆 下村博文議員とされる音声 “政倫審”では語られなかった内容も…【news23】 | TBS NEWS DIG
自民党派閥の裏金事件をめぐり、下村博文衆院議員が政倫審後に発言したとされる音声データの存在が明らかになりました。音声では、裏金作りが「森元総理が会長の時にスキームが作られた」ことが示唆されるなど、政… 続きを読む
OpenAIがわずか15秒の音声からクローン音声を生成できるAIモデル「Voice Engine」をリリース
OpenAIがわずか15秒の音声サンプルから合成音声を作成できるAIモデル「Voice Engine」への限定的なアクセスを提供開始しました。Voice Engineは、合成音声を作成する際に使用した音声サンプルと同じ言語だけでなく、さまざまな言語で入力したテキストを音声読み上げすることができるというテキスト音声生成ツールです。 ... 続きを読む
OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る
米OpenAIは3月29日(現地時間)、人の声を再現できる生成AIモデル「Voice Engine」を発表した。テキスト入力と15秒分の音声サンプルで、元の話者によく似た自然な音声を生成できる。感情的なリアルな音声で、母国語以外の言語も話せる。 2022年から開発していたこのモデルは、既に同社の「Text-to-Speech API」や「ChatG... 続きを読む
OpenAI、人の声を再現する生成AI「Voice Engine」開発 - 日本経済新聞
【シリコンバレー=渡辺直樹】対話型AI(人工知能)「Chat(チャット)GPT」を開発した米新興企業オープンAIは29日、人の声を再現する生成AIを開発したと発表した。15秒分の声のサンプルをふき込み、文字を入力することで、話し手にそっくりな音声を合成することができる。母国語以外の外国語へのふき替えにも対応した。... 続きを読む
リアルタイム通信サーバーのEC2インスタンス台数を50%削減した割り当て最適化 - Cluster Tech Blog
こんにちは、クラスター株式会社でソフトウェアエンジニアをしているMito Memelです。 clusterでは、3D空間内でアバターモーションや音声を同期するためのリアルタイム通信サーバーをAmazon EC2上で動作させています。昨年から今年にかけて、このリアルタイム通信サーバーのリソース割り当て方法を改善し、結果として稼... 続きを読む
中学生でもわかる深層学習
第1章 理論編 ・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章 応用編 ・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識/自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む
[無人対応] Amazon Connectで通話中に発話した内容を、Amazon Transcribeで文字起こしし復唱してみた | DevelopersIO
[無人対応] Amazon Connectで通話中に発話した内容を、Amazon Transcribeで文字起こしし復唱してみた はじめに Amazon Connectでの発話内容をAmazon Transcribeで文字起こしし、音声出力するフローを構築しましたので、手順をまとめました。コンタクトセンターの無人対応を想定しています。 文字起こし内容を音声出力す... 続きを読む
NEWS | プロジェクトセカイ カラフルステージ! feat. 初音ミク
本作におけるピアプロキャラクターズの設定は、「プロジェクトセカイ」における設定であり、公式設定とは異なります。 記載の商品名および社名は各社の登録商標です。 本サイトで使用されている 画像、文章、情報、音声、動画等は株式会社セガまたはその関連会社の著作権により保護されております。 著作権者の許可なく... 続きを読む
「AIでの音声書き起こし」はどこまで進化したのか【西田宗千佳のイマトミライ】
Google、次世代AIモデル「Gemini 1.5」を発表 「10万行のソースコードから修正を提案するデモ」も公開
Googleは2024年2月15日(米国時間)、同社の大規模言語モデル(LLM)「Gemini」の次世代モデルである「Gemini 1.5」を発表した。 Geminiは、テキスト/画像/音声/数値など複数の種類のデータ(モダリティ)を処理できるマルチモーダルAI(人工知能)モデル。Googleは、Gemini 1.5の初期テスト用モデルとして「Gemini 1... 続きを読む
ChatGPTに音声読み上げ機能追加 モバイルでも
米OpenAIは3月4日(現地時間)、ChatGPTに音声読み上げ機能を追加したと発表した。Webアプリ、モバイルアプリのいずれでも既に利用可能になっている。日本語を含む37カ国語で読み上げる。 ChatGPTには既に音声による会話機能があるが、新機能はプロンプトにテキストで入力した質問の答えを読み上げるというものだ。回答... 続きを読む
ドイツ ウクライナ支援の協議内容がロシア側に漏えい 調査開始 | NHK
ドイツではウクライナへの軍事支援をめぐる軍の幹部も参加した協議の内容がロシア側に漏えいしたことがわかり、ショルツ首相は、2日、事態を重く見て調査を始めたと明らかにしました。ロシアの国営テレビ、RTの編集長は、1日、ウクライナへの軍事支援に関するドイツ軍の協議の内容だとする30分以上の音声をSNSに投稿しま... 続きを読む
猫に算数を教えてる
定年退職して暇になったので最近は専ら猫に算数を教えてる。 といっても猫は喋れないのでまずはそこから取り掛かることにした。 ホームセンターに行って適当に材料を揃えて数字スイッチを作り、これはボタンを押すと数字を読み上げるだけの単純な装置だ。 例えばボタン1を押すと「1」という音声が流れ、ボタン2を押すと... 続きを読む
無料の「Davinci Resolve」でプロみたいにキレイな音声を実現する方法【働く人のための「DaVinci Resolve」】
Adobeが生成AI搭載の音楽版Photoshop「Project Music GenAI Control」を発表
Adobeが生成AI搭載の音楽生成および編集ソフトウェア「Project Music GenAI Control」を発表しました。Project Music GenAI Controlを使うことで、ユーザーはテキストプロンプトから音楽を生成し、そのまま生成した音楽を使って音声を編集することができるとのことです。 Here’s how generative AI is about to revoluti... 続きを読む
これは“AIキャバクラ”なのか!? おしゃべりAI「Cotomo」と話したら“重い彼女”がいる気分に
友達と電話するように会話しながら、ほめたり労ったりしてくれるコトモ。「すごい!」「賢い」「頑張っているんだね」……言われて悪い気はしない。 だが「初対面で何でそこまで?」と白々しくも感じるし、会話はまったく深まらない。キャバクラの会話ってこんな感じなのかも? 行ったことないけど……。 ただ、その技術は... 続きを読む
ゲーミング“匂い”デバイス「GameScent」登場。AIがゲーム内の音声を認識し、銃撃・爆発・森の匂いなどを放出 - AUTOMATON
Elevated Perceptionsは2月27日、ゲーム内の匂いを感じることのできるデバイスGameScentのトレイラーを公開した。Amazon.comなどの海外小売サイトにて販売されているようだ。 GameScentはゲーム内の匂いを再現するというゲーミングデバイスだ。ゲームから取り込んだ音声をAIが認識し、状況に応じた匂いを放出すると謳わ... 続きを読む
「電車内のあの人は今、何聞いてるのかなぁ……」――イヤフォンで聞いている音を1m先から盗聴する攻撃
「Periscope」と呼ばれるこの攻撃は、イヤフォン/ヘッドフォンを接続したモバイルが放出する電磁放射(EMR)を利用してユーザーのプライベートな音声を復元する。ここでは、物理的な配線を通じてオーディオ信号を伝送するため、無線ヘッドフォンよりも盗聴攻撃に対して堅牢であると考えられる、有線ヘッドフォンを対象... 続きを読む
連載「宮沢喜一日録 戦後政治の軌跡」一覧:朝日新聞デジタル
能登半島地震 ウクライナ情勢 速報 朝刊 記事一覧 紙面ビューアー 夕刊 記事一覧 紙面ビューアー 連載 ランキング その他 コメントプラス 特集 動画・音声・写真 土曜別刷り「be」 記者イベント 天気 数独 12星座占い サイトマップ 検索 ヘルプ Q&A(よくある質問) 総合ガイド お申し込み ログイン マイページ 有料会員... 続きを読む
Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開
Googleは、AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をオープンソースで公開したと発表しました。 Magikaは、あるファイルの中味が何なのか、記述されたプログラミング言語の種類、動画や画像、音声などのフォーマットの種類、ExcelやWord、PDFなどのオフィス系ソフトウェアの種類、OS... 続きを読む