はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 音声

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 1000件)

好きなポッドキャストについてまとめる

2024/04/18 このエントリーをはてなブックマークに追加 1414 users Instapaper Pocket Tweet Facebook Share Evernote Clip ポッドキャスト YouTube Googleポッドキャスト

そもそもポッドキャストって何?映像のない YouTube のような存在が ポッドキャストです。 つまり、ラジオのようなものです。 YouTube のように、素人も投稿できる音声 メディアです。 どうやって聞けるの?iOSからであれば、Apple Podcast Androidからであれば、Googleポッドキャスト ※Googleポッドキャストは、YouTube... 続きを読む

新・必須ガジェット。テレワークのストレスを全部解決してくれました | ライフハッカー・ジャパン

2024/04/17 このエントリーをはてなブックマークに追加 148 users Instapaper Pocket Tweet Facebook Share Evernote Clip デバイス お互い 周囲 オンラインならでは テレワーク

もう手放せない。 最近毎日のように行なっているオンライン会議。自宅や好きな場所で、いろいろな人と打ち合わせができるのはたいへんありがたいもの。しかし、オンラインならではのストレスもあります。 たとえば音声の問題。お互いの使っているデバイスや周囲の環境などにより、声が聞こえづらくなると、何度も聞き返... 続きを読む

宇都宮駅に「当駅では収益性のある動画共有サイトなどへの投稿を目的とした撮影行為はお断りしております」という貼り紙があったが実効性はあるのか?

2024/04/15 このエントリーをはてなブックマークに追加 155 users Instapaper Pocket Tweet Facebook Share Evernote Clip 貼り紙 実効性 宇都宮駅 収益性 撮影行為

知らない所へ @ShiranaiTokoroe 最近のテレビ番組、JR東日本の構内は写真と音声だけになってる。つまり宇都宮駅に限らず一切の撮影許可が下りない事になってる。その原因は、まあ迷惑者の仕業だよな。ホント、末代まで滅びて欲しい。 x.com/Amausa_Samma/s… 2024-04-15 08:37:19 続きを読む

自民党・長谷川岳議員の“叱責”音声を入手「ありがとうもクソもメールもない」札幌市の職員に約30分間 | TBS NEWS DIG

2024/04/12 このエントリーをはてなブックマークに追加 19 users Instapaper Pocket Tweet Facebook Share Evernote Clip あんた 長谷川岳参院議員 叱責 パイ 申し訳

自民党 長谷川岳参院議員「あんたから1回も、ありがとうもクソもメールもない、ありがとうもない!結果もない!誰だお前は!?って感じだよね」市職員「はい、申し訳ございません」これは自民党の長谷川岳参院議… 続きを読む

自民党・長谷川岳議員の“叱責”音声を入手「ありがとうもクソもメールもない」札幌市の職員に約30分間(TBS NEWS DIG Powered by JNN) - Yahoo!ニュース

2024/04/13 このエントリーをはてなブックマークに追加 166 users Instapaper Pocket Tweet Facebook Share Evernote Clip あんた 長谷川岳参院議員 客室乗務員 長谷川議員 叱責

自民党 長谷川岳参院議員 「あんたから1回も、ありがとうもクソもメールもない、ありがとうもない!結果もない!誰だお前は!?って感じだよね」 市職員 「はい、申し訳ございません」 これは自民党の長谷川岳参院議員が先月、札幌市の職員をおよそ30分間にわたり叱責した時の音声。 長谷川議員は客室乗務員への威圧的... 続きを読む

自民党派閥の裏金「森元総理が会長の時にスキームが作られた」と示唆 下村博文議員とされる音声 “政倫審”では語られなかった内容も…【news23】 | TBS NEWS DIG

2024/04/11 このエントリーをはてなブックマークに追加 137 users Instapaper Pocket Tweet Facebook Share Evernote Clip 裏金 森元総理 下村博文衆院議員 スキーム 政倫審

自民党派閥の裏金事件をめぐり、下村博文衆院議員が政倫審後に発言したとされる音声データの存在が明らかになりました。音声では、裏金作りが「森元総理が会長の時にスキームが作られた」ことが示唆されるなど、政… 続きを読む

OpenAIがわずか15秒の音声からクローン音声を生成できるAIモデル「Voice Engine」をリリース

2024/04/01 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI 合成音声 言語 音声サンプル テキスト

OpenAIがわずか15秒の音声サンプルから合成音声を作成できるAIモデル「Voice Engine」への限定的なアクセスを提供開始しました。Voice Engineは、合成音声を作成する際に使用した音声サンプルと同じ言語だけでなく、さまざまな言語で入力したテキストを音声読み上げすることができるというテキスト音声生成ツールです。 ... 続きを読む

OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る

2024/03/29 このエントリーをはてなブックマークに追加 21 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI ChatG 米OpenAI 生成AIモデル 言語

米OpenAIは3月29日(現地時間)、人の声を再現できる生成AIモデル「Voice Engine」を発表した。テキスト入力と15秒分の音声サンプルで、元の話者によく似た自然な音声を生成できる。感情的なリアルな音声で、母国語以外の言語も話せる。 2022年から開発していたこのモデルは、既に同社の「Text-to-Speech API」や「ChatG... 続きを読む

OpenAI、人の声を再現する生成AI「Voice Engine」開発 - 日本経済新聞

2024/03/30 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI GPT 話し手 chat シリコンバレー

【シリコンバレー=渡辺直樹】対話型AI(人工知能)「Chat(チャット)GPT」を開発した米新興企業オープンAIは29日、人の声を再現する生成AIを開発したと発表した。15秒分の声のサンプルをふき込み、文字を入力することで、話し手にそっくりな音声を合成することができる。母国語以外の外国語へのふき替えにも対応した。... 続きを読む

リアルタイム通信サーバーのEC2インスタンス台数を50%削減した割り当て最適化 - Cluster Tech Blog

2024/03/29 このエントリーをはてなブックマークに追加 17 users Instapaper Pocket Tweet Facebook Share Evernote Clip Cluster Tech Blog 最適化 50% EC2上

こんにちは、クラスター株式会社でソフトウェアエンジニアをしているMito Memelです。 clusterでは、3D空間内でアバターモーションや音声を同期するためのリアルタイム通信サーバーをAmazon EC2上で動作させています。昨年から今年にかけて、このリアルタイム通信サーバーのリソース割り当て方法を改善し、結果として稼... 続きを読む

中学生でもわかる深層学習

2024/03/29 このエントリーをはてなブックマークに追加 508 users Instapaper Pocket Tweet Facebook Share Evernote Clip 深層学習 中学生 ニューラルネットワーク 勾配降下法 講演

第1章 理論編 ・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章 応用編 ・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識/自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む

[無人対応] Amazon Connectで通話中に発話した内容を、Amazon Transcribeで文字起こしし復唱してみた | DevelopersIO

2024/03/28 このエントリーをはてなブックマークに追加 12 users Instapaper Pocket Tweet Facebook Share Evernote Clip 手順 フロー 音声出力 コンタクトセンター 無人対応

[無人対応] Amazon Connectで通話中に発話した内容を、Amazon Transcribeで文字起こしし復唱してみた はじめに Amazon Connectでの発話内容をAmazon Transcribeで文字起こしし、音声出力するフローを構築しましたので、手順をまとめました。コンタクトセンターの無人対応を想定しています。 文字起こし内容を音声出力す... 続きを読む

NEWS | プロジェクトセカイ カラフルステージ! feat. 初音ミク

2024/03/27 このエントリーをはてなブックマークに追加 90 users Instapaper Pocket Tweet Facebook Share Evernote Clip 初音ミク 社名 プロジェクトセカイ カラフルステージ NEWS

本作におけるピアプロキャラクターズの設定は、「プロジェクトセカイ」における設定であり、公式設定とは異なります。 記載の商品名および社名は各社の登録商標です。 本サイトで使用されている 画像、文章、情報、音声、動画等は株式会社セガまたはその関連会社の著作権により保護されております。 著作権者の許可なく... 続きを読む

「AIでの音声書き起こし」はどこまで進化したのか【西田宗千佳のイマトミライ】

2024/03/24 このエントリーをはてなブックマークに追加 17 users Instapaper Pocket Tweet Facebook Share Evernote Clip イマトミライ 西田宗千佳

続きを読む

Google、次世代AIモデル「Gemini 1.5」を発表 「10万行のソースコードから修正を提案するデモ」も公開

2024/03/09 このエントリーをはてなブックマークに追加 15 users Instapaper Pocket Tweet Facebook Share Evernote Clip デモ ソースコード Google 修正 次世代AIモデル

Googleは2024年2月15日(米国時間)、同社の大規模言語モデル(LLM)「Gemini」の次世代モデルである「Gemini 1.5」を発表した。 Geminiは、テキスト/画像/音声/数値など複数の種類のデータ(モダリティ)を処理できるマルチモーダルAI(人工知能)モデル。Googleは、Gemini 1.5の初期テスト用モデルとして「Gemini 1... 続きを読む

ChatGPTに音声読み上げ機能追加 モバイルでも

2024/03/05 このエントリーをはてなブックマークに追加 5 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt プロンプト モバイルアプリ 米OpenAI

米OpenAIは3月4日(現地時間)、ChatGPTに音声読み上げ機能を追加したと発表した。Webアプリ、モバイルアプリのいずれでも既に利用可能になっている。日本語を含む37カ国語で読み上げる。 ChatGPTには既に音声による会話機能があるが、新機能はプロンプトにテキストで入力した質問の答えを読み上げるというものだ。回答... 続きを読む

ドイツ ウクライナ支援の協議内容がロシア側に漏えい 調査開始 | NHK

2024/03/02 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip ウクライナ支援 ドイツ NHK ロシア側 協議内容

ドイツではウクライナへの軍事支援をめぐる軍の幹部も参加した協議の内容がロシア側に漏えいしたことがわかり、ショルツ首相は、2日、事態を重く見て調査を始めたと明らかにしました。ロシアの国営テレビ、RTの編集長は、1日、ウクライナへの軍事支援に関するドイツ軍の協議の内容だとする30分以上の音声をSNSに投稿しま... 続きを読む

猫に算数を教えてる

2024/03/01 このエントリーをはてなブックマークに追加 125 users Instapaper Pocket Tweet Facebook Share Evernote Clip 算数 定年 数字 材料 ボタン

定年退職して暇になったので最近は専ら猫に算数を教えてる。 といっても猫は喋れないのでまずはそこから取り掛かることにした。 ホームセンターに行って適当に材料を揃えて数字スイッチを作り、これはボタンを押すと数字を読み上げるだけの単純な装置だ。 例えばボタン1を押すと「1」という音声が流れ、ボタン2を押すと... 続きを読む

無料の「Davinci Resolve」でプロみたいにキレイな音声を実現する方法【働く人のための「DaVinci Resolve」】

2024/03/01 このエントリーをはてなブックマークに追加 173 users Instapaper Pocket Tweet Facebook Share Evernote Clip DaVinci Resolve 方法 無料

続きを読む

Adobeが生成AI搭載の音楽版Photoshop「Project Music GenAI Control」を発表

2024/02/29 このエントリーをはてなブックマークに追加 7 users Instapaper Pocket Tweet Facebook Share Evernote Clip Adobe 生成AI搭載 テキストプロンプト 発表 音楽生成

Adobeが生成AI搭載の音楽生成および編集ソフトウェア「Project Music GenAI Control」を発表しました。Project Music GenAI Controlを使うことで、ユーザーはテキストプロンプトから音楽を生成し、そのまま生成した音楽を使って音声を編集することができるとのことです。 Here’s how generative AI is about to revoluti... 続きを読む

これは“AIキャバクラ”なのか!? おしゃべりAI「Cotomo」と話したら“重い彼女”がいる気分に

2024/02/28 このエントリーをはてなブックマークに追加 257 users Instapaper Pocket Tweet Facebook Share Evernote Clip Cotomo こども 気分 初対面 iPhone用

友達と電話するように会話しながら、ほめたり労ったりしてくれるコトモ。「すごい!」「賢い」「頑張っているんだね」……言われて悪い気はしない。 だが「初対面で何でそこまで?」と白々しくも感じるし、会話はまったく深まらない。キャバクラの会話ってこんな感じなのかも? 行ったことないけど……。 ただ、その技術は... 続きを読む

ゲーミング“匂い”デバイス「GameScent」登場。AIがゲーム内の音声を認識し、銃撃・爆発・森の匂いなどを放出 - AUTOMATON

2024/02/28 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip AUTOMATON トレイラー Amazon.com 銃撃

Elevated Perceptionsは2月27日、ゲーム内の匂いを感じることのできるデバイスGameScentのトレイラーを公開した。Amazon.comなどの海外小売サイトにて販売されているようだ。 GameScentはゲーム内の匂いを再現するというゲーミングデバイスだ。ゲームから取り込んだ音声をAIが認識し、状況に応じた匂いを放出すると謳わ... 続きを読む

「電車内のあの人は今、何聞いてるのかなぁ……」――イヤフォンで聞いている音を1m先から盗聴する攻撃

2024/02/26 このエントリーをはてなブックマークに追加 26 users Instapaper Pocket Tweet Facebook Share Evernote Clip イヤフォン EMR Periscope ヘッドフォン 攻撃

「Periscope」と呼ばれるこの攻撃は、イヤフォン/ヘッドフォンを接続したモバイルが放出する電磁放射(EMR)を利用してユーザーのプライベートな音声を復元する。ここでは、物理的な配線を通じてオーディオ信号を伝送するため、無線ヘッドフォンよりも盗聴攻撃に対して堅牢であると考えられる、有線ヘッドフォンを対象... 続きを読む

連載「宮沢喜一日録 戦後政治の軌跡」一覧:朝日新聞デジタル

2024/02/24 このエントリーをはてなブックマークに追加 18 users Instapaper Pocket Tweet Facebook Share Evernote Clip 軌跡 戦後政治 朝日新聞デジタル 連載 朝刊

能登半島地震 ウクライナ情勢 速報 朝刊 記事一覧 紙面ビューアー 夕刊 記事一覧 紙面ビューアー 連載 ランキング その他 コメントプラス 特集 動画・音声・写真 土曜別刷り「be」 記者イベント 天気 数独 12星座占い サイトマップ 検索 ヘルプ Q&A(よくある質問) 総合ガイド お申し込み ログイン マイページ 有料会員... 続きを読む

Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開

2024/02/18 このエントリーをはてなブックマークに追加 144 users Instapaper Pocket Tweet Facebook Share Evernote Clip Magika word Excel フォーマット PDF

Googleは、AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をオープンソースで公開したと発表しました。 Magikaは、あるファイルの中味が何なのか、記述されたプログラミング言語の種類、動画や画像、音声などのフォーマットの種類、ExcelやWord、PDFなどのオフィス系ソフトウェアの種類、OS... 続きを読む

 
(1 - 25 / 1000件)