はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 音声

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 371件)

Aivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか?

2024/11/19 このエントリーをはてなブックマークに追加 138 users Instapaper Pocket Tweet Facebook Share Evernote Clip 革命 感動 音声合成技術 未来 開発プロジェクト

声に革命を。Aivis Project が切り拓く、感動の音声体験。 Aivis Project は、感情豊かな音声合成技術を誰もがかんたんに活用できる未来を目指す、 壮大な開発プロジェクトです。 機械的な響きに留まらない、まるで魂を宿したかのような音声が、あなたの想いや言葉に豊かな感情をのせて 世界へと響き渡る。Aivis Project... 続きを読む

伊藤詩織さん監督映画に「人権上の問題」 元代理人の弁護士ら、修正求め会見 「取材源の秘匿守られず」:東京新聞 TOKYO Web

2024/10/21 このエントリーをはてなブックマークに追加 168 users Instapaper Pocket Tweet Facebook Share Evernote Clip 秘匿 代理人 許諾 訴訟 記者会見

ジャーナリスト伊藤詩織さん(35)が制作したドキュメンタリー映画「Black Box Diaries」に、当事者の許諾を得ぬまま音声や動画が使われていると、伊藤さんが性被害による損害賠償を求めた訴訟で代理人を務めた弁護士らが21日、東京都内で記者会見し公表した。「取材源の秘匿が守られておらず、人権上問題がある」と、伊... 続きを読む

無料で自動文字起こし&テキストで音声編集も可能な「audapolis」を使ってみた

2024/08/04 このエントリーをはてなブックマークに追加 148 users Instapaper Pocket Tweet Facebook Share Evernote Clip GitHub テキスト 音声編集 ツール オープンソース

オープンソースで開発される「audapolis」は書き起こし機能を備えたメディアエディターで、音声を自動的にテキストに書き起こすだけでなく、書き起こしたテキストを編集することで同時に音声も編集できるツールで、無料で使うことができます。 GitHub - bugbakery/audapolis: an editor for spoken-word audio with auto... 続きを読む

兵庫県知事「今、記憶がない」“特産品の要求音声”直撃に… パワハラ告発男性が残す|日テレNEWS NNN

2024/07/18 このエントリーをはてなブックマークに追加 239 users Instapaper Pocket Tweet Facebook Share Evernote Clip 直撃 パワハラ イチゴ 日テレNEWS NNN 斎藤知事

兵庫県の斎藤知事のパワハラや贈答品などを巡る問題。18日、知事が県の特産品を要求したとされる音声を本人に直撃しました。 ◇ 斎藤知事のものとされる音声 「ワインをちょっと、まだ私は飲んでいないのでぜひまた。この間はイチゴ・じゃこ・塩はあれですけど、また折をみてよろしくお願いします」 この音声は、斎藤知事... 続きを読む

【独自】「死を持って抗議する」知事のパワハラ疑惑告発 死亡の元職員 証拠とみられる「音声」など残す

2024/07/14 このエントリーをはてなブックマークに追加 233 users Instapaper Pocket Tweet Facebook Share Evernote Clip パワハラ疑惑告発 パワハラ疑惑 陳述書 斎藤知事 知事

【独自】「死を持って抗議する」知事のパワハラ疑惑告発 死亡の元職員 証拠とみられる「音声」など残す07月15日 00:46 兵庫県の斎藤知事のパワハラ疑惑などを告発した元幹部職員が「死をもって抗議する」というメッセージとともに、出席できない百条委員会に向け、陳述書や疑惑にまつわる音声データを残していたことが... 続きを読む

PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

2024/06/20 このエントリーをはてなブックマークに追加 124 users Instapaper Pocket Tweet Facebook Share Evernote Clip ベク マネージドサービス PostgreSQL 生成AI 数値

PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。 大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベク... 続きを読む

GPT-4oを使って2Dの図面から3DのCADモデルを作る

2024/05/19 このエントリーをはてなブックマークに追加 161 users Instapaper Pocket Tweet Facebook Share Evernote Clip GPT-4o 図面 OpenAI OCR シロクマ

はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が... 続きを読む

「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】

2024/05/13 このエントリーをはてなブックマークに追加 324 users Instapaper Pocket Tweet Facebook Share Evernote Clip GPT-4o 視覚 対話 追記済 性能

米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 G... 続きを読む

GPT-4o の概要|npaka

2024/05/13 このエントリーをはてなブックマークに追加 237 users Instapaper Pocket Tweet Facebook Share Evernote Clip npaka Omni GPT-4o 対話 出力

以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわず... 続きを読む

好きなポッドキャストについてまとめる

2024/04/18 このエントリーをはてなブックマークに追加 1414 users Instapaper Pocket Tweet Facebook Share Evernote Clip ポッドキャスト YouTube Googleポッドキャスト

そもそもポッドキャストって何?映像のない YouTube のような存在が ポッドキャストです。 つまり、ラジオのようなものです。 YouTube のように、素人も投稿できる音声 メディアです。 どうやって聞けるの?iOSからであれば、Apple Podcast Androidからであれば、Googleポッドキャスト ※Googleポッドキャストは、YouTube... 続きを読む

新・必須ガジェット。テレワークのストレスを全部解決してくれました | ライフハッカー・ジャパン

2024/04/17 このエントリーをはてなブックマークに追加 148 users Instapaper Pocket Tweet Facebook Share Evernote Clip デバイス お互い 周囲 オンラインならでは テレワーク

もう手放せない。 最近毎日のように行なっているオンライン会議。自宅や好きな場所で、いろいろな人と打ち合わせができるのはたいへんありがたいもの。しかし、オンラインならではのストレスもあります。 たとえば音声の問題。お互いの使っているデバイスや周囲の環境などにより、声が聞こえづらくなると、何度も聞き返... 続きを読む

宇都宮駅に「当駅では収益性のある動画共有サイトなどへの投稿を目的とした撮影行為はお断りしております」という貼り紙があったが実効性はあるのか?

2024/04/15 このエントリーをはてなブックマークに追加 155 users Instapaper Pocket Tweet Facebook Share Evernote Clip 貼り紙 実効性 宇都宮駅 収益性 撮影行為

知らない所へ @ShiranaiTokoroe 最近のテレビ番組、JR東日本の構内は写真と音声だけになってる。つまり宇都宮駅に限らず一切の撮影許可が下りない事になってる。その原因は、まあ迷惑者の仕業だよな。ホント、末代まで滅びて欲しい。 x.com/Amausa_Samma/s… 2024-04-15 08:37:19 続きを読む

自民党・長谷川岳議員の“叱責”音声を入手「ありがとうもクソもメールもない」札幌市の職員に約30分間(TBS NEWS DIG Powered by JNN) - Yahoo!ニュース

2024/04/13 このエントリーをはてなブックマークに追加 166 users Instapaper Pocket Tweet Facebook Share Evernote Clip あんた 長谷川岳参院議員 客室乗務員 長谷川議員 叱責

自民党 長谷川岳参院議員 「あんたから1回も、ありがとうもクソもメールもない、ありがとうもない!結果もない!誰だお前は!?って感じだよね」 市職員 「はい、申し訳ございません」 これは自民党の長谷川岳参院議員が先月、札幌市の職員をおよそ30分間にわたり叱責した時の音声。 長谷川議員は客室乗務員への威圧的... 続きを読む

自民党派閥の裏金「森元総理が会長の時にスキームが作られた」と示唆 下村博文議員とされる音声 “政倫審”では語られなかった内容も…【news23】 | TBS NEWS DIG

2024/04/11 このエントリーをはてなブックマークに追加 137 users Instapaper Pocket Tweet Facebook Share Evernote Clip 裏金 森元総理 下村博文衆院議員 スキーム 政倫審

自民党派閥の裏金事件をめぐり、下村博文衆院議員が政倫審後に発言したとされる音声データの存在が明らかになりました。音声では、裏金作りが「森元総理が会長の時にスキームが作られた」ことが示唆されるなど、政… 続きを読む

中学生でもわかる深層学習

2024/03/29 このエントリーをはてなブックマークに追加 508 users Instapaper Pocket Tweet Facebook Share Evernote Clip 深層学習 中学生 ニューラルネットワーク 勾配降下法 講演

第1章 理論編 ・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章 応用編 ・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識/自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む

猫に算数を教えてる

2024/03/01 このエントリーをはてなブックマークに追加 125 users Instapaper Pocket Tweet Facebook Share Evernote Clip 算数 定年 数字 材料 ボタン

定年退職して暇になったので最近は専ら猫に算数を教えてる。 といっても猫は喋れないのでまずはそこから取り掛かることにした。 ホームセンターに行って適当に材料を揃えて数字スイッチを作り、これはボタンを押すと数字を読み上げるだけの単純な装置だ。 例えばボタン1を押すと「1」という音声が流れ、ボタン2を押すと... 続きを読む

無料の「Davinci Resolve」でプロみたいにキレイな音声を実現する方法【働く人のための「DaVinci Resolve」】

2024/03/01 このエントリーをはてなブックマークに追加 173 users Instapaper Pocket Tweet Facebook Share Evernote Clip DaVinci Resolve 方法 無料

続きを読む

これは“AIキャバクラ”なのか!? おしゃべりAI「Cotomo」と話したら“重い彼女”がいる気分に

2024/02/28 このエントリーをはてなブックマークに追加 257 users Instapaper Pocket Tweet Facebook Share Evernote Clip Cotomo こども 気分 初対面 iPhone用

友達と電話するように会話しながら、ほめたり労ったりしてくれるコトモ。「すごい!」「賢い」「頑張っているんだね」……言われて悪い気はしない。 だが「初対面で何でそこまで?」と白々しくも感じるし、会話はまったく深まらない。キャバクラの会話ってこんな感じなのかも? 行ったことないけど……。 ただ、その技術は... 続きを読む

Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開

2024/02/18 このエントリーをはてなブックマークに追加 144 users Instapaper Pocket Tweet Facebook Share Evernote Clip Magika word Excel フォーマット PDF

Googleは、AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をオープンソースで公開したと発表しました。 Magikaは、あるファイルの中味が何なのか、記述されたプログラミング言語の種類、動画や画像、音声などのフォーマットの種類、ExcelやWord、PDFなどのオフィス系ソフトウェアの種類、OS... 続きを読む

エスカレーター歩くと「条例違反です」AI声掛け 名古屋市営地下鉄で実証実験:中日新聞Web

2024/02/05 このエントリーをはてなブックマークに追加 253 users Instapaper Pocket Tweet Facebook Share Evernote Clip エスカレーター 人工知能 条例違反 実証実験 名古屋市営地下鉄

エスカレーター上での立ち止まりを義務付ける市条例が昨年10月に施行されて4カ月。市営地下鉄伏見駅では、人工知能(AI)などの先進技術を活用し、エスカレーターの安全利用につなげる実証実験が行われている。AIが歩行者らを自動検知し、音声で注意喚起するシステム。5日、その様子が報道陣に公開された。 続きを読む

多言語話者になるための脳科学的条件――新たな言語の文法習得を司る脳部位を特定―― | 東京大学

2024/01/19 このエントリーをはてなブックマークに追加 160 users Instapaper Pocket Tweet Facebook Share Evernote Clip マサチューセッツ工科大学 カザフ語 言語 脳部位 言語習得

2024年1月19日 国立大学法人 東京大学 マサチューセッツ工科大学 一般財団法人 言語交流研究所 発表のポイント 英語やスペイン語等の習得経験のある日本語母語話者が、新たにカザフ語の文に音声で触れた時、その文法習得を司る脳部位を特定しました。 この新たな言語習得を司る脳部位は、これまで母語や第2言語の文法処... 続きを読む

他人が装着するイヤフォンだけに“いきなり音楽を注入できる”システム 明治大が開発

2024/01/09 このエントリーをはてなブックマークに追加 207 users Instapaper Pocket Tweet Facebook Share Evernote Clip イヤフォン 波形 ヘッドフォン アンプ コンピュータ

このシステムは、磁気誘導を用いて、ヘッドフォンやイヤフォン内の振動板を直接鳴動させ、装着者だけが聴取できる音を生成する。WhisperCastのハードウェア構成には、空芯コイルとアンプを含んでいる。 具体的なプロセスとして、コンピュータが任意の波形(通知音や好きな音楽、音声など)を生成し、これを音声信号とし... 続きを読む

俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ

2023/12/01 このエントリーをはてなブックマークに追加 135 users Instapaper Pocket Tweet Facebook Share Evernote Clip Python エムスリーテックブログ 自動生成 最強

こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。 麻雀を始めるときに一番の障壁になるのは点数... 続きを読む

ESET社員、生成AIで自社CEOの声を作って不正送金させる実験に成功

2023/11/27 このエントリーをはてなブックマークに追加 215 users Instapaper Pocket Tweet Facebook Share Evernote Clip 生成AI 実験 ESET ソーシャルエンジニアリング攻撃 成功

ESETは11月22日(現地時間)、「Your voice is my password – the risks of AI-driven voice cloning」において、生成AIにより合成した音声を悪用したソーシャルエンジニアリング攻撃の実験に成功したと伝えた。この実験では、従業員が自社の最高経営責任者(CEO: Chief Executive Officer)になりすまして、財務責任者から... 続きを読む

まるで人間と会話「ChatGPT with voice」が無償公開 「語尾に“にゃん”と付けて」とお願いしたら気まずくなった

2023/11/24 このエントリーをはてなブックマークに追加 315 users Instapaper Pocket Tweet Facebook Share Evernote Clip 語尾 iOS chatgpt ヘッドフォン 米OpenAI

米OpenAIが提供する対話型AI「ChatGPT」のアプリ版(Android、iOS)で、まるで人間と会話しているように受け答えする音声対話機能「ChatGPT with voice」が無償の一般ユーザーでも使えるようになった。 ChatGPTのアプリを開き、右下にあるヘッドフォンのアイコンをタップすると音声による対話を始められる。初期設定時は... 続きを読む

 
(1 - 25 / 371件)