タグ「音声」 - はてブログ

タグ音声

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 371件)

Aivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか？

2024/11/19 138 users 革命感動音声合成技術未来開発プロジェクト

声に革命を。Aivis Project が切り拓く、感動の音声体験。 Aivis Project は、感情豊かな音声合成技術を誰もがかんたんに活用できる未来を目指す、壮大な開発プロジェクトです。機械的な響きに留まらない、まるで魂を宿したかのような音声が、あなたの想いや言葉に豊かな感情をのせて世界へと響き渡る。Aivis Project... 続きを読む

伊藤詩織さん監督映画に「人権上の問題」　元代理人の弁護士ら、修正求め会見　「取材源の秘匿守られず」：東京新聞 TOKYO Web

2024/10/21 168 users 秘匿代理人許諾訴訟記者会見

ジャーナリスト伊藤詩織さん（35）が制作したドキュメンタリー映画「Black Box Diaries」に、当事者の許諾を得ぬまま音声や動画が使われていると、伊藤さんが性被害による損害賠償を求めた訴訟で代理人を務めた弁護士らが21日、東京都内で記者会見し公表した。「取材源の秘匿が守られておらず、人権上問題がある」と、伊... 続きを読む

無料で自動文字起こし＆テキストで音声編集も可能な「audapolis」を使ってみた

2024/08/04 148 users GitHub テキスト音声編集ツールオープンソース

オープンソースで開発される「audapolis」は書き起こし機能を備えたメディアエディターで、音声を自動的にテキストに書き起こすだけでなく、書き起こしたテキストを編集することで同時に音声も編集できるツールで、無料で使うことができます。 GitHub - bugbakery/audapolis: an editor for spoken-word audio with auto... 続きを読む

兵庫県知事「今、記憶がない」“特産品の要求音声”直撃に…　パワハラ告発男性が残す｜日テレNEWS NNN

2024/07/18 239 users 直撃パワハライチゴ日テレNEWS NNN 斎藤知事

兵庫県の斎藤知事のパワハラや贈答品などを巡る問題。18日、知事が県の特産品を要求したとされる音声を本人に直撃しました。 ◇ 斎藤知事のものとされる音声「ワインをちょっと、まだ私は飲んでいないのでぜひまた。この間はイチゴ・じゃこ・塩はあれですけど、また折をみてよろしくお願いします」この音声は、斎藤知事... 続きを読む

【独自】「死を持って抗議する」知事のパワハラ疑惑告発　死亡の元職員　証拠とみられる「音声」など残す

2024/07/14 233 users パワハラ疑惑告発パワハラ疑惑陳述書斎藤知事知事

【独自】「死を持って抗議する」知事のパワハラ疑惑告発　死亡の元職員　証拠とみられる「音声」など残す07月15日 00:46 兵庫県の斎藤知事のパワハラ疑惑などを告発した元幹部職員が「死をもって抗議する」というメッセージとともに、出席できない百条委員会に向け、陳述書や疑惑にまつわる音声データを残していたことが... 続きを読む

PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

2024/06/20 124 users ベクマネージドサービス PostgreSQL 生成AI 数値

PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベク... 続きを読む

GPT-4oを使って2Dの図面から3DのCADモデルを作る

2024/05/19 161 users GPT-4o 図面 OpenAI OCR シロクマ

はじめに株式会社ファースト・オートメーションCTOの田中(しろくま)です！先日、 OpenAIからGPT-4oがリリースされました。いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が... 続きを読む

「GPT-4o」発表　頭一つ抜けた性能をChatGPT無料版にも展開　音声と視覚を備えて“自然な対話”可能に【追記済】

2024/05/13 324 users GPT-4o 視覚対話追記済性能

米OpenAIは5月13日（米国時間）、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 G... 続きを読む

GPT-4o の概要｜npaka

2024/05/13 237 users npaka Omni GPT-4o 対話出力

以下の記事が面白かったので、簡単にまとめました。・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。音声入力にはわず... 続きを読む

好きなポッドキャストについてまとめる

2024/04/18 1414 users ポッドキャスト YouTube Googleポッドキャスト

そもそもポッドキャストって何？映像のない YouTube のような存在がポッドキャストです。つまり、ラジオのようなものです。 YouTube のように、素人も投稿できる音声メディアです。どうやって聞けるの？iOSからであれば、Apple Podcast Androidからであれば、Googleポッドキャスト ※Googleポッドキャストは、YouTube... 続きを読む

新・必須ガジェット。テレワークのストレスを全部解決してくれました | ライフハッカー・ジャパン

2024/04/17 148 users デバイスお互い周囲オンラインならではテレワーク

もう手放せない。最近毎日のように行なっているオンライン会議。自宅や好きな場所で、いろいろな人と打ち合わせができるのはたいへんありがたいもの。しかし、オンラインならではのストレスもあります。たとえば音声の問題。お互いの使っているデバイスや周囲の環境などにより、声が聞こえづらくなると、何度も聞き返... 続きを読む

宇都宮駅に「当駅では収益性のある動画共有サイトなどへの投稿を目的とした撮影行為はお断りしております」という貼り紙があったが実効性はあるのか？

2024/04/15 155 users 貼り紙実効性宇都宮駅収益性撮影行為

知らない所へ @ShiranaiTokoroe 最近のテレビ番組、JR東日本の構内は写真と音声だけになってる。つまり宇都宮駅に限らず一切の撮影許可が下りない事になってる。その原因は、まあ迷惑者の仕業だよな。ホント、末代まで滅びて欲しい。 x.com/Amausa_Samma/s… 2024-04-15 08:37:19 続きを読む

自民党・長谷川岳議員の“叱責”音声を入手「ありがとうもクソもメールもない」札幌市の職員に約30分間（TBS NEWS DIG Powered by JNN） - Yahoo!ニュース

2024/04/13 166 users あんた長谷川岳参院議員客室乗務員長谷川議員叱責

自民党　長谷川岳参院議員「あんたから1回も、ありがとうもクソもメールもない、ありがとうもない！結果もない！誰だお前は！？って感じだよね」市職員「はい、申し訳ございません」これは自民党の長谷川岳参院議員が先月、札幌市の職員をおよそ30分間にわたり叱責した時の音声。長谷川議員は客室乗務員への威圧的... 続きを読む

自民党派閥の裏金「森元総理が会長の時にスキームが作られた」と示唆　下村博文議員とされる音声　“政倫審”では語られなかった内容も…【news23】 | TBS NEWS DIG

2024/04/11 137 users 裏金森元総理下村博文衆院議員スキーム政倫審

自民党派閥の裏金事件をめぐり、下村博文衆院議員が政倫審後に発言したとされる音声データの存在が明らかになりました。音声では、裏金作りが「森元総理が会長の時にスキームが作られた」ことが示唆されるなど、政… 続きを読む

中学生でもわかる深層学習

2024/03/29 508 users 深層学習中学生ニューラルネットワーク勾配降下法講演

第1章　理論編・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章　応用編・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識／自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む

猫に算数を教えてる

2024/03/01 125 users 算数定年数字材料ボタン

定年退職して暇になったので最近は専ら猫に算数を教えてる。といっても猫は喋れないのでまずはそこから取り掛かることにした。ホームセンターに行って適当に材料を揃えて数字スイッチを作り、これはボタンを押すと数字を読み上げるだけの単純な装置だ。例えばボタン1を押すと「1」という音声が流れ、ボタン2を押すと... 続きを読む

無料の「Davinci Resolve」でプロみたいにキレイな音声を実現する方法【働く人のための「DaVinci Resolve」】

2024/03/01 173 users DaVinci Resolve 方法無料

これは“AIキャバクラ”なのか!?　おしゃべりAI「Cotomo」と話したら“重い彼女”がいる気分に

2024/02/28 257 users Cotomo こども気分初対面 iPhone用

友達と電話するように会話しながら、ほめたり労ったりしてくれるコトモ。「すごい！」「賢い」「頑張っているんだね」……言われて悪い気はしない。だが「初対面で何でそこまで？」と白々しくも感じるし、会話はまったく深まらない。キャバクラの会話ってこんな感じなのかも？　行ったことないけど……。ただ、その技術は... 続きを読む

Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開

2024/02/18 144 users Magika word Excel フォーマット PDF

Googleは、AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をオープンソースで公開したと発表しました。 Magikaは、あるファイルの中味が何なのか、記述されたプログラミング言語の種類、動画や画像、音声などのフォーマットの種類、ExcelやWord、PDFなどのオフィス系ソフトウェアの種類、OS... 続きを読む

エスカレーター歩くと「条例違反です」ＡＩ声掛け　名古屋市営地下鉄で実証実験：中日新聞Web

2024/02/05 253 users エスカレーター人工知能条例違反実証実験名古屋市営地下鉄

エスカレーター上での立ち止まりを義務付ける市条例が昨年10月に施行されて4カ月。市営地下鉄伏見駅では、人工知能（AI）などの先進技術を活用し、エスカレーターの安全利用につなげる実証実験が行われている。AIが歩行者らを自動検知し、音声で注意喚起するシステム。5日、その様子が報道陣に公開された。続きを読む

多言語話者になるための脳科学的条件――新たな言語の文法習得を司る脳部位を特定―― | 東京大学

2024/01/19 160 users マサチューセッツ工科大学カザフ語言語脳部位言語習得

2024年1月19日国立大学法人　東京大学マサチューセッツ工科大学一般財団法人言語交流研究所発表のポイント英語やスペイン語等の習得経験のある日本語母語話者が、新たにカザフ語の文に音声で触れた時、その文法習得を司る脳部位を特定しました。この新たな言語習得を司る脳部位は、これまで母語や第2言語の文法処... 続きを読む

他人が装着するイヤフォンだけに“いきなり音楽を注入できる”システム　明治大が開発

2024/01/09 207 users イヤフォン波形ヘッドフォンアンプコンピュータ

このシステムは、磁気誘導を用いて、ヘッドフォンやイヤフォン内の振動板を直接鳴動させ、装着者だけが聴取できる音を生成する。WhisperCastのハードウェア構成には、空芯コイルとアンプを含んでいる。具体的なプロセスとして、コンピュータが任意の波形（通知音や好きな音楽、音声など）を生成し、これを音声信号とし... 続きを読む

俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ

2023/12/01 135 users Python エムスリーテックブログ自動生成最強

こちらはエムスリー Advent Calendar 2023 1日目の記事です。 Overview エムスリーエンジニアリンググループ AI・機械学習チームでソフトウェアエンジニアをしている中村(po3rin) です。趣味は麻雀でフリー雀荘で毎年200半荘以上打ちます。好きな麻雀プロは園田賢さんです。麻雀を始めるときに一番の障壁になるのは点数... 続きを読む

ESET社員、生成AIで自社CEOの声を作って不正送金させる実験に成功

2023/11/27 215 users 生成AI 実験 ESET ソーシャルエンジニアリング攻撃成功

ESETは11月22日(現地時間)、「Your voice is my password – the risks of AI-driven voice cloning」において、生成AIにより合成した音声を悪用したソーシャルエンジニアリング攻撃の実験に成功したと伝えた。この実験では、従業員が自社の最高経営責任者(CEO: Chief Executive Officer)になりすまして、財務責任者から... 続きを読む

まるで人間と会話「ChatGPT with voice」が無償公開　「語尾に“にゃん”と付けて」とお願いしたら気まずくなった

2023/11/24 315 users 語尾 iOS chatgpt ヘッドフォン米OpenAI

米OpenAIが提供する対話型AI「ChatGPT」のアプリ版（Android、iOS）で、まるで人間と会話しているように受け答えする音声対話機能「ChatGPT with voice」が無償の一般ユーザーでも使えるようになった。 ChatGPTのアプリを開き、右下にあるヘッドフォンのアイコンをタップすると音声による対話を始められる。初期設定時は... 続きを読む

(1 - 25 / 371件)

次の25件 »

タグ音声

Aivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか？

伊藤詩織さん監督映画に「人権上の問題」　元代理人の弁護士ら、修正求め会見　「取材源の秘匿守られず」：東京新聞 TOKYO Web

無料で自動文字起こし＆テキストで音声編集も可能な「audapolis」を使ってみた

兵庫県知事「今、記憶がない」“特産品の要求音声”直撃に…　パワハラ告発男性が残す｜日テレNEWS NNN

【独自】「死を持って抗議する」知事のパワハラ疑惑告発　死亡の元職員　証拠とみられる「音声」など残す

PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化

GPT-4oを使って2Dの図面から3DのCADモデルを作る

「GPT-4o」発表　頭一つ抜けた性能をChatGPT無料版にも展開　音声と視覚を備えて“自然な対話”可能に【追記済】

GPT-4o の概要｜npaka

好きなポッドキャストについてまとめる

新・必須ガジェット。テレワークのストレスを全部解決してくれました | ライフハッカー・ジャパン

宇都宮駅に「当駅では収益性のある動画共有サイトなどへの投稿を目的とした撮影行為はお断りしております」という貼り紙があったが実効性はあるのか？

自民党・長谷川岳議員の“叱責”音声を入手「ありがとうもクソもメールもない」札幌市の職員に約30分間（TBS NEWS DIG Powered by JNN） - Yahoo!ニュース

自民党派閥の裏金「森元総理が会長の時にスキームが作られた」と示唆　下村博文議員とされる音声　“政倫審”では語られなかった内容も…【news23】 | TBS NEWS DIG

中学生でもわかる深層学習

猫に算数を教えてる

無料の「Davinci Resolve」でプロみたいにキレイな音声を実現する方法【働く人のための「DaVinci Resolve」】

これは“AIキャバクラ”なのか!?　おしゃべりAI「Cotomo」と話したら“重い彼女”がいる気分に

Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開

エスカレーター歩くと「条例違反です」ＡＩ声掛け　名古屋市営地下鉄で実証実験：中日新聞Web

多言語話者になるための脳科学的条件――新たな言語の文法習得を司る脳部位を特定―― | 東京大学

他人が装着するイヤフォンだけに“いきなり音楽を注入できる”システム　明治大が開発

俺が考える最強の「麻雀点数申告練習アプリケーション」を作ってみる ~ Pythonによる麻雀点数計算問題の自動生成と音声による点数申告 ~ - エムスリーテックブログ

ESET社員、生成AIで自社CEOの声を作って不正送金させる実験に成功

まるで人間と会話「ChatGPT with voice」が無償公開　「語尾に“にゃん”と付けて」とお願いしたら気まずくなった

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ

タグ 音声

本日の新着エントリー

本日の人気エントリー

1年前の人気エントリー

先週のランキング

人気エントリーにあるタグ

最近の注目エントリー

最近の注目タグ

タグ音声