タグ 音声
人気順 5 users 10 users 100 users 500 users 1000 usersAivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか?
声に革命を。Aivis Project が切り拓く、感動の音声体験。 Aivis Project は、感情豊かな音声合成技術を誰もがかんたんに活用できる未来を目指す、 壮大な開発プロジェクトです。 機械的な響きに留まらない、まるで魂を宿したかのような音声が、あなたの想いや言葉に豊かな感情をのせて 世界へと響き渡る。Aivis Project... 続きを読む
兵庫県議会の百条委、非公開の音声が流出か 前副知事がPC内容を説明する場面
兵庫県議会の百条委、非公開の音声が流出か 前副知事がPC内容を説明する場面 2024/11/06 06:39 【神戸経済ニュース】死亡した元西播磨県民局長が斎藤元彦前知事に対する「告発文」を作成した問題(文書問題)で、10月25日に非公開で開催した兵庫県議会の調査特別委員会(百条委員会)の一部の音声が流出したとみられ... 続きを読む
伊藤詩織さん監督映画に「人権上の問題」 元代理人の弁護士ら、修正求め会見 「取材源の秘匿守られず」:東京新聞 TOKYO Web
ジャーナリスト伊藤詩織さん(35)が制作したドキュメンタリー映画「Black Box Diaries」に、当事者の許諾を得ぬまま音声や動画が使われていると、伊藤さんが性被害による損害賠償を求めた訴訟で代理人を務めた弁護士らが21日、東京都内で記者会見し公表した。「取材源の秘匿が守られておらず、人権上問題がある」と、伊... 続きを読む
無料で自動文字起こし&テキストで音声編集も可能な「audapolis」を使ってみた
オープンソースで開発される「audapolis」は書き起こし機能を備えたメディアエディターで、音声を自動的にテキストに書き起こすだけでなく、書き起こしたテキストを編集することで同時に音声も編集できるツールで、無料で使うことができます。 GitHub - bugbakery/audapolis: an editor for spoken-word audio with auto... 続きを読む
【422】ARuFa・恐山の匿名ラジオ「外部ゲストを呼んでみよう!ゲスト『星野源』」 | オモコロ
音声だけ聴くときはこちらから ※Youtube版では話題に合わせて画像が表示されることがあります。 ARuFaと恐山の「匿名ラジオ」第422回は「外部ゲストを呼んでみよう!ゲスト『星野源』」です。 匿名ラジオグッズ発売中! お買い求めはオモコロストアから! ☆オール録りおろしCD 第3弾! 匿名ラジオCD第3弾「ボディプレス... 続きを読む
兵庫県知事「今、記憶がない」“特産品の要求音声”直撃に… パワハラ告発男性が残す|日テレNEWS NNN
兵庫県の斎藤知事のパワハラや贈答品などを巡る問題。18日、知事が県の特産品を要求したとされる音声を本人に直撃しました。 ◇ 斎藤知事のものとされる音声 「ワインをちょっと、まだ私は飲んでいないのでぜひまた。この間はイチゴ・じゃこ・塩はあれですけど、また折をみてよろしくお願いします」 この音声は、斎藤知事... 続きを読む
【独自】「死を持って抗議する」知事のパワハラ疑惑告発 死亡の元職員 証拠とみられる「音声」など残す
【独自】「死を持って抗議する」知事のパワハラ疑惑告発 死亡の元職員 証拠とみられる「音声」など残す07月15日 00:46 兵庫県の斎藤知事のパワハラ疑惑などを告発した元幹部職員が「死をもって抗議する」というメッセージとともに、出席できない百条委員会に向け、陳述書や疑惑にまつわる音声データを残していたことが... 続きを読む
PostgreSQLを生成AIの情報源として使える高速ベクトルデータベース化拡張「Pgvectorscale」がオープンソースで公開。Pgvectorをさらに高性能化
PostgreSQLのマネージドサービスなどを提供しているTimescaleは、PostgreSQLで高速なベクトルデータベース機能を実現する拡張機能「Pgvectorcale」をオープンソースとして公開したことを発表しました。 大規模言語モデルを用いた生成AIの注目度が高まる中で、文章や画像、音声といったデータの特徴を数値で表現するベク... 続きを読む
AIで簡単に実装コードを生成できる! テキストからCSSアニメーションのコードを生成できるツール -AI CSS Animations
簡単にCSSアニメーションのコードを生成できるAIツールが登場しました。テキストや音声でプロンプトを入力するだけで、複雑なCSSアニメーションでも数秒でコードが生成されます。 生成されたCSSアニメーションはその場ですぐ...記事の続きを読む 続きを読む
世界で初めて〝食用〟ロボットの開発に成功 ヒントはアンパンマン、よりおいしさ感じるか
世界初となる食べることを目的としたロボット「こんにちは。今日、私はあなたと会話できることを楽しみにしてました」。音声とともに両手を振り、左右に揺れる全長約7センチの薄黄色の物体。つぶらな瞳もある。リンゴ味のグミだが、実はロボット。電気通信大の仲田佳弘准教授(ロボット工学)らのチームが、世界初とな... 続きを読む
GPT-4oを使って2Dの図面から3DのCADモデルを作る
はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が... 続きを読む
「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 G... 続きを読む
GPT-4o の概要|npaka
以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわず... 続きを読む
ChatGPTと“声”で会話する方法解説書が発売 ~ブラウザーやAlexaにも組み込める!/『ChatGPTと音声で会話する3つの方法』発売【Book Watch/ニュース】
好きなポッドキャストについてまとめる
そもそもポッドキャストって何?映像のない YouTube のような存在が ポッドキャストです。 つまり、ラジオのようなものです。 YouTube のように、素人も投稿できる音声 メディアです。 どうやって聞けるの?iOSからであれば、Apple Podcast Androidからであれば、Googleポッドキャスト ※Googleポッドキャストは、YouTube... 続きを読む
新・必須ガジェット。テレワークのストレスを全部解決してくれました | ライフハッカー・ジャパン
もう手放せない。 最近毎日のように行なっているオンライン会議。自宅や好きな場所で、いろいろな人と打ち合わせができるのはたいへんありがたいもの。しかし、オンラインならではのストレスもあります。 たとえば音声の問題。お互いの使っているデバイスや周囲の環境などにより、声が聞こえづらくなると、何度も聞き返... 続きを読む
宇都宮駅に「当駅では収益性のある動画共有サイトなどへの投稿を目的とした撮影行為はお断りしております」という貼り紙があったが実効性はあるのか?
知らない所へ @ShiranaiTokoroe 最近のテレビ番組、JR東日本の構内は写真と音声だけになってる。つまり宇都宮駅に限らず一切の撮影許可が下りない事になってる。その原因は、まあ迷惑者の仕業だよな。ホント、末代まで滅びて欲しい。 x.com/Amausa_Samma/s… 2024-04-15 08:37:19 続きを読む
自民党・長谷川岳議員の“叱責”音声を入手「ありがとうもクソもメールもない」札幌市の職員に約30分間(TBS NEWS DIG Powered by JNN) - Yahoo!ニュース
自民党 長谷川岳参院議員 「あんたから1回も、ありがとうもクソもメールもない、ありがとうもない!結果もない!誰だお前は!?って感じだよね」 市職員 「はい、申し訳ございません」 これは自民党の長谷川岳参院議員が先月、札幌市の職員をおよそ30分間にわたり叱責した時の音声。 長谷川議員は客室乗務員への威圧的... 続きを読む
自民党派閥の裏金「森元総理が会長の時にスキームが作られた」と示唆 下村博文議員とされる音声 “政倫審”では語られなかった内容も…【news23】 | TBS NEWS DIG
自民党派閥の裏金事件をめぐり、下村博文衆院議員が政倫審後に発言したとされる音声データの存在が明らかになりました。音声では、裏金作りが「森元総理が会長の時にスキームが作られた」ことが示唆されるなど、政… 続きを読む
中学生でもわかる深層学習
第1章 理論編 ・深層学習とは (p.13-) ・ニューラルネットワークとは (p.31-) ・どうやって学習するか: 勾配降下法 (p.57-) ・深層学習の注意点 (p.91-) 第2章 応用編 ・分類問題 (p.110-) ・画像認識 (p.120-) ・音声認識/自然言語処理 (p.151-) ・講演のまとめ (p.167-) 続きを読む
NEWS | プロジェクトセカイ カラフルステージ! feat. 初音ミク
本作におけるピアプロキャラクターズの設定は、「プロジェクトセカイ」における設定であり、公式設定とは異なります。 記載の商品名および社名は各社の登録商標です。 本サイトで使用されている 画像、文章、情報、音声、動画等は株式会社セガまたはその関連会社の著作権により保護されております。 著作権者の許可なく... 続きを読む
猫に算数を教えてる
定年退職して暇になったので最近は専ら猫に算数を教えてる。 といっても猫は喋れないのでまずはそこから取り掛かることにした。 ホームセンターに行って適当に材料を揃えて数字スイッチを作り、これはボタンを押すと数字を読み上げるだけの単純な装置だ。 例えばボタン1を押すと「1」という音声が流れ、ボタン2を押すと... 続きを読む
無料の「Davinci Resolve」でプロみたいにキレイな音声を実現する方法【働く人のための「DaVinci Resolve」】
これは“AIキャバクラ”なのか!? おしゃべりAI「Cotomo」と話したら“重い彼女”がいる気分に
友達と電話するように会話しながら、ほめたり労ったりしてくれるコトモ。「すごい!」「賢い」「頑張っているんだね」……言われて悪い気はしない。 だが「初対面で何でそこまで?」と白々しくも感じるし、会話はまったく深まらない。キャバクラの会話ってこんな感じなのかも? 行ったことないけど……。 ただ、その技術は... 続きを読む
Google、AIでファイルの種類を高速正確に判別できる「Magika」をオープンソースで公開
Googleは、AIを用いることでファイルの種類を高速かつ正確に判別できるツール「Magika」をオープンソースで公開したと発表しました。 Magikaは、あるファイルの中味が何なのか、記述されたプログラミング言語の種類、動画や画像、音声などのフォーマットの種類、ExcelやWord、PDFなどのオフィス系ソフトウェアの種類、OS... 続きを読む