タグ 話者
新着順 10 users 50 users 100 users 500 users 1000 users世界の言語の数は話者が亡くなると減る一方のはずなのに実際は増えているというパラドックスの正体とは?
言語は話者が全員亡くなってしまうと消滅します。ニカラグア手話のように新たな言語が生まれることはあっても数は少ないため、世界の言語の数は減り続けているはずですが、実際には年々増加しています。なぜそのようなことが起きているのか、YouTubeチャンネルのMinuteEarthがアニメーションで解説しています。 The Lang... 続きを読む
OpenAIの「Voice Engine」は15秒分の声データを元に本人そっくりに喋る
米OpenAIは3月29日(現地時間)、人の声を再現できる生成AIモデル「Voice Engine」を発表した。テキスト入力と15秒分の音声サンプルで、元の話者によく似た自然な音声を生成できる。感情的なリアルな音声で、母国語以外の言語も話せる。 2022年から開発していたこのモデルは、既に同社の「Text-to-Speech API」や「ChatG... 続きを読む
東京外大で超マイナー言語を専攻していた子、国内で年間2~3人しかその言語の話者が生れないため、就職先としてスパイ的な仕事があるらしい
soy @nattou_muri 東京外大で超マイナー言語を専攻していた子、国内で年間2~3人しかその言語の話者が生れないため、就職先としてスパイ的な仕事があると言っていたな。命の危険が伴うため年収は高いらしい。 2024-01-25 15:38:09 続きを読む
「マジンガーZ」見て育ったイタリア出身研究者、日本語方言の未来案じ「オンライン辞書」
【読売新聞】 日本の方言を研究している九州大の元研究員・サルバトーレ・カルリノさん(35)が、日本各地の方言を集約するオンライン辞書を開発し、ウェブサイトで公開している。沖縄の方言を調べる中で、話者の高齢化が進む現状に危機感を抱いた 続きを読む
最近のAIボイスチェンジャー(RVC、so-vits-svc)
私は趣味で機械学習を学ぶ初学者であり、説明に間違いや勘違いがある可能性があります。そういった点がありましたらコメントで指摘していただけると助かります。 AIボイスチェンジャーとは ある発話音声の入力を特定の話者が発話したような声質の発話音声に変換するための、深層学習を使用したアプローチがそう呼ばれて... 続きを読む
「サイバーパンク2077」のようなリアルタイム翻訳システムをWhisperやDeepLを駆使して実現した猛者が現る
「サイバーパンク2077」をプレイしたというエンジニアのマルチン・エランコウスキ氏が、同作で登場するリアルタイム翻訳システムのような「話者の上にリアルタイムで会話内容が表示され翻訳まで行ってくれる翻訳システム」の開発に取り組んでいます。 GitHub - elanmart/cbp-translate https://github.com/elanmart/cbp-... 続きを読む
音声認識が急激に進化、実用レベルになったフリーの文字起こしソフト
会議録を作る際、録音を繰り返し聞いて文字起こしするのは大変だ。最近は音声認識の技術が急速に進化し、無料でテキスト化できるアプリもある。使わないのは損だ。 「LINE CLOVA Note」は認識精度が高く、複数の話者を区別できるので実用性が高い(図1)。利用にはLINEアカウントが必要(図2、図3)。スマホアプリ版はそ... 続きを読む
AIボイスチェンジャーソフト『Voidol』が期間限定で無償配布へ。話者の声をリアルタイムで男性や女性のキャラボイスに変換、実況配信や動画編集など多彩なシーンで使える
AIボイスチェンジャーソフト『Voidol』が期間限定で無償配布へ。話者の声をリアルタイムで男性や女性のキャラボイスに変換、実況配信や動画編集など多彩なシーンで使える クリムゾンテクノロジーは6月8日(水)、AI技術でリアルタイムに話者の音声を変換するボイスチェンジャーソフト『Voidol』を無償配布すると発表した... 続きを読む
LINEが無料のAI文字起こしアプリ「CLOVA Note」を提供開始 ~話者を区別した議事録作成も可能/世界3位の性能評価成績を獲得したAI音声認識モデルを採用
LINEがAI文字起こしアプリを無料提供 話者を聞き分けて記録する「分離機能」も
LINEは5月24日、AI文字起こしアプリ「CLOVA Note」(iOS/Android、Webブラウザ)のβ版をリリースした。利用料は無料。複数の参加者の声を聞き分けて別々に記録する話者分離ができるのが特徴。 LINEのAI音声認識技術「CLOVA Speech」を活用し、音声を文字に変換する。アプリ上で録音した音声を文字起こしできる他、録音... 続きを読む
「ぺこぱ松陰寺はネット右翼」噂の真相に迫る。かまいたち山内など、芸人ネット右翼化には”あのラジオ局”が関係していた?【話者:吉田豪、久田将義】
左から吉田豪氏(@WORLDJAPAN)、久田将義氏(@masayoshih)。久田: 見た限りではこの人はネット右翼ですね。 吉田: 「虎ノ門ニュース見なきゃ」とか「青山繁晴さん聴きながらちょっと8km走ってくる」とか過去にツイートしてたんですよね。 久田: ちなみに青山繁晴さんは自民党ですけど、自民党の中でも正直ちょっと... 続きを読む
ある言語に「統一」することはそもそも不可能なのだ 現時点で、国際語とな..
ある言語に「統一」することはそもそも不可能なのだ現時点で、国際語となっている英語には、すでに多数のバリエーション(つまり方言)が存在しているのだ。イギリス英語、アメリカ英語、オーストラリア英語が違うことはよくネタにもされるので普通に知っているだろうが、英語を母語とする話者が一定いる地域が誕生すれ... 続きを読む
Web会議の議事録を自動作成、頻出単語の分析も ユーザーローカルが無料公開 - ITmedia NEWS
ユーザーローカルが、Web会議の議事録を自動で作成するサービスを無料公開。会議の内容をテキストとして自動で保存できる。 ユーザーローカルは9月15日、Web会議の議事録を自動作成するサービスを無料公開した。複数の話者の音声を認識し、会議の内容をテキストとして自動で保存する。会話の内容や発言者の感情をテキス... 続きを読む
東芝が世界初のAI技術を開発、家電だけで音声・話者を同時に認識 | Ledge.ai
※写真は東芝ライテック株式会社トップページを撮影 話しかけるだけで家電を操作できるようになってきた。さらに、誰が音声で操作をしたのか識別し、その話者に合わせて機器の動きを変える機能も出てきている。 株式会社東芝は2月20日、キーワード検出と話者認識を同時に処理するAI技術を開発したと発表。実はこの技術、... 続きを読む
ストーレンハーグ『エレクトリック・ステイト』拙訳についての論難は不当だと思うのです。 - 山形浩生の「経済のトリセツ」
Executive Summary シモン・ストーレンハーグ『エレクトリック・ステイト』の山形の翻訳について、アマゾンレビューで悪口が出ているけれど、山形自身は不当だと思う。その主張と山形の言い分は以下の通り。 話者が二人いるのを、一人だと誤解している! → まさか。一人称を見なさい。訳し分けてます。 それをごまかすた... 続きを読む
Amazonが感情を認識するAlexaウェアラブルを開発中 | TechCrunch Japan
Amazonは、おそらく現時点でユーザーのあらゆることを知っているので、感情を監視しない理由はない。同社が開発中と言われているウェアラブル・ウェルネス・デバイスは、ユーザーの心の状態を認識できるらしい。Bloombergの記事が「内部資料」に基づいて伝えている。 この少し前、同社はAlexaが話者の心的状態を読み取り... 続きを読む
Google、話者の声質を維持したまま変換できる音声翻訳技術「Translatotron」 ~文章化を行なわず音声間で直接変換 - PC Watch
Googleが音声翻訳で話者の声を保ったまま翻訳させる画期的なシステム「Translatotron」を発表 - GIGAZINE
by rawpixel.com Googleが、人が話した内容を本人の声を保ったまま音声翻訳してくれる「Translatotron(トランスラトトロン)」について詳細を明かしました。従来モデルとは異なるエンドツーエンドモデルを採用した画期的なシステムとなっており、音声翻訳の未来を切り開くものと考えられています。 Google AI Blog: Intro... 続きを読む
会議音声を自動でテキスト化 話者も識別 日立が新サービス - ITmedia NEWS
会議を録音した音声ファイルから自動で書き起こすクラウドサービスを日立製作所がスタート。音源の方向から話者を識別し、話者ごとに会話をテキスト化する。 日立製作所は10月16日、会議などの音声ファイルから自動でテキストを書き起こすクラウドサービス「音声書き起こし支援サービス」の販売を始めた。音源の方向から... 続きを読む
「インターネットってワイワイ楽しむものだったのに」 #MeToo、Hagex事件から考えるネットで発信するリスク【話者:中川淳一郎・ヨッピー・はあちゅう】
ウェブ編集者である中川淳一郎氏と、人気ウェブライターのヨッピー氏がお届けする、「ネット上の諸問題についてゲストともに考える」好評企画が久しぶりに帰ってきた! 今回は、上司から受けたパワハラ・セクハラを告白し、日本における#MeTooの議論の引き金となったブロガー・作家のはあちゅう氏をゲストに迎え、ネット... 続きを読む
「しみけんとの馴れ初めは? なぜ事実婚?」 はあちゅう氏の吉報を受けて事の経緯をあれこれ訊いてみた【話者:中川淳一郎・ヨッピー・はあちゅう】
ウェブ編集者である中川淳一郎氏と、人気ウェブライターのヨッピー氏がお届けする、「クソメディア」が乱立する地獄絵図のネット社会をバッサッバッサと斬りまくる好評企画が久しぶりに帰ってきた! 今回は、AV男優・しみけん氏との“事実婚”が大きな話題を呼んだ、ブロガー・作家のはあちゅう氏をゲストに迎え、馴れ初め... 続きを読む
ドラッグ・AV・死体写真etc…“90年代サブカル鬼畜ブーム”を振り返る【話者:吉田豪・久田将義・水野しず】
あれ? みたいに、もしかしたら自分はそういう昔のことをちゃんと総括しないまま生きてきて、ある日サブカルスイッチが入って、そういうものも良しとするような自分もどこかにいることに気づいて、自己批判をはじめたみたいな感じなんですね。 久田: そうそう。 吉田: 死体写真だのドラッグだのいろいろなものが90年代... 続きを読む
WELQ問題の火付け役と騒動を振り返り、1年以上経った今、Webメディアはどんな影響を受けたのか考察【話者:中川淳一郎・ヨッピー・朽木誠一郎】
『ネットは基本、クソメディア』の著者である 中川淳一郎氏 と、人気Webライターの ヨッピー氏 がお届けする、「クソメディア」が乱立する地獄絵図のネット社会をバッサッバッサと斬りまくる好評企画も第三弾! 今回は、『健康を食い物にするメディアたち – ネット時代の医療情報との付き合い方』を上梓したばかりのライター・ 朽木誠一郎氏 をゲストに招き、WELQ問題に端を発した、Web上に氾濫する眉唾物の... 続きを読む
会話をテキスト化する「UDトーク」、話者の感情認識が可能に - ITmedia Mobile
UDトークでは会話/スピーチなどの音声を認識してリアルタイムにテキスト化し、聴覚障害者や外国人との会話をサポート。両社は音声認識技術と感情認識技術の活用を促進していく。 感情認識技術では、音声の特徴量を元に「喜び」「怒り」「平静」を判定。従来の言語解析型では判定が困難だった固有名詞などに左右されず、最大70%程度の認識率で感情を判定・解析する。アプリ内では感情の度合いをリアルタイムに表示し、翻訳テ... 続きを読む
なぜ、話下手な人間が、プロの話者になれるのか:日経ビジネスオンライン
「隠れた人格と才能」を開花させる技法 先生は、今年5月に上梓された新著、『 人は、誰もが「多重人格」 - 誰も語らなかった「才能開花の技法」 』において、人は、誰もが心の中に「複数の人格」を持った「多重人格」であり、日常においては、無意識に、仕事や生活の状況や場面に合わせて「様々な人格」を使い分け、それによって、他人と円滑にコミュニケーションを取り、仕事で高いパフォーマンスを発揮していると述べられ... 続きを読む