タグ 訓練データ
人気順 10 users 50 users 100 users 500 users 1000 users「訓練データはタダではない」音楽業界が問う生成AIの根本的問題
強力な生成AIモデルを訓練するには膨大な量の訓練データを必要とする。音楽生成AIスタートアップ2社に対して大手レコード会社が今回起こした訴訟は、これまでで最大のメッセージを伝えている。それは「高品質な訓練データは無料ではない」ということだ。 by Melissa Heikkilä2024.07.15 0 この記事の3つのポイント 生成A... 続きを読む
AIが「心の理論」テストで人間超え、この結果は何を意味するか
人工知能(AI)モデルが、人間の感情理解力を測るテストで人間並み、時に上回る成績を収めたことが分かった。ただ、訓練データにそうしたタスクが含まれていた可能性も否定できず、大規模言語モデルが「人のように」考えているわけではない。 by Rhiannon Williams2024.05.22 40 7 人間は複雑な存在だ。私たちのコミュニケ... 続きを読む
人との接し方がわからず「健常者エミュレータ」を走らせて生活しているけど、やってることはAIと同じなのでは…?
椚座 くにゅくにゅ💉💉💉 淳介 @kunukunu わたし昔から人との接し方がわからなくて,後天的に構築した「健常者エミュレータ」を使って生活しているんだけれど,この正体は,過去に経験した様々なシーンを訓練データとして,もっとも穏当な対人応答をモデル化したものなんだよね。これ,やってることは機械学習AIとほぼ同... 続きを読む
次元の呪い(Curse of dimensionality)とは?:AI・機械学習の用語辞典 - @IT
用語「次元の呪い」について説明。特徴量などの次元が多くなるほど、必要な訓練データの量が「指数関数」的に増えてしまう現象を指す。 連載目次 用語解説 次元の呪い(Curse of dimensionality)とは、次元(=ニューラルネットワークで言うと入力データとなる特徴量)の数が増えるほど、正確に一般化する(=高い精度... 続きを読む
機械学習のための日本語前処理 - Qiita
はじめに 機械学習を使ったチャットボットの仕組みを理解するために、テキストを訓練データとする簡単なニューラルネットワークを作成した際の備忘録。 目的 英文テキストで作成したルールベース型チャットボットを、日本語テキストにも適用して動作させること。日本語テキストを前処理し、それをニューラルネットワーク... 続きを読む
デベロッパーが使う機械学習のモデルがグローバルなトレンドに合うようにするTensorFlow Lattice | TechCrunch Japan
GoogleのTensorFlowのチームが今日(米国時間10/11)、デベロッパーが使用する機械学習のモデルが、訓練データにノイズがあった場合でもグローバルなトレンドに合っているようにするためのツールTensorFlow Latticeをリリースした。Latticeは ルックアップテーブルのようなもの で、それにより、モデルを制約するマクロのルールを定義する過程を単純化する〔単なる表で表す〕。 ... 続きを読む
教師付き機械学習を始めるにあたって - ありんこのつぶやき
2014-08-12 教師付き機械学習を始めるにあたって 教師付き機械学習における憂慮点 ・訓練データとテストデータが異なる規則に従って生成されれば、訓練データからテストデータに関する情報が抽出できない。 →意味のある学習を行うためには訓練データとテストデータが何らかの共通点を持つ必要がある。 http://sugiyama-www.cs.titech.ac.jp/~sugi/2007/covar... 続きを読む