タグ「学習データ」

タグ学習データ

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 17 / 17件)

大規模言語モデルの開発

2024/05/30 60 users 言語モデル開発モテ人工知能学会全国大会構築

2024年度人工知能学会全国大会（第38回）チュートリアル講演１本講演では、大規模言語モデルの開発に必要な基礎および最新動向を概観する。その後、東京工業大学情報理工学院の岡崎研究室と横田研究室、産業技術総合研究所の研究チームで開発された大規模言語モデルSwallowの開発経験を踏まえ、学習データの構築、モデ... 続きを読む

「レベル4」自動運転事故カメラが自転車を認識できず福井 | NHK

2023/11/10 198 users 運行ブレーキ福井特定車両

10月に福井県永平寺町で全国で初めて特定の条件のもとで完全な自動運転「レベル4」の運行を行っていた車両が自転車に接触した事故について町は10日、障害物を検知するカメラの事前の学習データが不足していたため、自転車だと認識できず、自動でブレーキがかからなかったことが原因だなどと公表しました。この事故は10... 続きを読む

OpenAI APIのファインチューニングの学習データのガイドライン｜npaka｜note

2023/04/16 188 users ファインチューニングプロンプト書式 Note 出力

以下の記事を元に、「OpenAI API」のファインチューニングの学習データのガイドラインをまとめました。 1. 学習データの書式ファインチューニングするには、単一の入力「プロンプト」とそれに関連する出力「コンプリーション」のペアで構成される学習データが必要です。これは、１回のプロンプトで詳細な手順や複数の... 続きを読む

画像生成AI「Stable Diffusion XL」登場。DreamStudioならもう使えて、日本らしい人物・風景が簡単に生成できる（CloseBox） | テクノエッジ TechnoEdge

2023/04/03 293 users CloseBox TechnoEdge SDXL 従来ハード

Stability AIは、同社が提供している画像生成AI「Stable Diffusion」を大幅に強化した「Stable Diffusion XL」（SDXL）をオープンソース公開する計画であることを明らかにしました。学習データを従来の9億パラメータから、23億パラメータへと大幅に強化。これが次期バージョン3に組み込まれるとしています。現在パート... 続きを読む

ChatGPTは、質問するより作業を依頼する方が良さげ

2023/02/21 623 users chatgpt 表題良さげ筆者課金

賢いチャットAIとして話題のChatGPT。筆者も試しに課金をして、あれこれチャットを楽しんでいます。それで、ここまでの結論としては表題の通り、ChatGPTは質問をするよりも、作業を依頼する方が良さげだなと思いました。知識が古くて、質問には使えないなぜかというと、ChatGPTは現状では学習データが若干古く、例えば... 続きを読む

学習データに最適化されすぎて本来の目的が達成できなくなる「過学習」と同様の現象はAIだけでなく社会全体で起こっているという主張

2023/01/01 186 users 主張現象過学習本来未知

機械学習における過学習(過剰適合／オーバーフィッティング)とは、AIが学習データのみに最適化されてしまい、未知のデータに対する予測能力が低くなってしまうという現象です。そんな過学習と同様の現象が機械学習分野だけでなく社会全体のさまざまな場面でも発生していると、Google傘下の人工知能研究所・Google Brain... 続きを読む

【大炎上】イラストAIサイト「NovelAI」明確に絵描きの敵だった（danbooru という無断転載サイトを学習データに利用）

2022/10/04 219 users Danbooru novelAI rem 絵描き大炎上

NovelAI @novelaiofficial @NilaierMusic Since we are training on Danbooru, it also learns character names and their visuals. You can prompt for "masterpiece portrait of smiling rem, re zero, caustics, textile shading, high resolution illustration" and get this: pic.twitter.com/2wqDmAxCJa 2022-09-2... 続きを読む

「AI学習禁止」を表明しても、現行の法律では対応できない？技術と著作物の今後について議論盛り上がる

2022/08/29 399 users 現行議論 AI学習禁止法律技術

SmokingWOLF@｢片道勇者2｣開発中！(ｼﾙﾌｪｲﾄﾞ/ｳﾃﾞｨﾀ開発者) @WO_LF 「AI学習禁止」がトレンドに入っててすごい時代の風を感じる（※「自分のイラストを学習データに使わないで」という話題。個人のイラスト複数枚を入力することで画風をまねた顔イラスト画像を生成できるサービスが今日リリースされた影響） SF小説もびっく... 続きを読む

画像の機械学習が劣化する理由 - Qiita

2022/04/30 194 users 主旨 Qiita 大半著者ヒント

主旨単純に学習データを追加するだけでは学習が改善しないことがある。そのような場合へのヒントを著者の限られた経験の中から記述する。はじめに画像認識の機械学習を改善するためにはデータを追加すればよい。そう思っている人が大半だろう。ただ、データを追加したからといって必ずしも機械学習結果は改善しない... 続きを読む

カルビーのポテチを売上1.3倍にしたAIの正体--プラグの「パッケージデザインAI」の実力 - CNET Japan

2021/05/05 925 users ポテチカルビーマーケティングリサーチ森永乳業プラグ

カルビー、ネスレ日本、森永乳業など、日本を代表する食品メーカー各社が導入しはじめているAIツールがある。マーケティングリサーチとパッケージデザインを展開するプラグが2年前にリリースした「パッケージデザインAI」だ。 590万人の学習データをもとに、AIが商品のパッケージデザインをたった10秒で評価する。商品開... 続きを読む

NEC、従来技術の半分の学習データ量でも高精度に識別可能なディープラーニング技術を開発 (2019年8月19日): プレスリリース | NEC

2019/08/19 65 users NEC 識別プレスリリースディープラーニング技術半分

NECは、従来の半分程度の学習データ量でも高い識別精度を維持できるディープラーニング技術を新たに開発しました。識別精度の向上には、識別が難しい学習データをより多く学習することが有効ですが、学習に適した質の良いデータを十分に確保することが重要です。本技術は、ニューラルネットワーク(注1)の中間層で得られ... 続きを読む

落書きをリアルな風景写真にリアルタイムで変換できる驚異的なお絵かき技術「GauGAN」をNVIDIAが発表 - GIGAZINE

2019/03/19 526 users GIGAZINE GauGAN NVIDIA オブジェクト

Microsoftペイントとマウスを使って描いたようなラフなイラストが、一瞬でリアルな風景写真に変換される画期的な技術をNVIDIA Researchが開発しました。「GauGAN」と呼ばれるインタラクティブなソフトウェアは膨大な学習データを用いたディープラーニングを使ったもの。GauGANを使えば「オブジェクトの形を描くだけ」「... 続きを読む

ソニー、ディープラーニングの学習速度で“世界最高速”　学習時間を短縮へ - ITmedia NEWS

2018/11/13 55 users ディープラーニングソニー短縮パラメータ数学習速度

ソニーは、ディープラーニングの学習速度で世界最高速を達成したと発表。学習時間を短縮できる可能性を示したとしている。ソニーは11月13日、ディープラーニングの学習速度で世界最高速（同社調べ）を達成したと発表した。ディープラーニングの認識精度向上のため、学習データのサイズやモデルのパラメータ数が増え、一... 続きを読む

詳説人工知能 - ディープラーニングの仕組みと応用：ITpro

2017/01/25 354 users ITpro ニューラルネットワーク詳説模倣人工知能

脳の神経回路の構造を模倣ディープラーニングは、大量のデータを学習するために、人間の脳の神経回路の構造を模倣（モデル化）した情報処理の仕組みであるニューラルネットワークを用いる。図3のニューラルネットワークは、「入力層」「隠れ層」「出力層」という3層で構成している。また、学習データは入力データとなる手書き文字の画素データと、正解データがセットになっている。このニューラルネットワークのモデルを学習... 続きを読む

詳説人工知能 - ディープラーニングの仕組みと応用：ITpro

2017/01/23 354 users ITpro ニューラルネットワーク詳説模倣人工知能

分散学習用TensorFlowコードの書き方 - めもめも

2016/12/24 79 users 書き方 Variable TensorFlow 各ノードメモ

2016 - 12 - 24 分散学習用TensorFlowコードの書き方何の話かというと Google Cloud MLを利用して、TensorFlowの分散学習を行う方法です。取り急ぎ、自分用のメモとして公開しておきます。分散学習にはいくつかのパターンがありますが、最もシンプルな「データ分散」の場合を説明します。各ノードは同じモデルに対して、個別に学習データを適用して、Variableを修... 続きを読む

みらい翻訳 | イノベーティブな機械翻訳

2015/01/30 280 users カスタマイズパートナー最先端技術イノベーティブ機械翻訳

みらい翻訳は機械翻訳の最先端技術と最適な学習データを活用したカスタマイズ可能な翻訳ソリューションをパートナーと共に提供します続きを読む

(1 - 17 / 17件)