タグ トレーニング
人気順 10 users 50 users 100 users 500 users 1000 usersPyTorchやPythonなしの純粋なC言語を使用した大規模言語モデルトレーニングツール「llm.c」がリリースされる
AIの本体と言える大規模言語モデル(LLM)のトレーニングはほとんどの場合PyTorchやPythonを使用して行われていますが、そうしたトレーニングを純粋なC言語のみで実装したツール「llm.c」が登場しました。まだ最適化が行われておらず従来の手法に速度面では敗北していますが、GPT-2のトレーニングを行う実装を約1000行のク... 続きを読む
100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明
OpenAIが、AIモデルのトレーニングに用いるために100万時間を超える分量のYouTube動画をダウンロードして利用していたことがThe NewYork Timesの指摘でわかりました。なお、YouTubeと同じ親会社AlphabetのもとにいるGoogleは、OpenAIの行為に気付いていましたが、自分たちも独自のAIモデルのトレーニングにYouTubeの動画... 続きを読む
OpenAIが「Sora」の学習にYouTube動画を使ったとすれば違反──YouTubeのモーハンCEO
米Google傘下のYouTubeのニール・モーハンCEOは4月4日(現地時間)、米Bloombergとのインタビューで、米OpenAIがもし自社のAIモデルのトレーニングにYouTube動画を使っているとすれば、それはYouTubeポリシーの「明らかな違反」になると語った。 OpenAIのミラ・ムラティCTO(最高技術責任者)は3月、米Wall Street Journ... 続きを読む
「NVIDIA H100 GPU」を2万4576基搭載して「Llama 3」などのトレーニングに活用されているGPUクラスターの情報をMetaが公開
「AI開発をリードするということは、ハードウェアインフラへの投資でリードするということ」として、MetaがAIのための投資として行っている、2万4000基以上のGPUを搭載したデータセンタースケールのクラスターの情報を明らかにしました。 Building Meta’s GenAI Infrastructure - Engineering at Meta https://engineeri... 続きを読む
体力アップへの第一歩:サブスクススポーツジムで新しいスタート#トレーニング - 今この瞬間!
サブスクス!スポーツジムに入会しました。 みなさん今晩は、60歳になって初めてスポーツジム入会しました。もうすぐ61歳です。 今まで自力で腹筋、腕立て、ウォーキングをしてきましたが、サブスクを利用してお得に、入会しました。何がお得なのか?トレーニングマシン、スーパー銭湯付き、そしていろんな、健康教室が... 続きを読む
ザスパ群馬、週刊誌に報じられたハラスメント疑惑について調査の現状を報告 現時点では行為認められず :
本日、一部メディアにてトップチーム内におけるハラスメント行為に関する報道がございました。報道されている事項についてはクラブ内で調査を進めており、事実関係の確認中ではございますが、現時点で判明している事項は以下の通りです。 1.クラブにて保管している当日のトレーニングの映像を確認し、当該の発言について... 続きを読む
ランニング効率アップ!ウォーミングアップから始めましょう #トレーニング - 雨のち晴れ
私の娘は、陸上部に所属しています。 今のシーズンは、長距離走、中でも駅伝の大会が多いです。 陸上の選手はどのようにして、ランニングスピードを高めているのか、どういった練習をしているのか、それらを陸上の先生から聞く機会がありましたので、自分の調べた内容と一緒に記事にしてみました。 ランニングやウォーキ... 続きを読む
TumblrやWordPressがユーザーデータをAIトレーニングに提供する契約を結ぼうとしていたことが判明
SNSのTumblrとWordPressを保有するAutomatticが、AI企業であるOpenAIやMidjourneyと、AIのトレーニングのためにユーザーデータを提供する旨の契約を結ぼうとしていたことが明らかになりました。データがすでに提供済みかまだ提供されていないかは不明ですが、社内からは、契約には含まれないはずの個人的なデータまで提... 続きを読む
次世代データ基盤:データレイクハウスを Google Cloud で実現する
はじめに こんにちは、クラウドエース データソリューション部の松本です。 普段はデータ基盤や MLOps の構築をしたり、Google Cloud 認定トレーナーとしてトレーニングを提供しております。また、昨年は Google Cloud Partner Top Engineer 2024 に選出されました。今年も Goodle Cloud 界隈を盛り上げていけるよう頑張... 続きを読む
ChatGPTに対する著作権侵害訴訟の前半戦でOpenAIがほぼ全面勝利、作家3人の訴えの大半が却下される
「同意なく自分たちの書籍がAIのトレーニングに使用された」として、3人の作家がOpenAIを相手に起こした著作権侵害訴訟で、OpenAI側の主張のほとんどを認める判決が下されました。 Judge dismisses most of Sarah Silverman's lawsuit against OpenAI | VentureBeat https://venturebeat.com/ai/judge-dismisses-most-of... 続きを読む
認知症はトレーニングで予防。今日から始める運動習慣で認知症のリスクを軽減しよう - lala a live(ララアライブ)│フォーネスライフ
認知症はこれまで、「予防できない病気、治らない病気」といわれてきました*1。しかし近年、少しずつ研究が進み、運動やトレーニングを適切に行えば認知機能の低下を予防できる可能性があることが分かりつつあります。本記事では認知症の予防に有効とされる運動の情報を中心に「認知症を予防するためのトレーニング」を... 続きを読む
Google CloudとHugging Faceが提携 AI開発者にH100などのパワーを提供へ
Google CloudとオープンソースのAI開発プラットフォームのHugging Faceが戦略的提携を発表した。開発者はAIモデルをGoogle Cloudで効率よくトレーニング、調整、提供できるようになる。 米GoogleのクラウドサービスGoogle Cloudは1月25日(現地時間)、オープンソースのAI開発プラットフォームを手掛ける米Hugging Face... 続きを読む
森保一監督、日本代表の戦術とトレーニングについて大いに語る「トミがアーセナルでやっていることを基準に…」 - スポーツナビ
元日に行われたタイ代表戦に5-0と勝利し、国際Aマッチの連勝記録を9に伸ばした日本代表。いよいよ1月14日には5度目のアジア王者を目指す戦いの火蓋が切って落とされる。そこでAFCアジアカップ・カタール2023の開幕を前に、多彩な切り口で森保一監督に迫る。インタビュー前編では守備戦術やクラブ戦術の取り入れ、トレー... 続きを読む
画像生成AI「Stable Diffusion」などに使われた50億枚超の画像セット「LAION-5B」に1008枚の児童ポルノ画像が入っていることが判明し削除へ
スタンフォード大学インターネット天文台(SIO)の調査により、画像生成AI「Stable Diffusion」などのトレーニングに利用されているオープンデータセットの「LAION-5B」に、児童性的虐待画像(CSAM)が含まれていることが明らかになりました。CSAMの疑いのある画像は3226枚で、そのうち1008枚が外部機関の検証によりCSAMであ... 続きを読む
ChatGPTに単語を「永遠に」繰り返すよう促すことでトレーニングに使われた膨大なテキストデータを吐き出させる攻撃手法をGoogleの研究者らが開発
ChatGPTのトレーニングにはインターネットから取得したデータが利用されていますが、具体的なデータの中身は非公開となっています。「同じ単語を繰り返して」という単純な命令を行う事でChatGPTにトレーニングデータを出力させることに成功したとGoogleの研究者らが発表しました。 Extracting Training Data from ChatGP... 続きを読む
[速報]AWS、大規模言語モデルのトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。前モデルより最大4倍のトレーニング性能。AWS re:Invent 2023
Amazon Web Services(AWS)は、ラスベガスで開催中のイベント「AWS re:Invent 2023」の基調講演で、AIのトレーニングに最適化した独自プロセッサ「AWS Trainium2」を発表しました。 Trainium2は、最大数兆個のパラメータを持つ基盤モデルおよび大規模言語モデルのトレーニング用に設計されています。 2020年に発表され... 続きを読む
GPU・CUDAを活用して数値計算やAIのトレーニングを高速化するのに必要な基礎知識のコード例付きまとめ
GPUはCPUよりもはるかに多くのコアを備えており、多数の並列処理を行う事が可能です。そうしたGPUの性能を活用するために必要な知識を、ITエンジニアのリジュル・ラジェシュさんがブログにまとめています。 GPU Survival Toolkit for the AI age: The bare minimum every developer must know https://journal.hexmos.co... 続きを読む
Amazon、生成AIスキルを習得できる無料講座を「AI Ready」で提供へ
Amazonは、生成AIスキルを習得できる無料の8つの講座をAWSで提供すると発表した。2025年までに世界中の200万人にAIスキルのトレーニングを無料で提供するとしている。 米Amazon.comは11月20日(現地時間)、新たな取り組み「AI Ready」を発表した。2025年までに世界中の200万人にAIスキルのトレーニングと教育を無料で提... 続きを読む
ピクシブ社エンジニアが語る、機械学習基盤とその技術 「GCPバッチ基盤」「リアルタイムの推論基盤」「ノートブック開発環境」整備の裏側
登壇者の自己紹介とアジェンダの紹介 sugasuga氏:こんにちは。今日は、ピクシブの機械学習基盤に関する発表をいたします。 まずは自己紹介から始めさせてください。自分は、機械学習チームでエンジニアをしているsugasugaといいます。サブで採用・広報活動にも関わっています。最近の趣味は、トレーニングです。 今日お... 続きを読む
「生成AIによる著作権侵害の責任はユーザーが負うべき」グーグル、マイクロソフト、OpenAIら主張
どの企業も、AIツールのトレーニングにインターネットからスクレイピングした大量の著作物を利用しており、それらの著作物に対して対価を支払っていないことや、AIツールが著作物を表示する可能性があることについては否定していない。この場合はすべてユーザーに責任がある、というのがグーグル、オープンAI、マイクロ... 続きを読む
2026年までにAIのトレーニングに使うデータが枯渇する「データ不足問題」とは?
インターネット上には膨大なデータが存在しており、それらを学習させることで作られたAIが続々と登場するようになりました。AIの普及が爆発的に進む一方、研究者からはAIシステムを動かす燃料である学習データが枯渇する可能性があると懸念する声が上がっています。 Researchers warn we could run out of data to train... 続きを読む
運動やトレーニングの習慣で「私が勘違いしていた」12の過ち | ライフハッカー・ジャパン
気軽なエクササイズから、マラソンを走ったりウェイトリフティングの大会に出るなど、私の運動人生はさまざまな段階を経てきました。私はその途中で、数々の役に立たないアドバイスを真に受けてしまったり、逆に良いアドバイスに従わなかったりしました。 今回は、読者のみなさんが私と同じ過ちを犯さないよう、これまで... 続きを読む
【セキュリティ資格】CISSP合格体験記_202310_トレーニング有 - Qiita
1. CISSPとは CISSP(Certified Information Systems Security Professional)とは、ISC2(International Information Systems Security Certification Consortium)が認定を行っている国際的に認められた情報セキュリティ・プロフェッショナル認定資格です。 Novell、Deloitte Touche Tohmatsu、大手ヘルスケアサービス企... 続きを読む
Microsoftが干ばつ時でも水を吸い上げてAIの訓練に使っていたとの批判、一方でMicrosoftは小型原子炉をデータセンターの電力源として検討を開始
AI開発団体のOpenAIと長期的なパートナーシップを締結しているMicrosoftは、自社のデータセンターでChatGPTなどのAIのトレーニングを行っています。しかし、アイオワ州ウェストデモインズのMicrosoftのデータセンターは、現地で干ばつが発生しているにもかかわらず、AIのトレーニングに大量の水を使っていたことが指摘さ... 続きを読む
Googleが生成AIのトレーニングに自分のウェブサイトが使われないようにするオプションを発表、もう遅いという指摘も
Googleは対話型AIであるBardを開発しているほか、機械学習プラットフォームであるVertex AIの運営も行っており、生成AIモデルの開発においてウェブ上のコンテンツを利用しています。新たにGoogleが、自身のウェブサイトが生成AIモデルのトレーニングに利用されないようにするオプション「Google-Extended」を発表しまし... 続きを読む