タグ CUDA
新着順 10 users 50 users 100 users 500 users 1000 users機械学習 - Chainerで始めるニューラルネットワーク - Qiita
Chainerは、Preferred Networksが開発したニューラルネットワークを実装するためのライブラリです。その特徴としては、以下のような点があります(ホームページより)。 高速: CUDAをサポートし、GPUを利用した高速な計算が可能 柔軟: 柔軟な記法により、畳み込み、リカレントなど、様々なタイプのニューラルネットを実装可能 直観的: ネットワーク構成を直観的に記述できる 個人的には... 続きを読む
NovelAIを無料で動かす「NovelGUI」 - 基板ぽたぽた焼き
「NovelGUI」はStable-diffusion-webui, naifu派生のNovelAIエミュレーター 特徴 PythonやCUDA、Gitの導入など不要。環境に応じたパラメータ調整は自動化しているのでインストールするだけで使えます。ローエンドGPUでもnaifuのように画像サイズを縮小することなく破綻の少ない出力が得られます。 ダウンロードリンク(v... 続きを読む
CUDAを一枚の絵にまとめてみた - OPTiM TECH BLOG
まえがき 初めまして、R&Dチームの宮﨑です。趣味はFPSをやってます。150時間やってますが未だにドンかつを食べられていません。普段は深層学習のベンチマークを取ったりしています。 実はひと昔前からあった深層学習。近年実用性が増して一大ブームとなっています。実用的になった背景の一つとしてGPUを用いた高速化に... 続きを読む
PythonでCUDAに入門する - norio’s Blog
CUDA, PyCuda, Python はじめに最近、CUDAの勉強を始めました。CUDAとは、一言で説明すると「NVIDIAが提供するGPGPUの開発環境」です。CUDAを利用することでGPUによるマルチスレッド計算をとても簡単に行うことができます。GPUの強みは大規模なスレッド計算であり、CPUのみ場合と比較して十数倍から数十倍の高速化が期待できるようです。 なぜPythonかCUDAの専用... 続きを読む
深層学習用ライブラリを自作して二足歩行を学習させてみた – EL-EMENT blog
WebGLとCUDAで動く深層学習用のライブラリを作って深層強化学習 (Deep Deterministic Policy Gradient, DDPG) で二足歩行を学習させました。学習環境の作成にはOimoPhysicsを使いました。 開発の経緯や以下実装方法、学習結果などです。例によって怪しい個所へのツッコミは歓迎です。 >> Open Repository on GitHub これ... 続きを読む
NVIDIA、仮想GPUでCUDAを使用可能にした「GRID 5.0」 ~Windows 10は描画負荷増大で仮想GPUが必須に - PC Watch
Tesla P100 NVIDIA は11月7日、都内にて同社の仮想化GPUソリューションに関する説明会を開催した。 NVIDIAはGPUのリソースを分割して、仮想的に複数のPC上で利用可能にするための技術として「NVIDIA GRID」を提供しており、今回は最新版となる「GRID 5.0」や、Windows 10のVDI(Virtual Desktop Infrastructure)でのG... 続きを読む
gstore_fdw: GPUメモリをSQLで読み書き、そして…。 - KaiGaiの俺メモ
2017 - 11 - 12 gstore_fdw: GPUメモリをSQLで読み書き、そして…。 GPU PostgreSQL 昨年、PGconf. ASIA で発表したPL/CUDAによる 創薬 ワークロードの高速化実験のテーマであるが、 kaigai.hatenablog.com 実測した ベンチマーク を見ると、奇妙な傾向が見てとれる。 このワークロードにおける計算量は「Qの行数×Dの行数」... 続きを読む
ビルド職人になるために覚えたコマンドメモ - ainameの日記
2017 - 03 - 01 ビルド職人になるために覚えたコマンドメモ ここ2年ぐらい ffmpeg とか opencv とか Ruby + CUDAみたいなやつ とか たまーにビルド職人になることがあって上手く コンパイル するために各種コマンドを使うことがあるのだけど、 使い方はおろか、普段あんまり使わないのでコマンド名すら忘れることが多々あるためコマンド名とか使い時を覚えている限りざっくりメ... 続きを読む
More modern gpu
More modern gpu 1. More Modern GPU 岡野原 ⼤大輔 hillbig@preferred.jp Preferred Networks, Inc. Preferred Infrastructure, Inc. 12/3 2015 PFI/PFN 全体セミナー 2. GPU/CUDAについて l GPU/CUDAは近年年⼤大きな成功を収めている – ... 続きを読む
CUDA:「超並列コンピューティング」はじめました(その2) ~高速化TipsとOpenGLでのグラフィクスへの応用 (1/3):CodeZine
簡単なサンプルとして行列積を取り上げましたけど、実アプリではこんなのわざわざ実装する必要はありません。基本的な線型代数ルーチンを集めたBLAS(Basic Linear Algebra Subprograms)のCUDA実装:cuBLASがCUDA Toolkitに含まれています。デバイス側コードはcuBLASライブラリの中にあるので、.cuを書くこともなく通常のC/C++ライブラリとしてリンクし... 続きを読む
CUDAでプログラミングする前にやっておきたいこと - 株式会社CFlatの明後日スタイルのブログ
2014-04-14 CUDAでプログラミングする前にやっておきたいこと CUDA OpenMP GPUとCPUの速度比較をしたい 以前CUDAでのプログラミングが完成した際に、CPUとの速度比較を行いたいという当たり前の要望が上がりました。 そこでGPUとCPUを切り替えるコードを作成したのですが、どうせなら最初から作っておくべきだったと反省しました。 今回はその際に作成したGPUとCPUの速度... 続きを読む
【Python】MacBookAirのローカル環境でPython版のwaifu2xを試してみた - 歩いたら休め
2015-05-30 【Python】MacBookAirのローカル環境でPython版のwaifu2xを試してみた Python 画像処理 PIL (二次元キャラの)画像をキレイに拡大できるwaifu2xというプログラムが最近話題になっています。元のものはCUDAでGPUを利用しており、自前のMacBookAirでは試せなかったのですが、Pythonで再実装した方がいたので試してみました。 使用... 続きを読む
GPUで高速化が簡単なOpenACCのランタイム関数で実行中のPGI Unified Binaryの演算デバイスを切り替えられるのか検証してみた - Qiita
GPUで高速化が簡単なOpenACCのランタイム関数で実行中のPGI Unified Binaryの演算デバイスを切り替えられるのか検証してみた この記事は何? CUDA123 に代わる新しい GPU の 標準API 、OpenACC が最近 CUDA よりも高速という結果4が出てきて調子が良いので、現状のヘテロジニアス環境でのマルチデバイス実行(複数のデバ... 続きを読む
フィックスターズを退社してサムライトに入社 - gos-k’s blog
2015-06-20 フィックスターズを退社してサムライトに入社 フィックスターズ退社 株式会社フィックスターズを退社しました。理由はお察し下さい。 この会社では Cell/B.E. とか CUDA とか OpenCL とか AVX とか、主に特定プロセサ向けにポーティングしていた。 まわりは割と Windows アプリ作ってたりとかが多くて、プロファイラ見ながらアセンブラ眺めながらの仕事してる人... 続きを読む
NVIDIA、CUDAのArm対応を発表 | マイナビニュース
NVIDIAは6月17日(独時間)、 NVIDIA CUDA-X AIやHPCライブラリ、GPUアクセラレーテッドAIフレームワーク、ならびにOpenACC対応のPGIコンパイラおよびプロファイラといった、ソフトウェア開発ツールを含む600以上のNVIDIAのAIおよびHPCソフトウェアのフルスタックを、2019年末までにArmのエコシステムで利用できるようにす... 続きを読む
Apple A4チップやAMD Ryzenの生みの親であるジム・ケラー氏がNVIDIAのCUDAとx86アーキテクチャを「沼」と呼んで批判
AMDのAthlonやZenマイクロアーキテクチャ、Apple A4などさまざまなチップの開発に携わったアーキテクトでエンジニアのジム・ケラー氏が、X(旧Twitter)で「NVIDIAのCUDAは沼です」と批判したことが報じられています。 Jim Keller criticizes Nvidia's CUDA, x86 — 'Cuda’s a swamp, not a moat. x86 was a swamp too' | T... 続きを読む
AI分野でのNVIDIA一強状態を崩すためにIntel・Google・富士通・Armなどが参加する業界団体がCUDA対抗のAI開発環境を構築中
NVIDIAはAI開発に使われるGPUで大きなシェアを獲得しているほか、ソフトウェア開発および実行環境「CUDA」もAIの開発現場で広く採用されています。そんなNVIDIAの一人勝ち状態に対抗するべく、Intelや富士通、Google、Armなどのテクノロジー企業が参加する業界団体「Unified Acceleration Foundation(UXL Foundation)」... 続きを読む
NVIDIAがCUDAを他のハードウェア上で実行することを禁止
NVIDIAが、GPU向けのコンピューティングプラットフォームとして提供している「CUDA」のソフトウェア利用許諾契約(EULA)の中で、翻訳レイヤーを通じてNVIDIA以外のハードウェアプラットフォームで実行することを禁止していることがわかりました。もともとこの条項はNVIDIAのサイト上で公開されているオンライン版のEULAに... 続きを読む
オープンソースのニューラルネットワーク向けプログラミング言語「Triton」をOpenAIが公開 - GIGAZINE
NVIDIAが開発・提供するGPU向けの汎用並列コンピューティングプラットフォームである「CUDA」を超える生産性と高速コード記述が可能になるようなオープンソースのニューラルネットワーク向けプログラミング言語「Triton」が公開されました。非常に効率的なカスタムディープラーニングプリミティブを作成するための言語コ... 続きを読む
対決!RTX 2080Ti SLI vs Google Colab TPU ~Keras編~ - Qiita
RTX 2080Tiを2枚買ったので、どれぐらいの性能が出るかColabのTPUと対決させてみました。さすがにRTX 2080Tiを2枚ならTPU相手に勝てると思っていましたが、意外な結果になりました。 スペック GPU側 GPU : RTX 2080Ti 11GB Manli製×2 SLI構成 CPU : Core i9-9900K メモリ : DDR4-2666 64GB CUDA : 10.0 cuDNN : 7.5.1 Te... 続きを読む
Amazon EC2のGPUインスタンスにChainer v1.5を3行で入れる - Qiita
Chainer 1.5になってからインストールが若干面倒になり、失敗しやすくなりました。ここでは、Amazon EC2にChainerを簡単に入れる方法を解説します。 CUDAとドライバのインストールが面倒なので、nVidia公式の "Amazon Linux AMI with NVIDIA GRID GPU Driver" を使います。起動して、ログインしたら、以下のコマンドを実行して下さい。 ... 続きを読む
Installing CUDA, OpenCL, and PyOpenCL on AWS EC2
This is the first post in a series about using OpenCL for web development. This post describes how to setup CUDA, OpenCL, and PyOpenCL on EC2 with Ubuntu 12.04. It took me a while to get working prope... 続きを読む
Windows 11 の WSL で GPU を使って rinna InstructGPT - nownab.log
はじめに 最近、念願のつよつよ GPU がついた PC を新調して WSL で環境構築を頑張っている。今回は GPU を使った LLM の推論を試した。 ここでの GPU は NVIDIA のもので、GPU の環境構築は WSL で CUDA を使えるようにすることを意味する。また、WSL の Distribution は Ubuntu-22.04。 LLM としては rinna 社の日本語... 続きを読む
AI半導体の王者・NVIDIAを襲うインテル、AMD、グーグル包囲網 ── それでもNVIDIAが強い理由 | BUSINESS INSIDER JAPAN
半導体メーカーのNVIDIA(エヌビディア)は3月17〜21日、テクノロジーイベント「GPU Technology Conference 2019(GTC 19)」を、アメリカ・サンノゼで開催した。 GTCは2008年に開催された「NVISION」というイベントが初回で、元々はコンピューターグラフィックスをテーマに始まった。その後、NVIDIAが「CUDA」(クーダ)と呼... 続きを読む