タグ「TensorRT-LLM」 - はてブログ

タグ TensorRT-LLM

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 3 / 3件)

AppleがNVIDIAとの共同研究で大規模言語モデルのパフォーマンス高速化の成果を発表

2024/12/19 6 users NVIDIA Apple LLM 成果言語モデル

Appleは、NVIDIAとの共同研究による大規模言語モデル(LLM)の推論処理高速化についての研究成果を2024年12月18日に発表しました。Appleが独自に開発した「ReDrafter」技術をNVIDIAのGPU向け推論フレームワーク「TensorRT-LLM」に統合することで、処理速度を最大2.7倍に向上させることに成功し、消費電力とGPU使用量の削減... 続きを読む

Microsoftの検索エンジンBingがTransformerからLLMとSLMの組み合わせに移行＆TensorRT-LLMの統合を発表

2024/12/18 12 users Transformer LLM SLM Bing NVIDIA

Microsoftは検索エンジンのBingで、これまでGoogleが開発した機械学習モデルの「Transformer」を採用してきました。しかし、Transformerに限界が訪れたとして、大規模言語モデル(LLM)と小規模言語モデル(SLM)の組み合わせに移行すると発表しています。さらに、ワークフローにNVIDIAが開発している「TensorRT-LLM」を統合... 続きを読む

Databricks Container ServiceでTensorRT-LLMを動かしてみた - NTT Communications Engineers' Blog

2024/04/26 6 users Databricks 目次 NVIDIA社実行 Blog

本記事ではDatabricksのDatabricks Container Serviceを用いてNVIDIA社の推論ライブラリであるTensorRT-LLMを実行可能なNotebook環境を構築する方法を紹介します。目次目次はじめに Databricks Container Service NVIDIA TensorRT-LLM 解決したいこと TensorRT-LLM Container Imageの作成 Databricks Containers ベー... 続きを読む

(1 - 3 / 3件)