タグ 性能
新着順 10 users 50 users 100 users 500 users 1000 usersED法と3値(+1,-1,0)のアイデアを元に新しい活性化関数(ExP2)を作ってGELUと性能比較してみたら。単純なCNNでMINIST精度 99.43%が出た - Qiita
ED法と3値(+1,-1,0)のアイデアを元に新しい活性化関数(ExP2)を作ってGELUと性能比較してみたら。単純なCNNでMINIST精度 99.43%が出たDeepLearningPyTorch活性化関数誤差逆伝播法ED法 初めに 誤差逆伝播法を用いずに、興奮性・抑制性ニューロンの出力を調整することでニューラルネットワークの学習を進める金子さんの誤差... 続きを読む
僅か2.3GBで日本語可能な超高性能ローカルLLMのPhi-3 MINIをllama.cppとCPUで動かしてみた。スマホでも可。従来のコンパクトLLMと比較して超越した性能で未来を感じさせるMicroSoft寄付ありがとう
Kapper@Linuxガジェヲタ&異世界小説家&生成AI&電子工作大好き @kapper1224 昨日MicroSoftからリリースしたローカルLLMモデルのPhi-3 mini 4k Q4をllama.cppのサーバ版を動かしてみた。こいつ2.32GBしかないくせに日本語しゃべれるぞ。今までとは桁違いの性能なんですけど・・・ ./build/bin/server -m ../Phi-3-mini-... 続きを読む
LEIA: 言語間転移学習でLLMを賢くする新しい方法
Studio Ousiaと理化学研究所に所属している山田育矢です。 この記事では、大規模言語モデル(LLM)の性能を向上させる新しい方法であるLEIA(Lightweight Entity-based Inter-language Adaptation)を紹介します。 LLMは言語によって性能に顕著な差があり、訓練に使われるテキストが最も多い英語において特に性能が高い... 続きを読む
Microsoftがコスト効率の高い小さめの言語モデル「Phi-3」をリリース、オープンモデルで商用利用可能
Microsoftが小さい規模で大きな性能を発揮する言語モデルとして「Phi-3」ファミリーをリリースしました。ファミリーの中でも一番小さなサイズのモデルであるPhi-3-miniはオープンモデルとなっており、無料で商用利用が可能です。 Introducing Phi-3: Redefining what's possible with SLMs | Microsoft Azure Blog https... 続きを読む
経済情報特化の生成AI、日経が開発 40年分の記事学習 - 日本経済新聞
日本経済新聞社は24日、経済情報に特化した生成AI(人工知能)の基盤技術を開発したと発表した。大規模言語モデルと呼ばれるもので、約40年分の日経グループの新聞や雑誌の記事を学習させた。記事の要約機能などで活用を見込む。大規模言語モデルの名称は「NIKKEI Language Model」。性能の指標となる「パラメーター数」... 続きを読む
「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術
「GPT-4」を上回る性能で、グラフィカルな文書を読解するLLM技術:NTTの「tsuzumi」にも採用 NTTは2024年4月12日、大規模言語モデル(LLM)の活用により、文書に含まれる図表やグラフなども含めて理解し、自然言語での指示に従って読解/応答する「視覚読解技術」を実現したと発表した。 NTTは2024年4月12日、大規模言語... 続きを読む
Docker Desktopの代替となる「Podman Desktop 1.9」リリース。Macでの安定性や性能が大幅に向上したコンテナエンジン「Podman 5.0」を搭載
Red Hatが主導して開発するDocker互換のコンテナエンジンであるPodmanを搭載した、Docker Desktop代替となるGUIツール「Podman Desktop」の最新版「Podman Desktop 1.9」正式版がリリースされました。 Podman Desktopの主な機能 Podman Desktopは、デスクトップアプリケーションのGUIを通じて、コンテナの一覧、検索、実... 続きを読む
Metaが次世代のオープンLLM「Llama 3」を公開、無料で商用利用可能なモデルの中では過去最高の性能
MetaがLlamaファミリーの次世代大規模言語モデル「Llama 3」をリリースしました。研究目的のほか、月間アクティブユーザーが7億人以下の場合は無償で商用利用が可能となっています。 Meta Llama 3 https://llama.meta.com/llama3/ Introducing Meta Llama 3: The most capable openly available LLM to date https://ai.... 続きを読む
ChatGPT開発 オープンAI 東京に新拠点設立 日本のAI事情は? | NHK
アメリカのオープンAIは、おととし11月に生成AIのChatGPTを発表し、世界での生成AIの拡大のきっかけとなりました。 「ChatGPT」とは、人間のように自然な受け答えができる高度な性能を備え、世界で急速に利用が広がる対話式AIです。 会社は15日、東京都内に新たな拠点を設立し、今後の日本での事業方針について記者会見... 続きを読む
イーロン・マスクのAI企業が画像を理解可能なマルチモーダルAI「Grok-1.5」を発表、「GPT-4V」や「Gemini Pro 1.5」に匹敵する性能
イーロン・マスク氏が設立したAI企業「xAI」が、同社初のマルチモーダルAIモデル「Grok-1.5」を発表しました。Grok-1.5は画像の理解が可能で、「フローチャートを認識してコードを書く」「栄養成分表示を見てカロリーを計算する」といった操作が可能です。 Grok-1.5 Vision Preview https://x.ai/blog/grok-1.5v Grok-1.... 続きを読む
OpenAI、日本語に最適化したGPT-4カスタムモデル提供。通常のGPT-4 Turboより最大三倍高速、トークン数削減でコスト効率向上 | テクノエッジ TechnoEdge
OpenAIは東京にアジア初のオフィスを開設するとともに、日本語に最適化したGPT-4カスタムモデルの提供開始を発表しました。 日本語テキストの翻訳・要約の性能、およびコスト効率を向上させたモデルで、日本語タスクにおいては最新の汎用モデルGPT-4 Turboの最大三倍高速に動作します。 高速化に加え、従来のモデルより... 続きを読む
優秀と噂なCohere社のCommand R+でRAGチャットボットを簡単に構築して体験しよう! - Qiita
1. はじめに Cohere社が最近リリースしたLLMのCommand R+がGPT4に迫る性能を発揮していたり、RAG利用での性能で話題となっています。 そのCommand R+でRAGを体験できるチャットアプリの実装がLightningAIにてチュートリアルが公開(CC-BY-4.0ライセンスとして)されています。 これを身近な環境で動かしてみたいと思います... 続きを読む
PCIe 5.0対応で10GB/s秒超えの超高速SSD「FireCuda 540 SSD 2TB」の性能を詳しく検証してみたよレビュー
「FireCuda 540 SSD 2TB」はPCIe 5.0に対応したSSDで、10GB/sという文字通り桁違いのデータ転送速度を備えていることがアピールされています。そんなFireCuda 540 SSD 2TBをGIGAZINE春のプレゼント大放出企画の景品として提供してもらえたので、性能を詳しく検証してみました。 Seagate FireCuda 540 Gen 5 PCIe SSD | S... 続きを読む
米Apple、iPhoneのUIを理解するモバイル専用AI言語モデル「Ferret-UI」発表 GPT-4V越えの性能
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 米Appleに所属する研究者らが発表した論文「Ferret-UI: Grounded Mobile UI Understandin... 続きを読む
Snapdragon X Eliteを搭載したSurface Pro 10やSurface Laptop 6はM3搭載のMacBook Airを上回るとMicrosoftが主張
2024年5月に発表されるとみられている「Surface Pro 10」や「Surface Laptop 6」について、QualcommのSoC「Snapdragon X Elite」を搭載することによって、CPUパフォーマンスとAIアクセラレーションタスクの両方で、AppleのM3チップ搭載MacBook Airの性能を上回るとMicrosoftが主張していることが報じられています。 Micr... 続きを読む
日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能
AI開発企業のCohereがGPT-4と同等の性能を備えた大規模言語モデル「Command R+」を発表しました。Command R+は日本語での応答にも対応しており、ローカルにダウンロードして実行可能なほか、ウェブ上で実行できるチャットアプリのデモも公開されています。 Introducing Command R+: A Scalable LLM Built for Business... 続きを読む
CPU・GPU・ストレージの性能をワンクリックで測定できるフリーソフト「CrystalMark Retro」レビュー、CrystalDiskMark作者の新作で簡単操作でPCの性能を測定可能
CPUやGPU、ストレージの性能を簡単に測定できるベンチマークソフト「CrystalMark Retro」が2024年3月31日にリリースされました。CrystalMark Retroはストレージベンチマークソフト「CrystalDiskMark」やストレージ管理ソフト「CrystalDiskInfo」といった定番ソフトの作者であるhiyohiyo氏の新作ということで、CrystalMar... 続きを読む
「Llama 2-7B」の1万分の1以下の学習コストなのにLlama 2-7Bを上回る大規模言語モデル「JetMoE-8B」が登場
数千億円をかけた訓練リソースを用いるMetaの「Llama 2-7B」を上回る性能を持ちながら、学習コストは1000万円以下に抑えられるという大規模言語モデル「JetMoE-8B」が登場しました。 JetMoE https://research.myshell.ai/jetmoe GitHub - myshell-ai/JetMoE: Reaching LLaMA2 Performance with 0.1M Dollars https://git... 続きを読む
40TOPSの性能を持つM.2接続のAIアクセラレータ
Snapdragon X Eliteのベンチマーク結果がネット上に登場、IntelとAMDの主力CPUに勝利
Qualcommが2024年中の発売を予定しているPC向けSoC「Snapdragon X Elite」のベンチマーク結果が、ベンチマークアプリ「Geekbench」のスコア集積サイトに登録されました。掲載されたベンチマーク結果からは、Snapdragon X EliteがIntelやAMDの主力CPUに匹敵する性能を備えていることが明らかになっています。 LENOVO 4810... 続きを読む
発売開始27分で5万台受注【シャオミ『SU7』の衝撃】実力のポイントを徹底解説 - EVsmartブログ
スマホメーカーとして知られる中国のシャオミがEV進出の第一弾車種となる『SU7』の発売を開始。電気自動車として刮目すべき性能と452万円〜という価格が世界に大きな衝撃を与えています。注目すべきポイントを、EVネイティブこと髙橋優氏が解説します。 シャオミに関する基礎知識〜家電のIOT化に注力 中国の家電メーカー... 続きを読む
大規模言語モデルの計算能力を桁違いに増強するカスタマイズハードウェアを作るスタートアップ「MatX」
「大型のAIモデルに特化して、性能をさらに向上させる」ことを目指してハードウェアを設計するというスタートアップ「MatX」を、元Googleエンジニアのライナー・ポープ氏とマイク・ガンター氏らが創業しました。 MatX | MatX: high throughput chips for LLMs https://matx.com/ Introducing MatX: we design hardware t... 続きを読む
Docker互換のコンテナエンジン「Podman 5.0」正式リリース。Macでの安定性や性能が大幅に向上
Docker互換のコンテナエンジンとしてRed Hatが主導して開発しているオープンソース「Podman」の2年振りのメジャーバージョンアップ「Podman 5.0」が正式にリリースされました。 PodmanはDocker互換のコマンドラインツールを備え、OCI(Open Container Initiative)互換のDockerイメージを操作可能なコンテナエンジンです... 続きを読む
NTT、生成AIサービス開始 LLM「tsuzumi」消費電力抑制に強み - 日本経済新聞
NTTは25日、生成AI(人工知能)の基盤となる独自開発の大規模言語モデル(LLM)「tsuzumi(つづみ)」のサービス提供を同日始めたと発表した。すでに500以上の企業や自治体から導入相談が寄せられているという。日本語の文章の流ちょうさに強みを持ち、性能の指標となるパラメーター数を小さくすることで消費電力など運... 続きを読む
AIのハルシネーションを叩く奴は馬鹿。一生人工無能と会話してろ。
長いのでAIくんの代わりに要約します。言いたいことはタイトル通り。 「ハルシネーションを叩くな」終わり。 ①各種LLMの性能比較GPT系の今の性能はゴミクズ。マジで頭悪い。 例をあげよう。 簡単な論理クイズだ。 ###文章### Aさんは自身はCさんとは別人であると主張している。 Bさんは、Cさんの発言を記事でまとめ、プ... 続きを読む