タグ 性能評価
人気順 10 users 50 users 100 users 500 users 1000 users日本語のAIで使う大規模言語モデル性能を評価する「オープン日本語LLMリーダーボード」公開
16種類以上のNLP(自然言語処理)タスクを用いて日本語の大規模言語モデル(LLM)の性能評価と分析を行う「オープン日本語LLMリーダーボード」が公開されました。構築には国立情報学研究所をはじめとする日本語LLMの研究開発を行う組織横断プロジェクト「LLM-jp」が携わっています。 Open Japanese LLM Leaderboard - a Hugg... 続きを読む
(続)ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ
概要 背景・目的 関連研究 提案手法 実験 アルゴリズムの説明 順位相関の確認 定量評価 定量評価の内訳 定性評価 おわりに 参考文献 DROBEで機械学習エンジニアをしております、藤崎です。 概要 ファッションアイテムを特徴づけるための情報として、画像とテキストがある。これらは異なる情報を含んでいると考えられる。... 続きを読む
ファッションにおける類似商品検索アルゴリズムの性能評価 - DROBEプロダクト開発ブログ
概要 背景・目的 実験 実験の概要 定量評価 定性評価 おわりに 参考文献 DROBEで機械学習エンジニアをしております、藤崎です。 概要 類似商品検索の基盤となる複数の特徴抽出アルゴリズムについて、DROBEの保有するデータで評価した 定量評価によると、画像単体を入力とする ResNet-50(自己教師あり学習)とCLIPの性能... 続きを読む
5倍望遠カメラを搭載した「iPhone 15 Pro Max」のカメラ性能まとめ、望遠カメラでもブレ皆無で鮮明な写真を撮影可能
2023年9月に発表された「iPhone 15 Pro Max」には、iPhone史上最長の焦点距離を備えた5倍ズームカメラが搭載されています。そんなiPhone 15 Pro Maxで実際に撮影した写真と性能評価をカメラアプリ「Halide」の開発者であるセバスティアン・デ・ウィズ氏がまとめています。 iPhone 15 Pro Max Camera Review: Depth and R... 続きを読む
日本語言語モデル「Japanese StableLM Alpha」をリリースしました — Stability AI Japan
Stability AI Japan は70億パラメータの日本語向け汎用言語モデル「Japanese StableLM Base Alpha 7B」及び、指示応答言語モデル「Japanese StableLM Instruct Alpha 7B」を一般公開しました。このモデルはベンチマークスイート「lm-evaluation-harness」による複数の日本語タスクを用いた性能評価において、一般公開さ... 続きを読む
Speculation Rules API によるプリレンダリングのためのメトリクス設計
本記事では Speculation Rules API を使ったプリレンダリングの性能評価を行うためのメトリクスについて紹介します。 はじめに ウェブページの読み込みは本質的に時間のかかる処理です。ウェブブラウザは HTML ファイルを解析することでページ表示に必要なリソースを特定・収集・処理し、それらを組み合わせてページの描... 続きを読む
NECの虹彩認証技術が世界1位に、本人認証のエラー率はわずか0.41%|ニュースイッチ by 日刊工業新聞社
NECは、米国標準研究所(NIST)が実施している直近の虹彩認証技術のベンチマークテスト(IREX10)において、2018年に続き世界第1位を獲得したと発表した。登録人数50万人に対する「1:N認証」で、本人認証のエラー率が0.41%(両目の場合)との性能評価を得た。 NISTは、虹彩認証技術の照... 続きを読む
東京の感染率0.6%! で全く恐くないと分かった新型コロナ - More Access! More Fun
【独自】「抗体検査」東京の献血で0.6%陽性、結果にばらつき 厚生労働省は、日本赤十字社が先月、感染の多い東京と感染の少ない東北でそれぞれ500人分ずづ集めた献血の検体を使って、抗体検査キットの性能評価を行いました。関係者によりますと、性能評価を行った複数のキットの結果を合わせると、東京では、50... 続きを読む
【独自】「抗体検査」東京の献血で0.6%陽性、結果にばらつき|TBS NEWS
厚労省が行った新型コロナウイルスの「抗体検査キット」の性能評価の調査で、東京で集めた500人分の献血のうち、0.6%が陽性だったことがわかりました。ただ、厚労省は検査キットごとに結果のばらつきがあり、正確な評価は出来ないとしています。 厚生労働省は、日本赤十字社が先月、感染の多い東京と感染の少ない... 続きを読む
【独自】「抗体検査」東京の献血で0.6%陽性、結果にばらつき(TBS系(JNN)) - Yahoo!ニュース
厚労省が行った新型コロナウイルスの「抗体検査キット」の性能評価の調査で、東京で集めた500人分の献血のうち、0.6%が陽性だったことがわかりました。ただ、厚労省は検査キットごとに結果のばらつきがあり、正確な評価は出来ないとしています。 厚生労働省は、日本赤十字社が先月、感染の多い東京と感染の少ない... 続きを読む
日本の半導体ベンチャー、TSMCの5nmプロセス採用AIプロセッサを開発 | マイナビニュース
日本のベンチャーが5nmプロセスでAIチップを開発 日本の半導体ファブレスベンチャーTRIPL-1は、2020年初頭時点で世界最先端の半導体プロセスとなるTSMCの5nmプロセスを採用したディープラーニング向けAIプロセッサ「GOKU」の量産に向けた第1段階の試作品を2019年9月に完成させ、現在、性能評価などを進めていることを明... 続きを読む
NECが世界1位!顔認証1200万人分、エラー率0.5%
NECは3日、米国標準研究所(NIST)が実施した最新の顔認証技術のベンチマークテスト「FRVT2018」で、第1位の性能評価を獲得したと発表した。1200万人分の静止画を使った顔認証でエラー率0・5%を達成し、17年の動画の顔認証ベンチマークに続き、5回目の世界1位を獲得した。 FRVTはNIS... 続きを読む
「Ryzen 9 3900X」と「Ryzen 7 3700X」を試す - 第3世代Ryzen+NAVI徹底攻略 (1) 第3世代RyzenとNAVIを完全検証【CPU編】 | マイナビニュース
無事に7月7日を迎え、AMDの第3世代RyzenとNAVIベースのRadeon RX 5700シリーズが発表になった。この新世代プラットフォームについて、まず評価の1発目は【CPU編】として、読者の皆様に一番関心があるであろう、第3世代Ryzenの性能をお届けしたいと思う。 ちなみに今回はあくまで性能評価をメインとするので、内部解説を... 続きを読む
D-waveマシンで最大カット問題を解く - Mercari Engineering Blog
こんにちは。Professional Internshipでインターンをしていた、@ukunです(9/7をもってインターン終了)。この記事では、インターン期間中に取り組んだ内容(最大カット問題に対するD-Waveマシンの性能評価)について紹介します。前半はD-Waveや扱った問題について、後半は具体的な実験内容とその結果について説明しています... 続きを読む
【パズドラ】期間限定MP購入キャラ 木ノ宮タカオの性能評価と使い道 - ファミコン世代のおっさんブログ
2017 - 06 - 12 【パズドラ】期間限定MP購入キャラ 木ノ宮タカオの性能評価と使い道 パズドラ攻略 おすすめ記事 Σ(゚◇゚;)マジデッ!? 1日たった11円でおすすめの映画・ドラマ・アニメも見放題&音楽も聴き放題!? 人気のブランドバックが 無料 でゲットできますけど、何か?w GACKT愛用のサプリメントがヤバい!? 驚愕の筋トレメニューで究極の肉体美をゲット! Tweet... 続きを読む
【100倍だぞ100倍】asia-northeast1のGAE-CloudSQL間の性能が良くなったらしいので検証しました | MAGELLAN BLOCKS
【100倍だぞ100倍】asia-northeast1のGAE-CloudSQL間の性能が良くなったらしいので検証しました こんにちは!ご無沙汰しております。 サーバエンジニア・データベースエンジニアの 熊野 です。 以前、こちらのエントリでasia-northeast1環境におけるGAEとCloudSQLの性能評価を実施しておりました。 GCP 東京リージョン(asia-northeast1) ... 続きを読む
TensorFlowによるDeep Learningでのアイドル顔識別モデルの性能評価と実験 その2 - すぎゃーんメモ
2017 - 02 - 22 TensorFlowによるDeep Learningでのアイドル顔識別モデルの性能評価と実験 その2 TensorFlow Python 以前に試した、アイドル顔識別の性能評価。 memo.sugyan.com それから半年以上も経ってデータ数も増えたし ちょっと確かめたいこともあったので、再び試してみた。 新デー タセット 前回は 40人×180件 で 計7,200... 続きを読む
【パズドラ】ハトホル、オシリス、ヌトのテンプレ性能評価・分岐と使い道 - ファミコン世代のおっさんブログ
2017 - 02 - 05 【パズドラ】ハトホル、オシリス、ヌトのテンプレ性能評価・分岐と使い道 パズドラ攻略 list Tweet Share on Tumblr ハトホル、オシリス、ヌトに新たに分岐究極が実装されました。 今回はその性能評価・分岐使い道を解説していきます。 パズドラ攻略していくぜぇ!ヽ(`∀´)ノ ウヒョー 分岐ハトホル なんと言っても特徴は覚醒スキルで初のコンボ強化2つ持ち... 続きを読む
【パズドラ】エルドラ入手方法と性能評価・アナを使ったテンプレでの使い道解説 - ファミコン世代のおっさんブログ
2017 - 01 - 26 【パズドラ】エルドラ入手方法と性能評価・アナを使ったテンプレでの使い道解説 パズドラ攻略 list Tweet Share on Tumblr 今回は闇アテナとともにMP購入可能になったエルドラの性能評価・テンプレでの使い道の解説をします。 購入の参考にしてくださいね パズドラ攻略していくぜぇ!ヽ(`∀´)ノ ウヒョー エルドラの入手方法 エルドラも闇アテナと同様にア... 続きを読む
【パズドラ ハジドラ企画第3弾】コラボ強化第2弾 巨人コラボの性能評価 - ファミコン世代のおっさんブログ
2017 - 01 - 16 【パズドラ ハジドラ企画第3弾】コラボ強化第2弾 巨人コラボの性能評価 パズドラ攻略 list Tweet Share on Tumblr ハジドラ企画第3弾のコラボ強化企画の第2弾として進撃の巨人コラボが選ばれました。 過去1度しか開催されていないコラボですが、 残念ながらこの企画に選ばれたということはコラボ復活は絶望的ということになりますねw パズドラ攻略していく... 続きを読む
TensorFlowによるDeep Learningでのアイドル顔識別モデルの性能評価と実験 - すぎゃーんメモ
2016 - 06 - 14 TensorFlowによるDeep Learningでのアイドル顔識別モデルの性能評価と実験 Python TensorFlow DeepLearning 以前から書いているDeep Learningによるアイドル顔識別の話の続き。 コツコツと顔画像収集とラベル付けを続けて、そこそこにデータが集まってきたので ここらでちゃんと性能評価をしてみよう、と。 デー タセット... 続きを読む
JR東日本、男鹿線に蓄電池電車「EV-E801系」導入へ | レスポンス
JR東日本、男鹿線に蓄電池電車「EV-E801系」導入へ 鉄道 企業動向 2015年11月20日(金) 17時30分 編集部にメッセージを送る JR東日本秋田支社は11月20日、男鹿線に新型の蓄電池電車「EV-E801系」を2両(2両編成1本)導入すると発表した。性能評価や技術的な検証を行った後、2017年春の営業開始を目指す。 男鹿線は追分(秋田市)~男鹿(秋田県男鹿市)間26.6kmの鉄道路線... 続きを読む
PGCon 2015 で計算機システムの性能評価について講演してきました - は
2015-06-28 PGCon 2015 で計算機システムの性能評価について講演してきました カナダのオタワ大学で開催されたPGCon 2015で、"The Art of Performance Evaluation" という題目で、計算機システム、とくにデータベースシステムに関する性能評価の基礎となる考え方と、基本となる3つの技能(モデリング、測定、シミュレーション)に関して講演を行ってきまし... 続きを読む
非順序型実行原理に基づく超高速データベースエンジンの詳細分析処理における性能評価
Featured Articles イノベイティブR&Dレポート 2014 非順序型実行原理に基づく 超高速データベースエンジンの 詳細分析処理における性能評価 ―内閣府最先端研究開発支援プロ グラムによ る産学連携研究成果― Shimizu Akira 清水 晃 茂木 和彦 合田 和生 喜連川 優 Mogi Kazuhiko Goda Kazuo Kitsuregawa Masar... 続きを読む
influxdb性能評価 — そこはかとなく書くよん。
influxdb性能評価 influxdbを試しに触ってみました。 実は1台テストとclusterテストの間には1月ぐらい間隔が開いています。また、あまりきちんとした性能評価ではありませんので、参考程度にしてください。 1台テスト DigitalOcean 1GB 30GB(SSD) 最初512MBで試していましたが、OOM Killerに殺されてしまったので1GBにしました。 登録 以下のような... 続きを読む