タグ 機械学習モデル
人気順 10 users 50 users 100 users 500 users 1000 usersMicrosoftの検索エンジンBingがTransformerからLLMとSLMの組み合わせに移行&TensorRT-LLMの統合を発表
Microsoftは検索エンジンのBingで、これまでGoogleが開発した機械学習モデルの「Transformer」を採用してきました。しかし、Transformerに限界が訪れたとして、大規模言語モデル(LLM)と小規模言語モデル(SLM)の組み合わせに移行すると発表しています。さらに、ワークフローにNVIDIAが開発している「TensorRT-LLM」を統合... 続きを読む
GitHubからエンジニアスキルを可視化する「スキル偏差値」を大幅リニューアルした話 - Findy Tech Blog
こんにちは。 FindyでMLエンジニアをしているyusukeshimpo(@WebY76755963)です。 今回は直近で公開する「スキル偏差値ver.3」機能について、その内容や具体的な機械学習モデルの作成方法について紹介します。 Findyのスキル偏差値とは? スキル偏差値の概要 アップデートすることになった背景 スキルの見える化する、ス... 続きを読む
LLMを活用した機械学習モデルのアノテーション効率化 - LayerX エンジニアブログ
機械学習エンジニアの吉田です。今回は、LLM (Large Language Models) を活用して、機械学習モデルに必要なデータのアノテーション作業を効率化する取り組みについて紹介します。 なお、アノテーションにおけるLLMの利用に関しては、クラウドベンダー各社及び社内の法務確認のうえ進めています。この記事で登場するLLMが... 続きを読む
機械学習で従来の3500倍以上高速かつコストが10万分の1に抑えられる気象予測モデル「NeuralGCM」をGoogle Researchが公開
Googleの研究部門であるGoogle Researchが、地球の大気をシミュレートする機械学習モデル「NeuralGCM」を開発したことを発表しました。このモデルは、従来の物理ベースのモデリングと機械学習を組み合わせることで、シミュレーションの精度と効率を向上させており、2〜15日間の天気予報において従来のモデルよりも正確な... 続きを読む
Slackがユーザーの明示的な許可なくメッセージなどをAIトレーニングに利用していることが判明
Slackが、ユーザーのメッセージやデータ、ファイル、その他のコンテンツを機械学習モデルのトレーニングに利用していることが明らかになりました。プライバシーポリシーが変更されたのは2023年9月のことでしたが、ユーザーの多くはそのことに気付いておらず、ユーザーから明示的に許可を得ることなくデータをトレーニン... 続きを読む
Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは?
Googleの機械学習モデル「Transformer」は、データを時系列に処理しなくても、自然言語などのデータを翻訳やテキスト要約することが可能で、ChatGPTなどの自然な会話が可能なチャットAIのベースとなっています。また、Transformerの手法を画像分野に応用したモデルが「Vision Transformer」です。ソフトウェアエンジニア... 続きを読む
AI導入による口コミ投稿画像のカテゴライズ業務の一部自動化について - Tabelog Tech Blog
目次 目次 はじめに 口コミ投稿画像のカテゴライズ業務について なぜ自動化することにしたのか? どのように自動化を実現したのか? 1. 画像をカテゴライズできる機械学習モデルを実現した方法 1-1. CLIPについて 1-2. 口コミ投稿画像のカテゴライズ業務にCLIPを利用する方法 2. 食べログのシステムに機械学習モデルを組... 続きを読む
機械学習による株価予測 - Qiita
こんにちは。私がAidemyでデータ分析講座コースを受講いたしました。今回は学んだスキルを活用して、上場企業を株価予測をしてみました。 目次 1.目的 2. データセット 3. 機械学習モデル 4. 予測モデルの構築と検証 5. 結果 6. 反省 1.目的 上場会社の株価データセットを用いて、株価予測するLSTMの機械学習モデルを構... 続きを読む
ZOZOTOWN検索における精度評価手法の運用で見えた課題とその改善アプローチ - ZOZO TECH BLOG
こんにちは。検索基盤部の橘です。検索基盤部では、ZOZOTOWNのおすすめ順検索の品質向上を目指し、機械学習モデル等を活用しフィルタリングやリランキングによる検索結果の並び順の改善に取り組んでいます。 ZOZOTOWN検索の並び順の精度改善の取り組みについては以下の記事をご参照ください。 techblog.zozo.com 検索基... 続きを読む
AIはあらゆる職をヒトから奪うが、配管工事まではまだできないだろう | ジェフリー・ヒントン、怒りのAI黙示録
人工知能と生物的な知能の違い AIが人類の存亡に関わる脅威になると確信したのはどうしてか、ヒントンに尋ねた。それは、AIの最も厄介な問題のひとつを解決しようとしたときから始まったと彼は言う。すなわち、AIが消費する、はちゃめちゃに大量のエネルギーだ。 ある概算によれば、ChatGPTは、大半の機械学習モデルと同... 続きを読む
機械学習モデルの再学習でLoRAよりもより少ない計算コストと時間でより高いパフォーマンスを期待できる「DoRA」
大規模言語モデルや画像生成AIなどの機械学習モデルでは、ファインチューニングやLoRA(Low Rank Adaptation)といった手法によって、モデルの重みを微調整し、特定のタスクや目的に沿った出力を行うようにカスタマイズすることができます。香港科技大学の研究チームが、LoRAよりも計算コストと時間を削減できる新たな手法... 続きを読む
クーポン推薦モデルとシステム改善の取り組み - ZOZO TECH BLOG
はじめに ML・データ部推薦基盤ブロックの佐藤(@rayuron)です。私たちはZOZOTOWNのパーソナライズを実現するために、機械学習モデルとシステムを開発・運用しています。本記事ではクーポン推薦のための機械学習モデルとシステム改善に取り組んだ話を紹介します。 はじめに 背景 課題 1. 古い基盤でシステムが運用され... 続きを読む
『Human-in-the-Loop 機械学習』 - ジョイジョイジョイ
共立出版さまより『Human-in-the-Loop 機械学習』をご恵贈いただきました。一通り読み終えたので感想を共有します。 映り込みが激しくて写真を撮るのが難しいことで有名な表紙 本書は機械学習モデルを訓練するためのデータを人間がどのように用意するかという問題を扱っています。本書の前半では能動学習というラベル付... 続きを読む
機械学習モデルのA/BテストをしやすくするGo言語のAPI設計 - エムスリーテックブログ
こちらはエムスリー Advent Calendar 2023 11日目の記事です。 DALL-Eでサムネ作るの楽勝だぜとなりそうでならない Overview A/Bテストをしまくっている、機械学習エンジニアの農見(@rookzeno)です。皆さんA/Bテストをしてますでしょうか。エムスリーでは色々な施策の効果を見るために沢山のA/Bテストをしています。その... 続きを読む
何でも微分する
IBIS 2023 企画セッション『最適輸送』 https://ibisml.org/ibis2023/os/#os3 で発表した内容です。 講演概要: 最適輸送が機械学習コミュニティーで人気を博している要因として、最適輸送には微分可能な変種が存在することが挙げられる。微分可能な最適輸送は様々な機械学習モデルに構成要素として簡単に組み入れること... 続きを読む
日本語の単語を適切な位置で区切って読みやすく改行してくれる軽量でオープンソースなライブラリ「BudouX」の機能&採用例&デモはこんな感じ、Chrome 119に実装予定で簡単に利用できる見
日本語のページをブラウザで見ているとおかしな位置で改行されることが多いのですが、単語と単語の間にスペースを入れる英語などと異なり、日本語では分かち書きがされていないのが原因。単語の途中で文章が折り返されてしまう原因になっています。BudouXは機械学習モデルを利用して容量を抑えつつ、サードパーティーのA... 続きを読む
ZOZOTOWN検索におけるA/Bテスト分析の自動化の取り組み - ZOZO TECH BLOG
はじめに こんにちは。検索基盤部の岩崎です。検索基盤部ではZOZOTOWNの検索機能の改善に日々取り組んでいます。ZOZOTOWNのおすすめ順検索のプロジェクトでは、機械学習モデルを活用した検索結果の並び順の改善に取り組んでおり、全ての施策はA/Bテストで検証しています。なお、最近の並び順精度改善の取り組みについて... 続きを読む
1万種類を超える大規模言語モデル(LLM)をまとめてダウンロード数や類似性などを分かりやすく視覚化したデータライブラリが公開される
2022年後半から「ChatGPT」や「Bard」など数え切れないほどの大規模言語モデル(LLM)およびAIサービスが登場し、世界中のユーザーが生成AIを積極的に使い始めるようになりました。こうした大規模言語モデルの多くは機械学習モデルとデータセットのリポジトリであるHugging Faceに寄託されていますが、スタンフォード大学... 続きを読む
「WebGPU」をサポートした「Google Chrome 113」が正式版に ~脆弱性の修正は15件/グラフィックスの描画や機械学習モデルの推論に大きなメリット
「AI多すぎ、何使えばいいか分からない……」を解決するAI「HuggingGPT」 文章入力だけで、適切な機械学習モデルを自動選択
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 中国の浙江大学とMicrosoft Research Asiaに所属する研究者らが発表した論文「HuggingGPT: Solving AI Tasks... 続きを読む
オープンAIが巨大言語モデルGPT-4の重要情報を公開せず、AIの性能向上に深まる謎
米OpenAI(オープンAI)が2023年3月中旬にリリースした最新の巨大言語モデルGPT-4については、大きな「謎」がある。機械学習モデルの規模(パラメーター数)や学習させたデータ量が明らかにされていないのだ。 2020年発表の「スケーリング則」がここにきて話題に オープンAIが2022年11月にリリースしたAI(人工知能)チ... 続きを読む
VRリズムゲームでのプレイヤーの動きから個人を特定するAI 数秒の動きから判断 識別精度は94%
米UC Berkeley、ドイツのRWTH Aachen、米国のテクノロジー企業Unanimous AIに所属する研究者らは、VRリズムゲーム「Beat Saber」(ビートセイバー)のプレイヤーの動きからその人を特定する機械学習モデルを提案した研究報告を発表した。 続きを読む
数千万ユーザーのビッグデータに機械学習モデルを適用するには(広告配信ソリューション実現の工夫紹介)
こんにちは。Yahoo!広告にてデータアナリストをしている國吉です。 ヤフーでは、「Yahoo!広告」という広告出稿サービスを提供しており、それに付随して、広告を出稿するクライアントを支援するためのソリューションを提供しています。本記事では、私が開発に携わっている「Yahoo! JAPAN 予測ファネル」(以下、予測ファ... 続きを読む
Kaggleや競プロのトップランカーが持つ「本質的な強み」とは。リクルートが作り出す、競技と業務の好循環 - はてなニュース
ソフトウェアエンジニアがプログラミングの腕を競い合う競技プログラミングや、データサイエンティストや機械学習エンジニアが機械学習モデルの精度を競い合うKaggle。こうしたコンペティションのトップランカーが持つテクニックやスキルを実際の業務にも活かそうとしている、あるいはすでに活かしている企業も少なくな... 続きを読む
セッショナイズで機械学習モデルの精度を改善した話 - エニグモ開発者ブログ
こんにちは、データサイエンティストの堀部です。 この記事はEnigmo Advent Calendar 2022の16日目の記事です。 普段の業務では情報検索(検索/レコメンド)、不正検知、ユーザー属性の推定などをBUYMAにプロダクトとして組み込むことを行っています。その中でもモデリング以前のタスク設計や探索的データ分析(EDA: Explan... 続きを読む