タグ 推論能力
人気順 10 users 50 users 100 users 500 users 1000 usersOpenAI、新たなAIモデル「o3」発表--AGIへ前進、軽量版は1月末公開
OpenAIは、推論能力を大幅に強化した新しいAIモデル「o3」およびその軽量版「o3 mini」を発表した。複雑な問題解決能力を持ち、科学、数学、コーディングなどの幅広い分野で優れたパフォーマンスを発揮するという。2025年1月末頃に「o3 mini」が、その後すぐに強力な「o3」が登場する。 o3とは 名称は順当なら「o2」とな... 続きを読む
保守派もリベラル派も「自分の政治的信念に合致したニュース」を信じやすいという研究結果
政治に関するフェイクニュースは現実世界に深刻な影響を及ぼしており、「対立陣営はフェイクニュースを流して世間を操っている」と感じている人もいるはず。スタンフォード大学の心理学者らが主導した新たな研究では、人々は政治的信念や教育レベル、推論能力などにかかわらず「自分の政治的信念に合致したニュース」を... 続きを読む
GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?
大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エ... 続きを読む
コード生成・数学・推論の能力が大幅に向上した「Mistral Large 2」をMistral AIがリリース
フランスのAI開発企業・Mistral AIが、新世代の主力モデル「Mistral Large 2」を2024年7月24日に発表しました。Mistral Large 2は、コード生成、数学、推論能力が大幅に向上したほか、128kのコンテキストウィンドウを持ち、数十種類の言語やプログラミング言語にも対応しています。 Large Enough | Mistral AI | Frontie... 続きを読む
GPT-4oがAIベンチマークのARC-AGIで50%のスコアに到達、これまでの最高記録である34%を大幅に更新
AI研究者のライアン・グリーンブラット氏が、AIの一般的な推論能力を評価する指標の「ARC-AGI」において、GPT-4oを工夫して使用することで50%という正答率を達成できたと発表しました。 Getting 50% (SoTA) on ARC-AGI with GPT-4o https://redwoodresearch.substack.com/p/getting-50-sota-on-arc-agi-with-gpt ARC-AG... 続きを読む
【Orca-2-13b】Microsoftの最新LLMがLlama 2を超える性能を叩き出す | WEEL
WEELメディア事業部テックリサーチャーの藤崎です。 2023年11月21日に、Microsoftから小規模言語モデルの「Orca-2-13b」が公開されました。 このモデルはmeta社が開発したLLAMA 2と呼ばれる言語モデルをベースにしており、推論能力を向上させるために開発されました。 Orca-2-13bを発表したMicrosoft Researchのツイート... 続きを読む
OpenAIが4度目のブレイクスルーとなる数学ができるAI「Q*(キュースター)」で汎用人工知能開発の飛躍を目指す、アルトマンCEO解任騒動の一因か
OpenAIが新たなAI開発プロジェクト「Q*(キュースター)」を進めていることを認めたと報じられています。このQ*は数学的推論能力の改善を目指したもので、汎用人工知能(AGI)の研究に画期的な進歩をもたらすかもしれず、2023年11月に起こったサム・アルトマンCEO解任騒動の一因にもなった可能性が指摘されています OpenAI r... 続きを読む
LLMが真の推論能力を発揮するには時折「一時停止」させるのが重要との報告 | AIDB
マイページに保存最終更新日:2023/10/12 大規模言語モデル(LLM)はしばしば、真の推論能力を発揮しきれていない出力を行っています。この現象はカーネギーメロン大学とGoogleの研究者らによって指摘され、さらに解決するための新しいアプローチが提案されています。 本研究は、一時停止トークンという新しい手法を導入... 続きを読む
推論能力をさらに強める戦略『AoT』で、LLMが「直感」に似た能力を示すようになった | AIDB
既存アルゴリズムの応用 AoTは、既存の探索アルゴリズムを巧妙に応用しています。具体的には、深さ優先探索(DFS)や幅優先探索(BFS)のようなアルゴリズムを模倣し、それを基に新しい探索戦略を構築しています。 これにより、AoTは問題解決において非常に柔軟なアプローチを取ることができます。例えば、DFSを用いるこ... 続きを読む
ChatGPTのおさらいと、プログラミングに活用するための第一歩 | gihyo.jp
大量の文章から学習することで、多言語を取り扱う能力だけでなく、高度な推論能力まで手に入れました。 GPT-3.5、とりわけその初期モデルのCodexはGitHubに存在する5400万の公開リポジトリから採取された159GBのPythonコードでGPT-3をfine-tuning(微調整)することで生まれました。ChatGPTがとりわけPythonが得意なのは... 続きを読む
最近話題になった大規模言語モデルまとめ|npaka|note
最近話題になった大規模言語モデルをまとめました。 1. GPT-4「GPT-4」は、OpenAIによって開発された大規模言語モデルです。 マルチモーダルで、テキストと画像のプロンプトを受け入れることができるようになりました。最大トークン数が4Kから32kに増えました。推論能力も飛躍的に向上しています。 現在、「ChatGPT Pro... 続きを読む
[B! 増田] 主語が大きいことを問題視する人は推論能力にハンディキャップを抱えている可能性があるのでは?
主語が大きいことを問題視する人は推論能力にハンディキャップを抱えている可能性があるのでは?
はてなとかTwitterとか見てるとよく感じるんだけど、やっぱりしんどいなあと感じた。 https://anond.hatelabo.jp/20201104215721 たとえば 中年おっさんは傲慢だ。 という主張があったとする。 これに対して、はてなやTwitterの人たち(その多くはオタクっぽい?)は 発言者は「すべての中年おっさんは傲慢だ」と言って... 続きを読む
知能は遺伝するが、そもそも能力の限界値まで努力したのか - 俺の遺言を聴いてほしい
橘玲先生の『言ってはいけない』では、進化生物学を根拠に、人間の能力がどれくらい遺伝によって決まるかを論じている。 論理的推論能力の遺伝率は68%、一般知能の遺伝率は77%とされていて、頭の良し悪しの7〜8割は遺伝で説明できるという。 かつて3男1女すべてを東大理Ⅲに合格させた佐藤亮子ママが話題になった。 彼女... 続きを読む
若いゲーマーは道徳的推論能力が非ゲーマーよりも高いことが研究により明らかに - GIGAZINE
by Mike Meyers 若いゲーマーは非ゲーマーよりも高い道徳的推論能力を身に付けていることが最新の調査から明らかになっています。また、ゲームの中に存在する暴力性は道徳的推論能力と正の関係にあることも判明しています。 Frontiers | It’s Double Edged: The Positive and Negative Relationships Between the Develo... 続きを読む
人工知能がポーカーでも人間のプロに勝利--カーネギーメロン大学の「Libratus」 - CNET Japan
ピッツバーグで20日間にわたって開催されたポーカーのヘッズアップトーナメントで、カーネギーメロン大学(CMU)の開発した人工知能(AI)システムがプロのポーカープレーヤー4人を破った。 2人のプレーヤーで行われる無制限のテキサスホールデムでは、10の160乗の情報セットが考えられる。CMUのAIシステム「Libratus」は、その情報セットを処理する戦略的推論能力と計算能力を備える。 Librat... 続きを読む