はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ 推論能力

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 11 / 11件)
 

OpenAI、新たなAIモデル「o3」発表--AGIへ前進、軽量版は1月末公開

2024/12/20 このエントリーをはてなブックマークに追加 15 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI コーディング 数学 英国 名称

OpenAIは、推論能力を大幅に強化した新しいAIモデル「o3」およびその軽量版「o3 mini」を発表した。複雑な問題解決能力を持ち、科学、数学、コーディングなどの幅広い分野で優れたパフォーマンスを発揮するという。2025年1月末頃に「o3 mini」が、その後すぐに強力な「o3」が登場する。 o3とは 名称は順当なら「o2」とな... 続きを読む

保守派もリベラル派も「自分の政治的信念に合致したニュース」を信じやすいという研究結果

2024/11/23 このエントリーをはてなブックマークに追加 77 users Instapaper Pocket Tweet Facebook Share Evernote Clip 信念 リベラル派 スタンフォード大学 保守派 世間

政治に関するフェイクニュースは現実世界に深刻な影響を及ぼしており、「対立陣営はフェイクニュースを流して世間を操っている」と感じている人もいるはず。スタンフォード大学の心理学者らが主導した新たな研究では、人々は政治的信念や教育レベル、推論能力などにかかわらず「自分の政治的信念に合致したニュース」を... 続きを読む

GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?

2024/10/19 このエントリーをはてなブックマークに追加 227 users Instapaper Pocket Tweet Facebook Share Evernote Clip Claude LLM GPT-4 算数 ウソ

大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エ... 続きを読む

GPT-4oがAIベンチマークのARC-AGIで50%のスコアに到達、これまでの最高記録である34%を大幅に更新

2024/06/18 このエントリーをはてなブックマークに追加 10 users Instapaper Pocket Tweet Facebook Share Evernote Clip Sota GPT-4o 正答率 指標 スコア

AI研究者のライアン・グリーンブラット氏が、AIの一般的な推論能力を評価する指標の「ARC-AGI」において、GPT-4oを工夫して使用することで50%という正答率を達成できたと発表しました。 Getting 50% (SoTA) on ARC-AGI with GPT-4o https://redwoodresearch.substack.com/p/getting-50-sota-on-arc-agi-with-gpt ARC-AG... 続きを読む

OpenAIが4度目のブレイクスルーとなる数学ができるAI「Q*(キュースター)」で汎用人工知能開発の飛躍を目指す、アルトマンCEO解任騒動の一因か

2023/11/24 このエントリーをはてなブックマークに追加 22 users Instapaper Pocket Tweet Facebook Share Evernote Clip OpenAI AGI 一因 飛躍 数学

OpenAIが新たなAI開発プロジェクト「Q*(キュースター)」を進めていることを認めたと報じられています。このQ*は数学的推論能力の改善を目指したもので、汎用人工知能(AGI)の研究に画期的な進歩をもたらすかもしれず、2023年11月に起こったサム・アルトマンCEO解任騒動の一因にもなった可能性が指摘されています OpenAI r... 続きを読む

ChatGPTのおさらいと、プログラミングに活用するための第一歩 | gihyo.jp

2023/03/23 このエントリーをはてなブックマークに追加 673 users Instapaper Pocket Tweet Facebook Share Evernote Clip chatgpt Fine-tuning Codex おさらい

大量の文章から学習することで、多言語を取り扱う能力だけでなく、高度な推論能力まで手に入れました。 GPT-3.5、とりわけその初期モデルのCodexはGitHubに存在する5400万の公開リポジトリから採取された159GBのPythonコードでGPT-3をfine-tuning(微調整)することで生まれました。ChatGPTがとりわけPythonが得意なのは... 続きを読む

最近話題になった大規模言語モデルまとめ|npaka|note

2023/03/16 このエントリーをはてなブックマークに追加 82 users Instapaper Pocket Tweet Facebook Share Evernote Clip Note マルチモーダル 話題 OpenAI プロンプト

最近話題になった大規模言語モデルをまとめました。 1. GPT-4「GPT-4」は、OpenAIによって開発された大規模言語モデルです。 マルチモーダルで、テキストと画像のプロンプトを受け入れることができるようになりました。最大トークン数が4Kから32kに増えました。推論能力も飛躍的に向上しています。 現在、「ChatGPT Pro... 続きを読む

主語が大きいことを問題視する人は推論能力にハンディキャップを抱えている可能性があるのでは?

2020/11/05 このエントリーをはてなブックマークに追加 276 users Instapaper Pocket Tweet Facebook Share Evernote Clip ハンディキャップ 主語 大きいこと 可能性

はてなとかTwitterとか見てるとよく感じるんだけど、やっぱりしんどいなあと感じた。 https://anond.hatelabo.jp/20201104215721 たとえば 中年おっさんは傲慢だ。 という主張があったとする。 これに対して、はてなやTwitterの人たち(その多くはオタクっぽい?)は 発言者は「すべての中年おっさんは傲慢だ」と言って... 続きを読む

知能は遺伝するが、そもそも能力の限界値まで努力したのか - 俺の遺言を聴いてほしい

2019/03/01 このエントリーをはてなブックマークに追加 27 users Instapaper Pocket Tweet Facebook Share Evernote Clip 遺伝 遺言 知能 根拠 東大理

橘玲先生の『言ってはいけない』では、進化生物学を根拠に、人間の能力がどれくらい遺伝によって決まるかを論じている。 論理的推論能力の遺伝率は68%、一般知能の遺伝率は77%とされていて、頭の良し悪しの7〜8割は遺伝で説明できるという。 かつて3男1女すべてを東大理Ⅲに合格させた佐藤亮子ママが話題になった。 彼女... 続きを読む

若いゲーマーは道徳的推論能力が非ゲーマーよりも高いことが研究により明らかに - GIGAZINE

2019/02/12 このエントリーをはてなブックマークに追加 59 users Instapaper Pocket Tweet Facebook Share Evernote Clip GIGAZINE Frontiers 若いゲーマー 暴力性

by Mike Meyers 若いゲーマーは非ゲーマーよりも高い道徳的推論能力を身に付けていることが最新の調査から明らかになっています。また、ゲームの中に存在する暴力性は道徳的推論能力と正の関係にあることも判明しています。 Frontiers | It’s Double Edged: The Positive and Negative Relationships Between the Develo... 続きを読む

人工知能がポーカーでも人間のプロに勝利--カーネギーメロン大学の「Libratus」 - CNET Japan

2017/02/02 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip Libratus ポーカー CMU ピッツバーグ 人工知能

ピッツバーグで20日間にわたって開催されたポーカーのヘッズアップトーナメントで、カーネギーメロン大学(CMU)の開発した人工知能(AI)システムがプロのポーカープレーヤー4人を破った。 2人のプレーヤーで行われる無制限のテキサスホールデムでは、10の160乗の情報セットが考えられる。CMUのAIシステム「Libratus」は、その情報セットを処理する戦略的推論能力と計算能力を備える。 Librat... 続きを読む

 
(1 - 11 / 11件)