タグ AIモデル
人気順 10 users 50 users 100 users 500 users 1000 usersOpenAI、新たなAIモデル「o3」発表--AGIへ前進、軽量版は1月末公開
OpenAIは、推論能力を大幅に強化した新しいAIモデル「o3」およびその軽量版「o3 mini」を発表した。複雑な問題解決能力を持ち、科学、数学、コーディングなどの幅広い分野で優れたパフォーマンスを発揮するという。2025年1月末頃に「o3 mini」が、その後すぐに強力な「o3」が登場する。 o3とは 名称は順当なら「o2」とな... 続きを読む
AGIに最も近いAI「o3」登場──米OpenAI まずは「mini」を25年1月末に公開
米OpenAIは12月20日(現地時間)、新たなAIモデル「o3」を発表した。12日間に渡って開催してきた配信イベント「12 Days of OpenAI」の最終日となる12日目に発表した。同社が一般公開している中で最高性能の「o1」よりも性能が高く、汎用人工知能(AGI)としての性能を評価するベンチマークでもこれまでにないハイスコア... 続きを読む
米OpenAI、新たなAIモデル「o3」発表 「AGI」に最も近い性能に
o3は、高度な推論が可能な「o」シリーズの最新AIモデルで、o1の次世代モデルに当たる。o3の他にも、小型モデルに当たる「o3-mini」も開発。o3-miniは、o3よりも思考時間が短く、コスト効率も優れているという。同社はまず、2025年1月末ごろにo3-miniから一般提供を始める予定だ。 関連記事 ChatGPTに“月額3万円”の新有料... 続きを読む
AIはシャットダウンされると思うと「故意に人間を騙す」確率が激増する - ナゾロジー
「AIはときに嘘をつく」――そんな話は耳にしたことがあるかもしれません。 しかし、最新の研究では、ただの誤回答ではなく、AIが“意図的に”人間を欺くケースが報告されました。 調査対象となったAIモデルは「OpenAI社のgpt-4oとo1、Google社のgemini-1.5、Meta社のllama-3.1、Anthropic社のsonnet-3.5、opus-3」と有名ど... 続きを読む
ついにAI学習のためのデータが枯渇へ、データセットが不足しているAI企業は大規模で汎用的なLLMから小規模で専門性の高いモデルへの移行を余儀なくされる可能性大
AIモデルの開発には学習資料となるデータセットが必要不可欠ですが、すでに大規模なモデルはアクセスできるデータのほとんどを食い尽くしており、2028年までにデータを使い果たしてしまう可能性が指摘されています。AIとデータセットの現状について、学術雑誌のNatureがまとめています。 The AI revolution is running o... 続きを読む
Microsoftが軽量なのにGPT-4oを圧倒的に上回る数学性能を発揮するAIモデル「Phi-4」をリリース
Microsoftが言語モデル「Phi-4」を2024年12月13日にリリースしました。Phi-4のパラメーター数は140億で主要な大規模言語モデルと比べると小規模ですが、数学性能では最上位クラスの性能を発揮します。 Introducing Phi-4: Microsoft’s Newest Small Language Model Specializing in Complex Reasoning | Microsoft Commu... 続きを読む
Google、生成AIを支える新TPU「Trillium」の一般提供開始
米Googleは12月11日(現地時間)、同社の第6世代TPU(Tensor Processing Unit)、「Trillium」のGoogle Cloudでの一般提供開始を発表した。Trilliumは今年のGoogle I/Oで予告していたTPUだ。 TPUは、Googleが開発した特定用途向け集積回路(ASIC)で、AIモデルのトレーニングや推論に最適化されている。Trilliumは同日発... 続きを読む
グーグル「Gemini 2.0」公開 「エージェント時代のAIモデル」
一般家庭の手頃なハードウェア上で瞬時に画像を生成できるオープンソースAIモデル「NitroFusion」がリリースされる
イギリス・サリー大学のサリー人間中心人工知能研究所が、控えめで手頃な価格のハードウェアのみを使用して瞬時に画像を生成するAIモデル「NitroFusion」を作成したと発表しました。 Surrey announces world's first AI model for near-instant image creation on consumer-grade hardware | University of Surrey https... 続きを読む
AIモデルに「不要な知識」を忘れさせる新技術。より効率的なAIが作れるかも
【無料コード配布中】髪の毛や半透明オブジェクトなどでも完璧にAIで背景透過に変える「Aiarty Image Matting」でいろんな写真を透過しまくってみた
髪の毛や毛皮、低照度画像、透明・半透明のオブジェクトなど背景とオブジェクトの判別が難しい写真でも完璧に背景の透過ができるというAIソフトウェアが「Aiarty Image Matting」です。32万枚の4K画像でトレーニングしたという4つのAIモデルを駆使して精巧な背景透過を実現しているということだったので、実際に使ってみ... 続きを読む
月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた
米OpenAIが12月5日(現地時間)に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル(1ドル150円換算で約3万円)という価格体系も話題に。果たしてその値段に見合う価値はある... 続きを読む
Google DeepMindが1枚の画像からプレイ可能な3D世界を生成できるAIモデル「Genie 2」を発表
Google DeepMindが、単一の入力画像からプレイ可能な3D環境を生成できる基盤的世界モデル「Genie 2」を2024年12月4日に発表しました。Genie 2で生成した世界は、人間やAIエージェントがキーボードとマウスを使った操作で移動することが可能です。 Genie 2: A large-scale foundation world model - Google DeepMind http... 続きを読む
AIのスケーリング則が限界に直面、「学習データや学習量を増やせばAIの性能が上がる」という状況はすでに終わっている
AIのスケーリング則は2020年1月にOpenAIが提唱した法則で、「AIモデルの性能は、『学習に使われるデータの規模』『学習に使われる計算量』『モデルのパラメーター数』が増加するほど強化される」というものです。この法則について、AIの動向に詳しいゲイリー・マーカス氏が「AI業界ではスケーリング則が通用しなくなって... 続きを読む
科学論文の調査に特化したAIモデル「OpenScholar」がベンチマークでGPT-4oを上回る、科学研究の大幅な効率化に期待
近年は生命分子の構造と相互作用を予測するAIモデル「AlphaFold 3」がリリースされたり、「ChatGPTのおかげで論文を読む手間が99%減った」と研究者が報告したりするなど、科学研究におけるAIの活用はますます重要なものになっています。新たに、ワシントン大学とアレン人工知能研究所の研究チームが、科学文献の調査に... 続きを読む
Google DeepMindがAIですべての生命分子の構造と相互作用を予測できる「AlphaFold 3」をオープンソース化、科学的発見と創薬の加速へ
Google DeepMindが2018年に開発した、アミノ酸の配列情報からタンパク質の立体構造を予測するAI「AlphaFold」は、多くの重要な分野での研究を加速させることを目的に、2021年にオープンソース化されました。2024年5月にはより多くの生命分子の構造と相互作用を予測できるAIモデル「AlphaFold 3」をリリースし、当初は完... 続きを読む
自治体を苦しめてきた「オープンデータ公開」 負担軽減へ生成AIが秘める可能性とは?
自治体を苦しめてきた「オープンデータ公開」 負担軽減へ生成AIが秘める可能性とは?(1/4 ページ) こんにちは。全国の自治体でデジタル化をサポートしている川口弘行です。 生成AIは大手3社(OpenAI、Google、Anthropic)の他にも、魅力的なAIサービスを提供している事業者が数多くあります。AIモデル(LLM)の開発で... 続きを読む
ドキュメントファイルの解析と変換に特化したオープンソースツール「docling」を試してみた | DevelopersIO
AWS事業本部コンサルティング部の石川です。最近、文書ファイルの解析と変換に特化した オープンソースツール「docling」 が注目を集めています。このツールは、最先端のAIモデルを活用して、ドキュメントの構造を理解し、様々な形式に変換することができます。今回、実際にdoclingを使用して日本語のドキュメントファイ... 続きを読む
AI、ついにパソコンを使えるようになってしまう Anthropic「Claude 3.5 Sonnet」新機能
AI企業のAnthropicは10月23日、大規模言語モデル「Claude 3.5 Sonnet」の刷新と、新モデル「Claude 3.5 Haiku」の導入を発表した。Claude 3.5 Sonnetには、AIモデルが人間のようにコンピューターを操作できるようになる新機能「コンピューター使用」が追加された。 アップデート版のClaude 3.5 Sonnetは、特にコーディン... 続きを読む
X/旧Twitterが「ユーザーデータでサードパーティのAIモデルがトレーニングできる」ようにプライバシーポリシーを更新、オプトアウト可能かどうかは不明
2024年10月16日(水)に、Xはプライバシーポリシーの更新を発表しました。この中で「AIと機械学習の明確化」が明言されており、ユーザーのデータをサードパーティーAIのトレーニングに使用できる文言が追加されています。 Updates to our Terms of Service and Privacy Policy https://privacy.x.com/en/blog/2024/updates... 続きを読む
JR東が「鉄道版生成 AI」開発へ 鉄道固有の知識を学習、経験浅い社員の知識レベル底上げに
JR東日本は10月8日、鉄道固有の知識を学習したAI「鉄道版生成 AI」を開発すると発表した。鉄道に関する法令・規則や、属人化していた業務知識や仕事のノウハウをAIに集約し、社員の業務効率化を目指す。2027年度末での完成を目標に、段階的に開発を進める。 ベースとなるAIモデルは明かしていないが、日本語で学習した大... 続きを読む
AppleのAI研究チームがAIモデル「Depth Pro」をリリース、単一の画像を使用して標準GPUで225万ピクセルの3D深度マップを0.3秒で生成できる
機械が深度(奥行き)を認識する方法を大幅に進歩させるモデル「Depth Pro」をAppleのAI研究チームがリリースしました。他の方法では見落とされがちな「髪の毛」や「草木」といった細かいディテールを持った物体の深度も正確に認識可能で、高解像度の深度マップをわずか0.3秒で生成することが可能な点が特徴。自動運転車な... 続きを読む
OpenAI、AIモデルのマルチモーダル対応やファインチューニング機能強化を発表 無料でどこまで使える?
OpenAI、AIモデルのマルチモーダル対応やファインチューニング機能強化を発表 無料でどこまで使える?:コスト効率を高めるプロンプトキャッシングも導入 OpenAIは、同社のAIモデル向けの「Realtime API」(パブリックβ版)、「Chat Completions API」の音声入出力サポート、「ビジョンファインチューニング」機能、「M... 続きを読む
OpenAIのGPT-4oに「画像でファインチューニングする機能」が追加される、わずか100枚の画像でタスクの性能が向上
OpenAIが2024年5月にリリースしたAIモデル「GPT-4o」に、2024年10月1日から「画像でファインチューニングする機能」が追加されました。すでにテキストでGPT-4oをファインチューニングする機能は提供されていましたが、画像でのファインチューニングが可能になったことで、視覚検索やオブジェクト検出などの機能を向上さ... 続きを読む
リコー、モデルマージで“GPT-4レベル”の大規模言語モデル開発 プライベートLLMの開発効率化に貢献
リコーは9月30日、モデルマージ技術によって高性能な日本語大規模言語モデル(LLM)を開発したと発表した。東京工業大学などが開発したLLM「Llama-3-Swallow-70B」をベースにしたAIモデルで、米OpenAIのLLM「GPT-4」と同等の性能を持つとしている。 モデルマージとは、複数の学習済みのLLMモデルを組み合わせて、より性... 続きを読む