タグ 基盤モデル
人気順 10 users 50 users 100 users 500 users 1000 users基盤モデルなどを使いながら、文章をOCRするメモ (暫定)|Kan Hatakeyama
書籍には、不規則に図表などが入っていたりすることがあります。 また、レイアウトが乱れたりすることもよくあります。 このあたりの整理をいい感じにしてくれるシステムを見つけるのが、今回のミッションです。 結果結果一覧です。 いまのところ、「OCRソフトでの文字認識 + GPT-4oでの修正」がベストでした。 次点として、「OCR... 続きを読む
生成AI入門。AWS社員が解説するAmazon Bedrock詳細ハンズオン - Findy Tools
公開日 2024/09/05更新日 2024/09/04生成AI入門。AWS社員が解説するAmazon Bedrock詳細ハンズオン こんにちは。 今回は、アマゾンウェブサービスジャパンの菅原と北村が、Amazon Bedrockを用いたハンズオンを紹介させていただきます。 はじめにAmazon Bedrockは、業界をリードする種々の基盤モデル(Foundation Model・F... 続きを読む
米Appleの独自AI「Apple Intelligence」の技術詳細 基盤モデルや学習データなどを解説
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 米Appleは、年次開発者会議「Worldwide Developers Conference 2024」(WWDC24)... 続きを読む
LLMエージェントの設計16パターン | AIDB
LLMエージェントの設計は課題が多い上に分類が整理されていません。なお課題としてはハルシネーション(誤った情報の生成)の存在や推論の道筋が不明瞭な点などが挙げられています。 今回研究者らは、基盤モデルを使ったエージェントの設計パターン16種類をまとめました。例えば、エージェントが目標をどうやって設定す... 続きを読む
世界初、AIモデルの再学習コストを大幅に削減可能な過去の学習過程を再利用する「学習転移」を実現~NTT版LLM「tsuzumi」など基盤モデルの更新・差し替えを容易に~ | ニュースリリース | NTT
◆深層学習において、過去の学習過程をモデル間で再利用する全く新たな仕組みとして「学習転移」技術を実現しました。 ◆本技術は、深層学習におけるパラメータ空間の高い対称性を活用し、実際に学習することなく低コストな変換により数秒~数分程度で一定の精度を実現できるため、モデルの再学習コストを抜本的に削減でき... 続きを読む
言語モデルを高位合成でFPGAに実装してみた
言語モデルを高位合成でFPGAに実装してみた Turing株式会社のリサーチチームでインターンしているM1の内山です。 Turing株式会社では大規模基盤モデルによる完全自動運転を目指しており、その実現に欠かせない技術として大規模言語モデルの研究開発を行っています。 Generative AI LLMの広範な知識と思考能力に加え、視... 続きを読む
GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場
AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。 Inflection-2.5: meet the world's best personal AI https://inflection.ai/inflection-2-5 PiはAndro... 続きを読む
【独自】“国産・生成AI”開発 政府が7者採択 Googleが支援(テレ東BIZ) - Yahoo!ニュース
政府は、国産の生成AIの開発力を強化するため、基盤モデルを開発する国内7者を採択し支援する方針を固めたことが、テレビ東京の取材でわかった。採択されるのは、ABEJA、Preferred Elements、ストックマーク、Sakana AI、Turingの国内スタートアップ企業と、情報・システム研究機構、東京大学の7者。経済産業省が所管す... 続きを読む
[プレビュー]Amazon Lexでは、ノーコードで簡単に、RAGのチャットボットを構築できるようになりました #AWSreInvent | DevelopersIO
[プレビュー]Amazon Lexでは、ノーコードで簡単に、RAGのチャットボットを構築できるようになりました #AWSreInvent はじめに Amazon Lexでは、ノーコードで簡単にRAGのチャットボットを構築できるスロットタイプAMAZON.QnAIntentがプレビューで提供されました。 AMAZON.QnAIntentを利用することで、基盤モデルを企業デ... 続きを読む
[速報]AWS、大規模言語モデルのトレーニングに最適化した独自プロセッサ「AWS Trainium2」発表。前モデルより最大4倍のトレーニング性能。AWS re:Invent 2023
Amazon Web Services(AWS)は、ラスベガスで開催中のイベント「AWS re:Invent 2023」の基調講演で、AIのトレーニングに最適化した独自プロセッサ「AWS Trainium2」を発表しました。 Trainium2は、最大数兆個のパラメータを持つ基盤モデルおよび大規模言語モデルのトレーニング用に設計されています。 2020年に発表され... 続きを読む
GPT-4やLlama 2の透明性をスタンフォード大HAIが評価 トップはMetaでOpenAIは3位
スタンフォード大学HAIは、AI基盤モデルの透明性評価システム「FMTI」と、このシステムで評価したOpenAIやMetaなど10社の透明性ランキングを発表した。 米スタンフォード大学Human-Centered AI Institute(HAI)は10月18日(現地時間)、AIの基盤モデルを公開している10社の透明性を評価するスコアリングシステム「Found... 続きを読む
AWS、API経由で生成AIを利用する「Amazon Bedrock」正式リリース。コード生成AIのCodeWhispererのカスタマイズも可能に
AWS、API経由で生成AIを利用する「Amazon Bedrock」正式リリース。コード生成AIのCodeWhispererのカスタマイズも可能に Amazon Web Services(AWS)は、API経由で生成AIなどの基盤モデルが提供される新サービス「Amazon Bedrock」の正式リリースを発表しました。 生成AIなどを実現する基盤モデルをマネージドサービスと... 続きを読む
Amazon Bedrock が一般利用可能に – 基盤モデルを利用した生成系 AI アプリケーションの構築とスケール | Amazon Web Services
Amazon Web Services ブログ Amazon Bedrock が一般利用可能に – 基盤モデルを利用した生成系 AI アプリケーションの構築とスケール 本日、Amazon Bedrockが一般提供を開始したことをお知らせします。また、MetaのLlama 2 13B および 70B パラメータのモデルが、近日中に Amazon Bedrock で利用可能になることもお伝えし... 続きを読む
AWS上で生成AIを使用するためのツール「Amazon Bedrock」が正式リリースへ、日本語を話せるClaudeや画像生成のStable Diffusionを利用可能
2023年4月にアナウンスされていた生成AIをAWSで使えるようにするツール「Amazon Bedrock」が2023年9月28日に正式リリースされ、一般ユーザーへの提供が開始されました。 基盤モデル API サービス – Amazon Bedrock – AWS https://aws.amazon.com/jp/bedrock/ Amazon Bedrock Is Now Generally Available – Build and Sca... 続きを読む
Amazon Bedrock "Claude 2" と、ChatGPT "GPT-4" を比較してみる - Qiita
Amazon Bedrock "Claude 2" と、ChatGPT "GPT-4" を比較してみるAWSAIChatGPTGenerativeAIAmazonBedrock Amazon Bedrockとは? 2023/9/28にAWSが生成系AIのサービス「Amazon Bedrock」を正式リリース (GA) しました。 「Amazon Bedrock」は、様々な企業の基盤モデル(FM)を1つのAPIで利用できるようにするサービスです。 ... 続きを読む
Google、コード生成や補完のAIモデル「Codey」が日本語での指示や説明に対応したと発表
Googleは、都内で開催したイベント「Generative AI Summit Tokyo」で、コード生成や補完のためのAIモデル「Codey」が日本語に対応したと発表しました。 CodeyはGoogleの最新の大規模言語モデルPaLM 2をベースとした、コード生成や補完のための基盤モデルです。 Codeyは、自然言語による指示に基づいてコードを生成する機... 続きを読む
東京大学大学院経済学研究科 「ICTと産業」基盤モデルと産業
社会変化兆候調査 vol.13 / 156 global changes in lifestyle 2023 vol.13 続きを読む
基盤モデルを使ったTuringの完全自動運転戦略
基盤モデルが自動運転車を操ってる筆者のイメージ created by DALL-E Turingで機械学習チームでエンジニアをしている井ノ上です。(Twitter: いのいち) Turingは2030年までにあらゆる場所で自動走行が可能で、ハンドルが必要ない完全自動運転システム(Level 5自動運転)の開発を目指して様々な技術の調査や検証を行って... 続きを読む
自然言語処理技術の研究・開発の裏話。日本語の基盤モデルを搭載したHyperCLOVAの大規模化と応用可能性
自然言語処理技術の研究・開発の裏話。日本語の基盤モデルを搭載したHyperCLOVAの大規模化と応用可能性 LINE株式会社およびヤフー株式会社は、2022年11月17日・18日の2日間にわたり、技術カンファレンス「Tech-Verse 2022」をオンライン(ライブストリーミング形式)にて開催しました。特別連載企画「Tech-Verse 2022 ... 続きを読む
[WebUI] Stable DiffusionベースモデルのCLIPの重みを良いやつに変更する
簡単な記事なので前置きは省略します。 CLIPについて Stable Diffusionベースのモデルは、画像生成に際してテキストで条件づけを行う(a.k.a. txt2img)場合、CLIPという基盤モデルでテキストをベクトルに変換し、生成処理に渡しています。 つまり、入力したテキストをいかに的確に生成処理のモデルに伝えられるのかはCL... 続きを読む
AI開発の新たなパラダイム「基盤モデル」とは
さて、視覚・言語を扱う基盤モデルとしては、2021年のCLIPがブレイクスルーでした。CLIPはテキストと画像を同じ特徴空間に写像する2つのエンコーダからなります。CLIPを使うと、次のようにして任意の画像分類問題を追加の学習なしで解くことができます。まず、各候補クラスを文章の形式(例:「犬の写真」)にした後、テ... 続きを読む