タグ Kan Hatakeyama
人気順 5 users 50 users 100 users 500 users 1000 users(1 - 3 / 3件)
基盤モデルなどを使いながら、文章をOCRするメモ (暫定)|Kan Hatakeyama
書籍には、不規則に図表などが入っていたりすることがあります。 また、レイアウトが乱れたりすることもよくあります。 このあたりの整理をいい感じにしてくれるシステムを見つけるのが、今回のミッションです。 結果結果一覧です。 いまのところ、「OCRソフトでの文字認識 + GPT-4oでの修正」がベストでした。 次点として、「OCR... 続きを読む
大規模言語モデルをフルスクラッチする練習 (環境構築ー事前学習まで)|Kan Hatakeyama
はじめに以下のオープンなプロジェクトの一環で、大規模言語モデルをフルスクラッチで作る練習をします。24年3月現在、協力者も募集中です。 リポジトリ当該プロジェクトの標準コードが公開※されたので、それを走らせてみます。 ※24/3/5時点で、まだレポジトリ内に、工事中の箇所が多々、あります。 このリポ上では、事前学習ー事後... 続きを読む
英語の学術論文をChatGPT-4で執筆する際の手順メモ|Kan Hatakeyama
はじめに英語の論文をGPT4に執筆させた際の手順を記します。 普段からChatGPTを使っている人にとっては、当たり前のやり取りしかしていないのですが、意外と使えていない方がnon-AI分野では多いので、丁寧にプロンプトを示していきます。 (ワークショップで解説する必要が出てきたので、そのためのメモ書きです) GPT-4に論文は... 続きを読む
(1 - 3 / 3件)