タグ テキスト
人気順 5 users 10 users 100 users 500 users 1000 users否定文を理解できないAIたち - ジョイジョイジョイ
BERT や GPT の登場により、テキストを扱うモデルは大きく発展しましたが、否定というごくありふれた操作を扱うのが依然難しいです。 本稿では、その理由と、部分的な解決策を紹介します。 目次 目次 否定文を理解できないAIたち 否定文を理解できずに困ること なぜ否定文をうまく扱えないのか なぜたまに成功するのか ... 続きを読む
LPI-Japan、無償教材「Linux標準教科書」の最新版をリリース
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます エルピーアイジャパン(LPI-Japan)は12月16日、無償の「Linux」教材の最新版「Linux標準教科書 バージョン4.0.0」をリリースした。演習を中心に利用者が独学をしやすい構成と... 続きを読む
マークダウンっぽい記法で予定表を書ける「Markwhen」レビュー、VS CodeやObsidian向けの拡張機能もあり
「Markwhen」はマークダウンに似た記法で予定表を作り、タイムライン形式やカレンダー形式で表示できるシステムです。一般的なカレンダーアプリではボタンを1つ1つクリックしながら予定を登録する必要がありますが、Markwhenならテキストをダダダッと打ち込むだけで予定を登録できます。 Markwhen https://markwhen.com/... 続きを読む
テキストをコピペするときにスタイルごとコピーされちゃうのってどんな仕組み? - Qiita
概要 文章をコピペしてエクセルに張り付けたときに、画面のスタイルもコピーされてしまって困ったことはありますか?ありますよね! (↓こんな感じ) 私もよくやってしまうのですが、実際にどのような処理が行われているのかよく分かっていませんでした。理解を深めるためにも、自分で実装して謎を解いていきたいと思い... 続きを読む
国会図書館が古典籍資料からテキスト抽出する軽量OCRツールを公開 ~GPUなしでも動作/「NDL古典籍OCR-Lite」のソースコードとバイナリが「GitHub」で公開
OCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAI『MPLUG-DOCOWL2』登場! - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです!今回は、PDF解析とドキュメントインテリジェンスの最先端技術 「MPLUG-DOCOWL2」 について、解説していきます。このモデルは、高解像度の... 続きを読む
「無限の猿定理」の現実的限界。猿が寿命まで適当にタイプライター叩くと“バナナ”書くだけで超苦労【研究紹介】 レバテックラボ(レバテックLAB)
「無限の猿定理」とは、無限の時間があれば、キーボードをランダムに叩く猿が、シェイクスピアの全作品など、どんな文章でも偶然に打ち出せるという思考実験をいう。有限の長さのテキストにおいて、ランダムな入力でも、無限の時間があれば目的のテキストが必ず出現するという数学的な確率の考え方である。 研究チームは... 続きを読む
v0(ブイゼロ)の使い方を徹底解説!始め方や料金、プロンプトも紹介
テキストだけでサイトやアプリを構築できるv0(ブイゼロ)と呼ばれるAIツールが、SNSを中心に話題となっています。 v0では、テキストだけで(ノーコードで)、サイトの見た目(UI:ユーザーインターフェース)やゲーム・アプリを作成できます。 とはいえ、「v0が話題なのは知っているが、どうやって使えばいいのかわから... 続きを読む
無料で自動文字起こし&テキストで音声編集も可能な「audapolis」を使ってみた
オープンソースで開発される「audapolis」は書き起こし機能を備えたメディアエディターで、音声を自動的にテキストに書き起こすだけでなく、書き起こしたテキストを編集することで同時に音声も編集できるツールで、無料で使うことができます。 GitHub - bugbakery/audapolis: an editor for spoken-word audio with auto... 続きを読む
ChatGPTに.xlsxファイルの中身を読み込ませてデータを処理させる方法
ChatGPTに対して、膨大なプロンプトを入力するのは大変だ。一方、テキストや表組みなど、データがまとまって記載されたファイルを読み込ませれば、そこに記載されたデータに対してChatGPTで分析や編集を行うことができる。本稿では、ChatGPTにファイルを読み込ませる手順について解説していこう。 ChatGPTでファイルを読... 続きを読む
日本語におけるtext-wrapプロパティの運用
CSSのtext-wrapプロパティを使うと、テキストの行の折り返し方を変更できる。text-wrap: balanceを適用すると、適用しない場合と比べて次のように変化する。 CSS text-wrap: balance | CSS and UI | Chrome for Developers text-wrap: balanceが適用された下の例では、すべての行の長さが均等になるように制御されて... 続きを読む
Google検索も不要に? 検索AI「Perplexity」がスゴすぎてちょっと怖い
“AI検索”サービス「Perplexity」(パープレキシティ)がスゴい。 Perplexityは、質問に対してテキストで答えてくれる、チャットbot型生成AIだ。ChatGPTと似ているが、検索に特化しており、「Webの最新情報をベースに検索できる」点が異なる。 例えば、7月4日時点で東京都知事選(7月7日投開票)の最新状況を聞くと、こん... 続きを読む
じゃあなんすか、Noto Sans JP使うんならボタンにアイコン入れるなって事すか|chot Inc. デザイナーユニット
こんにちは、ちょっと株式会社デザイナーのモです。 挨拶から間髪入れずで申し訳ないのですが、まずはこちらをご覧ください。 何の変哲もないテキストとアイコンで構成されたボタンです。 今回はこちらのボタンに物申したく筆を執らせていただきました。思うところがあるんだよ今の私には。 ずれている、Noto Sans JPと... 続きを読む
AIで簡単に実装コードを生成できる! テキストからCSSアニメーションのコードを生成できるツール -AI CSS Animations
簡単にCSSアニメーションのコードを生成できるAIツールが登場しました。テキストや音声でプロンプトを入力するだけで、複雑なCSSアニメーションでも数秒でコードが生成されます。 生成されたCSSアニメーションはその場ですぐ...記事の続きを読む 続きを読む
GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」っ... 続きを読む
革命レベルの動画生成AI「Kling」 ついに「Sora」対抗が出てきた
中国のSNS「快手(Kuaishou)」は、テキストから最大2分間の動画を生成できる動画生成モデル「可灵(Kling)」を開発。多数のサンプル動画を掲載するデモサイトを公開した。 テキストから最大2分間のフルHD動画を生成 A Chinese AI video generator just dropped before we got access to Sora Can generate 2-minute vi... 続きを読む
AIの健全な成長見守る「PTAI」発足 「俗悪コンテンツ」順位公表も
生成AIの健全な成長を促すための団体「全国PTAI(Parent-Teacher of AI)」が7日、発足した。AIに学習させたくないテキストや動画などのデータを「俗悪コンテンツ」として毎年発表するほか、「有害コンテンツ」の追放運動などを積極的に行うとしている。 生成AIはインターネット上に存在... 続きを読む
UIデザインで中央配置がずれてしまう理由と解決方法
UIデザインには、至る所に中央揃えが使用されます。 しかし、アイコンとテキストが美しく揃わない、テキストがボタンの中央からずれている、そんなことはありませんか? UIデザインで中央配置がずれてしまうときの理由、実装時にデベロッパーができること、デザイナーができること、数字的そして視覚的な調整方法などを... 続きを読む
「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 G... 続きを読む
GPT-4o の概要|npaka
以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわず... 続きを読む
画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや... 続きを読む
表記揺れ検出ツール「テキストゆれないくん」 - inzkyk.xyz
その他のサンプル: Wikipedia:良質な記事, Wikipedia:長いページ 紹介 「テキストゆれないくん」は文章に含まれる表記揺れを検出するツールです。「コンピュータ」と「コンピューター」、あるいは「全て」と「すべて」といった同じ単語の別表記が使われていないかどうかをチェックできます。 「テキストゆれないくん」は... 続きを読む
読んで学べる論理学を探しているひとへ――古典命題論理から様相命題論理まで - sho__yamaguchi’s blog
論理学を基礎から〈テキストを読むこと〉だけで独習しようとするひと――こうしたひとにとって役立つかもしれない講義テキストを置いておく。これは某大学で私が担当している論理学の講義のテキストであり、その授業では安井邦夫『現代論理学』(世界思想社、1991年(新装版2021年))も教科書に指定されている。ただし、... 続きを読む
アイドルオタクが推しのパロディAV発売に抗議して販売中止させるまで|山山
はじめに このnoteは、ひとりのアイドルオタク(わたし)が推しの元女性アイドルのパロディAV発売をTwitter(現X)で問題提起し、ファンコミュニティの内外に関連各所への抗議を呼びかけて販売中止に追い込むまでの顛末をまとめたテキストです。経緯だけではなく、応用が効くように今回抗議を成功させることができた原因... 続きを読む
IPAの登氏に聞く、「分散型クラウド基盤ソフトを作れるクラウド人材育成」
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 「日本にもチャンスがある」。VPNソフトなどを開発してきた情報処理推進機構(IPA) 産業サイバーセキュリティセンター サイバー技術研究室 室長の登大遊氏は、分散型クラウド... 続きを読む