タグ テキスト
人気順 5 users 10 users 50 users 500 users 1000 users否定文を理解できないAIたち - ジョイジョイジョイ
BERT や GPT の登場により、テキストを扱うモデルは大きく発展しましたが、否定というごくありふれた操作を扱うのが依然難しいです。 本稿では、その理由と、部分的な解決策を紹介します。 目次 目次 否定文を理解できないAIたち 否定文を理解できずに困ること なぜ否定文をうまく扱えないのか なぜたまに成功するのか ... 続きを読む
LPI-Japan、無償教材「Linux標準教科書」の最新版をリリース
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます エルピーアイジャパン(LPI-Japan)は12月16日、無償の「Linux」教材の最新版「Linux標準教科書 バージョン4.0.0」をリリースした。演習を中心に利用者が独学をしやすい構成と... 続きを読む
マークダウンっぽい記法で予定表を書ける「Markwhen」レビュー、VS CodeやObsidian向けの拡張機能もあり
「Markwhen」はマークダウンに似た記法で予定表を作り、タイムライン形式やカレンダー形式で表示できるシステムです。一般的なカレンダーアプリではボタンを1つ1つクリックしながら予定を登録する必要がありますが、Markwhenならテキストをダダダッと打ち込むだけで予定を登録できます。 Markwhen https://markwhen.com/... 続きを読む
テキストをコピペするときにスタイルごとコピーされちゃうのってどんな仕組み? - Qiita
概要 文章をコピペしてエクセルに張り付けたときに、画面のスタイルもコピーされてしまって困ったことはありますか?ありますよね! (↓こんな感じ) 私もよくやってしまうのですが、実際にどのような処理が行われているのかよく分かっていませんでした。理解を深めるためにも、自分で実装して謎を解いていきたいと思い... 続きを読む
OCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAI『MPLUG-DOCOWL2』登場! - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです!今回は、PDF解析とドキュメントインテリジェンスの最先端技術 「MPLUG-DOCOWL2」 について、解説していきます。このモデルは、高解像度の... 続きを読む
v0(ブイゼロ)の使い方を徹底解説!始め方や料金、プロンプトも紹介
テキストだけでサイトやアプリを構築できるv0(ブイゼロ)と呼ばれるAIツールが、SNSを中心に話題となっています。 v0では、テキストだけで(ノーコードで)、サイトの見た目(UI:ユーザーインターフェース)やゲーム・アプリを作成できます。 とはいえ、「v0が話題なのは知っているが、どうやって使えばいいのかわから... 続きを読む
無料で自動文字起こし&テキストで音声編集も可能な「audapolis」を使ってみた
オープンソースで開発される「audapolis」は書き起こし機能を備えたメディアエディターで、音声を自動的にテキストに書き起こすだけでなく、書き起こしたテキストを編集することで同時に音声も編集できるツールで、無料で使うことができます。 GitHub - bugbakery/audapolis: an editor for spoken-word audio with auto... 続きを読む
ChatGPTに.xlsxファイルの中身を読み込ませてデータを処理させる方法
ChatGPTに対して、膨大なプロンプトを入力するのは大変だ。一方、テキストや表組みなど、データがまとまって記載されたファイルを読み込ませれば、そこに記載されたデータに対してChatGPTで分析や編集を行うことができる。本稿では、ChatGPTにファイルを読み込ませる手順について解説していこう。 ChatGPTでファイルを読... 続きを読む
Google検索も不要に? 検索AI「Perplexity」がスゴすぎてちょっと怖い
“AI検索”サービス「Perplexity」(パープレキシティ)がスゴい。 Perplexityは、質問に対してテキストで答えてくれる、チャットbot型生成AIだ。ChatGPTと似ているが、検索に特化しており、「Webの最新情報をベースに検索できる」点が異なる。 例えば、7月4日時点で東京都知事選(7月7日投開票)の最新状況を聞くと、こん... 続きを読む
じゃあなんすか、Noto Sans JP使うんならボタンにアイコン入れるなって事すか|chot Inc. デザイナーユニット
こんにちは、ちょっと株式会社デザイナーのモです。 挨拶から間髪入れずで申し訳ないのですが、まずはこちらをご覧ください。 何の変哲もないテキストとアイコンで構成されたボタンです。 今回はこちらのボタンに物申したく筆を執らせていただきました。思うところがあるんだよ今の私には。 ずれている、Noto Sans JPと... 続きを読む
GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」っ... 続きを読む
革命レベルの動画生成AI「Kling」 ついに「Sora」対抗が出てきた
中国のSNS「快手(Kuaishou)」は、テキストから最大2分間の動画を生成できる動画生成モデル「可灵(Kling)」を開発。多数のサンプル動画を掲載するデモサイトを公開した。 テキストから最大2分間のフルHD動画を生成 A Chinese AI video generator just dropped before we got access to Sora Can generate 2-minute vi... 続きを読む
UIデザインで中央配置がずれてしまう理由と解決方法
UIデザインには、至る所に中央揃えが使用されます。 しかし、アイコンとテキストが美しく揃わない、テキストがボタンの中央からずれている、そんなことはありませんか? UIデザインで中央配置がずれてしまうときの理由、実装時にデベロッパーができること、デザイナーができること、数字的そして視覚的な調整方法などを... 続きを読む
「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 G... 続きを読む
GPT-4o の概要|npaka
以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわず... 続きを読む
画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」
画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや... 続きを読む
表記揺れ検出ツール「テキストゆれないくん」 - inzkyk.xyz
その他のサンプル: Wikipedia:良質な記事, Wikipedia:長いページ 紹介 「テキストゆれないくん」は文章に含まれる表記揺れを検出するツールです。「コンピュータ」と「コンピューター」、あるいは「全て」と「すべて」といった同じ単語の別表記が使われていないかどうかをチェックできます。 「テキストゆれないくん」は... 続きを読む
読んで学べる論理学を探しているひとへ――古典命題論理から様相命題論理まで - sho__yamaguchi’s blog
論理学を基礎から〈テキストを読むこと〉だけで独習しようとするひと――こうしたひとにとって役立つかもしれない講義テキストを置いておく。これは某大学で私が担当している論理学の講義のテキストであり、その授業では安井邦夫『現代論理学』(世界思想社、1991年(新装版2021年))も教科書に指定されている。ただし、... 続きを読む
アイドルオタクが推しのパロディAV発売に抗議して販売中止させるまで|山山
はじめに このnoteは、ひとりのアイドルオタク(わたし)が推しの元女性アイドルのパロディAV発売をTwitter(現X)で問題提起し、ファンコミュニティの内外に関連各所への抗議を呼びかけて販売中止に追い込むまでの顛末をまとめたテキストです。経緯だけではなく、応用が効くように今回抗議を成功させることができた原因... 続きを読む
IPAの登氏に聞く、「分散型クラウド基盤ソフトを作れるクラウド人材育成」
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 「日本にもチャンスがある」。VPNソフトなどを開発してきた情報処理推進機構(IPA) 産業サイバーセキュリティセンター サイバー技術研究室 室長の登大遊氏は、分散型クラウド... 続きを読む
GPT-4に日本語特化モデル OpenAI Japan始動会見で発表
米OpenAIは4月15日、大規模言語モデル「GPT-4」について、日本語に最適化したカスタムモデルを発表した。日本語のテキストを記述する能力が向上しており、「GPT-4 Turbo」より最大3倍高速とうたっている。今後数カ月以内にAPIをリリースするという。 関連記事 OpenAI、“怠けにくい”「GPT-4 Turbo」プレビューリリースや... 続きを読む
岸田総理の演説、アメリカ人に良い意味でぶっ刺さり大激論を引き起こす「西洋の友人としてこれほどの人物はいない」「こういう言い方なら一緒に働こうと思えるよ」
リンク 首相官邸ホームページ 令和6年4月11日 米国連邦議会上下両院合同会議における岸田内閣総理大臣演説 | 総理の演説・記者会見など | 首相官邸ホームページ 総理の演説や記者会見などを、ノーカットの動画やテキストでご覧になれます。 5 users 25 剣kenn @hskenncutter 東京都町田市民/酔いどれ防災士/第一種衛生管... 続きを読む
CSSでボタンを実装するときに記述しておくと便利なスタイルのまとめ
Webサイトやスマホアプリの実装に、ボタンは欠かせない要素の一つです。そんなボタンの実装に設定しておくと便利なCSSのスタイルを紹介します。 スマホでボタンをタップした際にズームなどの誤動作が起きないようにするCSS、ボタンのテキストが選択されてハイライトにならないようにするCSS、フォーカス時のアウトライン... 続きを読む
Stability AI、無料で起承転結のある最大3分の音楽を生成可能な「Stable Audio 2.0」を公開/テキストだけでなくアップロードしたオーディオから音楽を生成可能に
生成 AI で僕らのプログラミング勉強はどうなるのか? - Qiita
生成 AI の登場によって、僕らはプログラムを書く時代が終わりに近づいている?! 2023 年に OpenAI 社が発表した ChatGPT は、特に僕ら IT エンジニアにとって衝撃な発表だったのではと思います。 今まで、ググったり、参考書をもとに実装したり、GitHub などからコードを参考にして実装していたものが、「テキストだけ... 続きを読む