タグ テキスト
人気順 5 users 50 users 100 users 500 users 1000 users否定文を理解できないAIたち - ジョイジョイジョイ
BERT や GPT の登場により、テキストを扱うモデルは大きく発展しましたが、否定というごくありふれた操作を扱うのが依然難しいです。 本稿では、その理由と、部分的な解決策を紹介します。 目次 目次 否定文を理解できないAIたち 否定文を理解できずに困ること なぜ否定文をうまく扱えないのか なぜたまに成功するのか ... 続きを読む
Google、画像プロンプトで画像をリミックス生成する「Whisk」
米Googleは12月16日(現地時間)、画像を入力することで画像を生成する新しい生成AIツール「Whisk」を発表した。 米国在住のユーザーは、Google LabsのサイトでWhiskを試すことができる。 Whiskは、テキストではなく画像を使用してプロンプトを作成できるGoogle Labsの実験プロジェクト。Subject(被写体)、Scene(シー... 続きを読む
LPI-Japan、無償教材「Linux標準教科書」の最新版をリリース
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます エルピーアイジャパン(LPI-Japan)は12月16日、無償の「Linux」教材の最新版「Linux標準教科書 バージョン4.0.0」をリリースした。演習を中心に利用者が独学をしやすい構成と... 続きを読む
マークダウンっぽい記法で予定表を書ける「Markwhen」レビュー、VS CodeやObsidian向けの拡張機能もあり
「Markwhen」はマークダウンに似た記法で予定表を作り、タイムライン形式やカレンダー形式で表示できるシステムです。一般的なカレンダーアプリではボタンを1つ1つクリックしながら予定を登録する必要がありますが、Markwhenならテキストをダダダッと打ち込むだけで予定を登録できます。 Markwhen https://markwhen.com/... 続きを読む
[速報]Amazon、自社開発の基盤モデル「Amazon Nova」発表。テキストから画像や動画の生成、マルチモーダルまで対応
Amazon Web Services(AWS)が米ラスベガスで開催中のイベント「AWS re:Invent 2024」で、基調講演にAmazon CEOのアンディ・ジャシー氏が登壇。同社が開発した新しい基盤モデルである「Amazon Nova」を発表しました。 Amazon Novaは複数のモデルから構成されています。 Amazon Nova Micro 低コストかつ小さなレイテンシ... 続きを読む
テキストをコピペするときにスタイルごとコピーされちゃうのってどんな仕組み? - Qiita
概要 文章をコピペしてエクセルに張り付けたときに、画面のスタイルもコピーされてしまって困ったことはありますか?ありますよね! (↓こんな感じ) 私もよくやってしまうのですが、実際にどのような処理が行われているのかよく分かっていませんでした。理解を深めるためにも、自分で実装して謎を解いていきたいと思い... 続きを読む
NTTデータグループがソフト開発の生産性を70%向上させる理由
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます NTTデータグループがAIを活用したビジネス変革に取り組み始めている。その1つがソフトウエア開発分野への生成AIの活用で、プロジェクト管理から要件定義/設計、コーディング/... 続きを読む
国会図書館が古典籍資料からテキスト抽出する軽量OCRツールを公開 ~GPUなしでも動作/「NDL古典籍OCR-Lite」のソースコードとバイナリが「GitHub」で公開
MicrosoftのGraphRAG+Neo4jで簡単にKnowledge Graphを可視化する - Taste of Tech Topics
こんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 LLMが広く使用されるようになってから、RAGに関する研究も増加し、RAGを拡張する手法の研究も多く出ました。 その中でもテキストをグラフデータとして扱いRAGの元データとする手法をGraphRAGと言います。 今回はその中の一つであるMicrosoftが提... 続きを読む
OCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAI『MPLUG-DOCOWL2』登場! - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです!今回は、PDF解析とドキュメントインテリジェンスの最先端技術 「MPLUG-DOCOWL2」 について、解説していきます。このモデルは、高解像度の... 続きを読む
「無限の猿定理」の現実的限界。猿が寿命まで適当にタイプライター叩くと“バナナ”書くだけで超苦労【研究紹介】 レバテックラボ(レバテックLAB)
「無限の猿定理」とは、無限の時間があれば、キーボードをランダムに叩く猿が、シェイクスピアの全作品など、どんな文章でも偶然に打ち出せるという思考実験をいう。有限の長さのテキストにおいて、ランダムな入力でも、無限の時間があれば目的のテキストが必ず出現するという数学的な確率の考え方である。 研究チームは... 続きを読む
AIがクリップボード画像からテキストを抽出して貼り付け ~「PowerToys 0.86」が公開/Microsoft公式のパワーユーザー向けシステムユーティリティ群
ついにCSSだけでwidth: auto;やheight: auto;へのアニメーションができるようになります
CSSだけでwidth: auto;やheight: auto;にアニメーションできたらいいな、と思ったことはありませんか? たとえば、下記のようにテキストの量によってサイズが異なるボタンです。 これまではCSSでアニメーションするときは、固定値(width: 100px;しかアニメーションが機能しませんでしたが、Chrome 129でサポートされたi... 続きを読む
中国でVPNの利用は違法なのか再考する
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 中国には「グレートファイアウォール」(GFW)と呼ばれるインターネットの制限がある。中国国内から「Google」「YouTube」「X」(旧Twitter)などのグローバルサービスにアクセ... 続きを読む
OpenAIの文字起こしAI「Whisper」が幻覚を起こし文章を捏造すると研究者が指摘
OpenAIは文字起こしAIのWhisperを「人間レベルの堅牢性と正確性を持ったツール」と宣伝していますが、これには大きな欠点があると専門家たちが指摘しています。十数人のソフトウェアエンジニア、開発者、学術研究者にインタビューしたというAP通信によると、Whisperは文字起こしにおいて一部のテキストや文章全体を捏造... 続きを読む
SBOMを脆弱性管理に活用する資料--NTTなど14社参加のコンソーシアムが公表
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます NTTなどが参加するセキュリティ・トランスペアレンシー・コンソーシアムは10月21日、ソフトウェア部品表(SBOM)による可視化データを脆弱(ぜいじゃく)性管理に活用するため... 続きを読む
iPhoneが勝手に「留守電を文字起こし」してくれる機能が超便利→「無料で使えるのは嬉しい」「録音内容のテキスト表示が助かる」
ろん@iPhoneマスター @Daisaku_Samon なにコレ見て。iPhoneが勝手に「留守電を文字起こし」してくれた。知らないフリーダイヤルからの着信だったから出なかったんだけど…実は契約している保険会社からだった。録音の内容がテキストで表示されていて驚きよ!無料の機能だから通信キャリアの『 有償サービス』に加入しな... 続きを読む
整理された解説が分かりやすい良書! Notionの便利な使い方がよく分かる -超便利!Notionテクニック
※本ページは、アフィリエイト広告を利用しています。 Notionをなんとなく使ってる、もっと便利に使いこなしたい、使ったことがない、そんな人にお勧めのNotionの便利な使い方がよく分かる解説書を紹介します。 Notionとは簡単に言うと、テキストや画像や動画などさまざまなコンテンツを含めることができるスマホやデスク... 続きを読む
Google、AIメモアプリ「NotebookLM」に音声による概要解説機能
米Googleは9月11日(現地時間)、AI活用メモアプリ「NotebookLM」の新機能「Audio Overview」を発表した。「ドキュメントを魅力的な音声ディスカッションに変える」方法で、まずは英語のみだが、日本でも利用できる。 NotebookLMは、PDFやコピーしたテキスト、URLなどの「ソース」をアップロードするとそれらのソースの... 続きを読む
PythonでPDFからテキスト/表情報の抽出精度を比較してみた - Taste of Tech Topics
はじめに こんにちは。ついにジム通いを始めて四六時中筋肉痛を感じながら過ごしているイワツカです。 最近はLLM(大規模言語モデル)とRAG(検索拡張生成)を用いて企業内ドキュメントを活用する取り組みが多く見受けられます。 ドキュメントは基本PDFで保存されているため、PDFからテキストを抽出して、検索対象にする... 続きを読む
画像なしの新感覚SNS「noplace」 Z世代を魅了 - 日本経済新聞
2024年7月初旬の一般公開と同時に、米国App Store(アップストア)のランキング1位に浮上し、話題となったアプリがある。若者向けSNS(交流サイト)の「noplace(ノープレース)」だ。Instagram(インスタグラム)など既存のアプリと異なるのは、現状で写真や動画が扱えず、テキストのみであるところ。何がユーザーを引... 続きを読む
v0(ブイゼロ)の使い方を徹底解説!始め方や料金、プロンプトも紹介
テキストだけでサイトやアプリを構築できるv0(ブイゼロ)と呼ばれるAIツールが、SNSを中心に話題となっています。 v0では、テキストだけで(ノーコードで)、サイトの見た目(UI:ユーザーインターフェース)やゲーム・アプリを作成できます。 とはいえ、「v0が話題なのは知っているが、どうやって使えばいいのかわから... 続きを読む
名和利男氏が83もの“多種多様な”アイデンティティー(ID)不正取得手法を紹介した理由
名和氏は、従来の講演では、社内ですぐ転用できるよう、分かりやすさに配慮した視覚的なスライド作りを心掛けてきた。本講演では“アイデンティティー”(ID)に関する現状の恐ろしさを鑑み、身近で起きている事象の全体像を整理し、膨大なテキストで網羅的に解説することにしたという。 「アイデンティティー」が狙われる... 続きを読む
星野リゾート代表が説く「経営者が生成AIを上手に活用する方法」とは
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 経営者は生成AIをどう上手に活用していけばよいのか。この疑問に対する回答として、星野リゾート代表による興味深い説明を聞くことができたので、今回はその内容を紹介したい。... 続きを読む
脳の信号をほぼ100%の精度で音声に変換するブレイン・コンピューター・インターフェースが登場
脳の活動をテキストに変換して音声として読み上げることで、これまでで最も正確な97.5%の精度で思考を言葉にすることができるブレイン・コンピューター・インターフェース(BCI)が発表されました。この技術は、全身の筋肉の衰えにより言葉を話すことが難しくなる筋萎縮性側索硬化症(ALS)の人が、コミュニケーション能力... 続きを読む