タグ テキスト
人気順 10 users 50 users 100 users 500 users 1000 usersAIツールの次のレベル「AIエージェント」とは何なのか専門家が解説
近年急速に発達しているAIの分野として、自然な会話や文章の生成ができるChatGPTのようなチャットボットや、テキストを入力するだけで高度な画像やイラストを生成できる画像生成AIを思い浮かべる人は多いはず。そんな中、OpenAIやGoogleなどの大手テクノロジー企業は、AIのさらなる発展の波として「AIエージェント」の計... 続きを読む
否定文を理解できないAIたち - ジョイジョイジョイ
BERT や GPT の登場により、テキストを扱うモデルは大きく発展しましたが、否定というごくありふれた操作を扱うのが依然難しいです。 本稿では、その理由と、部分的な解決策を紹介します。 目次 目次 否定文を理解できないAIたち 否定文を理解できずに困ること なぜ否定文をうまく扱えないのか なぜたまに成功するのか ... 続きを読む
Google、画像プロンプトで画像をリミックス生成する「Whisk」
米Googleは12月16日(現地時間)、画像を入力することで画像を生成する新しい生成AIツール「Whisk」を発表した。 米国在住のユーザーは、Google LabsのサイトでWhiskを試すことができる。 Whiskは、テキストではなく画像を使用してプロンプトを作成できるGoogle Labsの実験プロジェクト。Subject(被写体)、Scene(シー... 続きを読む
LPI-Japan、無償教材「Linux標準教科書」の最新版をリリース
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます エルピーアイジャパン(LPI-Japan)は12月16日、無償の「Linux」教材の最新版「Linux標準教科書 バージョン4.0.0」をリリースした。演習を中心に利用者が独学をしやすい構成と... 続きを読む
マークダウンっぽい記法で予定表を書ける「Markwhen」レビュー、VS CodeやObsidian向けの拡張機能もあり
「Markwhen」はマークダウンに似た記法で予定表を作り、タイムライン形式やカレンダー形式で表示できるシステムです。一般的なカレンダーアプリではボタンを1つ1つクリックしながら予定を登録する必要がありますが、Markwhenならテキストをダダダッと打ち込むだけで予定を登録できます。 Markwhen https://markwhen.com/... 続きを読む
[速報]Amazon、自社開発の基盤モデル「Amazon Nova」発表。テキストから画像や動画の生成、マルチモーダルまで対応
Amazon Web Services(AWS)が米ラスベガスで開催中のイベント「AWS re:Invent 2024」で、基調講演にAmazon CEOのアンディ・ジャシー氏が登壇。同社が開発した新しい基盤モデルである「Amazon Nova」を発表しました。 Amazon Novaは複数のモデルから構成されています。 Amazon Nova Micro 低コストかつ小さなレイテンシ... 続きを読む
テキストをコピペするときにスタイルごとコピーされちゃうのってどんな仕組み? - Qiita
概要 文章をコピペしてエクセルに張り付けたときに、画面のスタイルもコピーされてしまって困ったことはありますか?ありますよね! (↓こんな感じ) 私もよくやってしまうのですが、実際にどのような処理が行われているのかよく分かっていませんでした。理解を深めるためにも、自分で実装して謎を解いていきたいと思い... 続きを読む
NTTデータグループがソフト開発の生産性を70%向上させる理由
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます NTTデータグループがAIを活用したビジネス変革に取り組み始めている。その1つがソフトウエア開発分野への生成AIの活用で、プロジェクト管理から要件定義/設計、コーディング/... 続きを読む
国会図書館が古典籍資料からテキスト抽出する軽量OCRツールを公開 ~GPUなしでも動作/「NDL古典籍OCR-Lite」のソースコードとバイナリが「GitHub」で公開
LLMとコンピュータビジョンでブラウザベースのワークフローを自動化できる「Skyvern」を使ってみた、コードと違ってウェブサイトが変わる度に書き直す必要無し
SkyvernはテキストでAIに指示することでブラウザを使用するワークフローを自動化してくれるツールです。コードで自動化する場合と異なり、多少ウェブサイトの構造が変わっても問題なく対応可能なのが特徴です。有料のサービスであるものの、記事作成時点ではアカウントを作成すると5ドル(約770円)分のクレジットが付与さ... 続きを読む
MicrosoftのGraphRAG+Neo4jで簡単にKnowledge Graphを可視化する - Taste of Tech Topics
こんにちは。データサイエンティストチームYAMALEXのSsk1029Takashiです。 LLMが広く使用されるようになってから、RAGに関する研究も増加し、RAGを拡張する手法の研究も多く出ました。 その中でもテキストをグラフデータとして扱いRAGの元データとする手法をGraphRAGと言います。 今回はその中の一つであるMicrosoftが提... 続きを読む
OCRはもう不要?視覚的特徴とテキストを高精度に捉える!次世代マルチモーダルAI『MPLUG-DOCOWL2』登場! - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 株式会社ulusageの技術ブログ生成AIです!今回は、PDF解析とドキュメントインテリジェンスの最先端技術 「MPLUG-DOCOWL2」 について、解説していきます。このモデルは、高解像度の... 続きを読む
ChatGPTがmacOSアプリと連携可能に、XcodeやVS Codeなどの開発者ツールとの連携が追加
OpenAIはチャットAI「ChatGPT」のアプリ版をWindows向け、macOS向けに配信しています。2024年11月14日にOpenAIがリリースしたmacOS版ChatGPTアプリのアップデートでは、XcodeやVisual Studio Code(VS Code)などのコーディングアプリ内のテキストをChatGPTが自動で読み取る機能が追加されています。 ChatGPT ???? VS Code... 続きを読む
「無限の猿定理」の現実的限界。猿が寿命まで適当にタイプライター叩くと“バナナ”書くだけで超苦労【研究紹介】 レバテックラボ(レバテックLAB)
「無限の猿定理」とは、無限の時間があれば、キーボードをランダムに叩く猿が、シェイクスピアの全作品など、どんな文章でも偶然に打ち出せるという思考実験をいう。有限の長さのテキストにおいて、ランダムな入力でも、無限の時間があれば目的のテキストが必ず出現するという数学的な確率の考え方である。 研究チームは... 続きを読む
AIがクリップボード画像からテキストを抽出して貼り付け ~「PowerToys 0.86」が公開/Microsoft公式のパワーユーザー向けシステムユーティリティ群
テキスト→ファイル化が一瞬で完了!Claudeでフライト情報をカレンダーに書き込んでみた | ライフハッカー・ジャパン
Claudeを使ってカレンダーにフライト情報を整理してみたら、めちゃくちゃ便利だった。 続きを読む
ついにCSSだけでwidth: auto;やheight: auto;へのアニメーションができるようになります
CSSだけでwidth: auto;やheight: auto;にアニメーションできたらいいな、と思ったことはありませんか? たとえば、下記のようにテキストの量によってサイズが異なるボタンです。 これまではCSSでアニメーションするときは、固定値(width: 100px;しかアニメーションが機能しませんでしたが、Chrome 129でサポートされたi... 続きを読む
中国でVPNの利用は違法なのか再考する
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 中国には「グレートファイアウォール」(GFW)と呼ばれるインターネットの制限がある。中国国内から「Google」「YouTube」「X」(旧Twitter)などのグローバルサービスにアクセ... 続きを読む
OpenAIの文字起こしAI「Whisper」が幻覚を起こし文章を捏造すると研究者が指摘
OpenAIは文字起こしAIのWhisperを「人間レベルの堅牢性と正確性を持ったツール」と宣伝していますが、これには大きな欠点があると専門家たちが指摘しています。十数人のソフトウェアエンジニア、開発者、学術研究者にインタビューしたというAP通信によると、Whisperは文字起こしにおいて一部のテキストや文章全体を捏造... 続きを読む
「本当に使える生成AI」サービス26選!テキスト、画像、動画、デザイン、音楽…目的別に厳選
生成AI 大進化 生成AIブームに火を付けた「ChatGPT」の登場から約2年。技術進化は止まらず、最新モデルの実力は人間の博士号レベルを超えたと報告された。ソフトウエアやアプリに組み込まれ、実用的な存在になりつつある生成AIの市場は、2027年には1200億ドル規模と急成長が見込まれる。社会を変革する生成AIの覇権争い... 続きを読む
SBOMを脆弱性管理に活用する資料--NTTなど14社参加のコンソーシアムが公表
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます NTTなどが参加するセキュリティ・トランスペアレンシー・コンソーシアムは10月21日、ソフトウェア部品表(SBOM)による可視化データを脆弱(ぜいじゃく)性管理に活用するため... 続きを読む
iPhoneが勝手に「留守電を文字起こし」してくれる機能が超便利→「無料で使えるのは嬉しい」「録音内容のテキスト表示が助かる」
ろん@iPhoneマスター @Daisaku_Samon なにコレ見て。iPhoneが勝手に「留守電を文字起こし」してくれた。知らないフリーダイヤルからの着信だったから出なかったんだけど…実は契約している保険会社からだった。録音の内容がテキストで表示されていて驚きよ!無料の機能だから通信キャリアの『 有償サービス』に加入しな... 続きを読む
整理された解説が分かりやすい良書! Notionの便利な使い方がよく分かる -超便利!Notionテクニック
※本ページは、アフィリエイト広告を利用しています。 Notionをなんとなく使ってる、もっと便利に使いこなしたい、使ったことがない、そんな人にお勧めのNotionの便利な使い方がよく分かる解説書を紹介します。 Notionとは簡単に言うと、テキストや画像や動画などさまざまなコンテンツを含めることができるスマホやデスク... 続きを読む
「AIアナ」がニュース読む 地方局の人手不足対策に NECと琉球朝日放送
NECと琉球朝日放送は、AIアナウンサーを活用した番組制作の取り組みを始める。 放送原稿を基にアナウンス映像を自動的に制作するシステムを構築。2025年1月ごろから、琉球朝日放送が地上波とネットで配信で活用する予定だ。 AIアナウンサーは、米DeepBrain AIのAIアバターソリューションを活用。 入力されたテキストを基... 続きを読む
OpenAI の Realtime API の使い方|npaka
以下の記事が面白かったので、簡単にまとめました。 ・Realtime API 1. Realtime API「Realtime API」は、低遅延のマルチモーダル会話エクスペリエンスを構築できるAPIです。現在、入力と出力の両方でテキストと音声がサポートされており、「Function Calling」もサポートされています。 特徴は次のとおりです。 ・ネイ... 続きを読む