タグ 本文部分
人気順 5 users 50 users 100 users 500 users 1000 users「第2回Webスクレイピング勉強会@東京」に参加&発表してきました - プログラマになりたい
2014-08-20 「第2回Webスクレイピング勉強会@東京」に参加&発表してきました 前回に引き続き、第2回Webスクレイピング勉強会@東京に参加し、発表もしてきました。今回は、ブログやサイトから本文部分をどうやって抽出するのかというテーマです。ブログの本文抽出とは、ヘッダーやフッダー、サイドメニューなど情報として不要な部分を排除して、本文部分だけを抜き出す手法です。HTMLのタグを解析するル... 続きを読む
Googleリーダーの表示をこれ以上ないほどシンプルにするGoogle Chrome拡張『Google Reader Readable』 | Macの手書き説明書
インストールすると余計な部分が一切なくなり、本文部分のみが際立つGoogle Chrome拡張です。「https://www.google.co.jp/reader/view/」にアクセスしても機能しませんので「https://www.google.com/reader/view/」にアクセスしてください。ダウンロードする 続きを読む
(開発者様向け) JavaScript での本文抽出ライブラリ extract-content-javascript を公開しました - はてなブックマーク日記 - 機能変更、お知らせなど
本日、はてなブックマーク Firefox 拡張内部で利用*1している JavaScript の本文抽出ライブラリ、extract-content-javascript を公開しました。 http://github.com/hatena/extract-content-javascript/ このライブラリを利用することで、JavaScript から本文部分を抽出することが可能になります。 ブックマ... 続きを読む