はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ クロール

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 25 / 73件)

【令和最新版】令和のWebスクレイピング(クロール)【ベストプラクティス】

2024/07/31 このエントリーをはてなブックマークに追加 505 users Instapaper Pocket Tweet Facebook Share Evernote Clip 知見 二宮 ベストプラクティス Webスクレイピング コード

こんにちは、株式会社FP16で結構コードを書いている二宮です。 最近Webスクレイピングのコードを色々な方法で書いているので、そこで得た知見をここに残しておこうと思います。 ほぼ毎日なにかのWebスクレイピングコードを書いています。 Webスクレイピング手段 Webスクレイピングには色々な方法があります。 私が最近主... 続きを読む

Google、パソコン用 Googlebot によるクロールを完全に終了。 2024年7月5日以降

2024/06/04 このエントリーをはてなブックマークに追加 188 users Instapaper Pocket Tweet Facebook Share Evernote Clip インデックス アナウンス 初級 ファースト 移行

[レベル: 初級] パソコン用 Googlebot によるクロールとインデックスを 2024 年 7 月 5 日以降 Google は完全に終了します。 検索セントラルブログでアナウンスがありました。 ウェブサイトをクロールするのは スマートフォン用 Googlebot だけ 2023 年 10 月末に、モバイル ファースト インデックスへの移行が完了した... 続きを読む

無駄なクロールにさようなら、Googleがクロール量削減を目指す

2024/04/02 このエントリーをはてなブックマークに追加 17 users Instapaper Pocket Tweet Facebook Share Evernote Clip redd LinkedIn イリーズ氏 ゲイリー・イリーズ

[レベル: 上級] 今年の私の使命は、クロールの量をさらに減らし、ネットワーク上の転送データ量を削減することです。 Google の Gary Illyes(ゲイリー・イリース)氏が LinkedIn でこのように投稿しました。 Google の取り組み:洗練されたクロールとネットワーク効率化 イリース氏は次のように続けます。 数日前、Redd... 続きを読む

はてなブログがMicrosoft BingなどのIndexNowの送信に対応しました。素早いインデックスが期待できます - はてなブログ開発ブログ

2023/03/07 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip Yandex インデックス Microsoft 従来 削除

はてなブログがMicrosoft BingなどのIndexNowの送信に対応しました。IndexNowとは、MicrosoftとYandexが共同で作成した検索エンジンのインデックスの新しい仕組みです。検索エンジンに記事の追加や更新、削除を通知する仕組みのため、従来の検索エンジンからのクロールと比較して、コンテンツの素早いインデックスが期待... 続きを読む

あなたも同じミスをするかも? robots.txtのミスで予想外のページをクロール禁止していた悲劇【SEO情報まとめ】 | 海外&国内SEO情報ウォッチ

2022/11/04 このエントリーをはてなブックマークに追加 12 users Instapaper Pocket Tweet Facebook Share Evernote Clip robots.txt あめたま 挙動 落とし穴 SEO

illustration by つきのあめだま 最強級のSEOと最上級のコンテンツすら台無しにする、robots.txtの予想と違う挙動を、あなたは知っているだろうか? 知らなければうっかりハマってしまい、「コンテンツがインデックスされない!」となってしまうかも。 「実際の挙動の根拠は?」「どうすればこの落とし穴を避けられるの... 続きを読む

Googleのクロールバジェットとは? | 3分ニュース: にゃんぷん

2020/04/05 このエントリーをはてなブックマークに追加 21 users Instapaper Pocket Tweet Facebook Share Evernote Clip クロールバジェット Crawler Crawl Budget

Googleのクロールバジェットとは? まずは用語の確認から。 クロール(crawl)とは、Googleなどの検索エンジンが世界中のサイトを巡回・訪問すること。 クローラー(crawler)とは、Googlebotなどのようにクロールをする検索エンジンのAIのこと。 バジェット(budget)とは、予算のこと。 クロールバジェットとは、Googleが... 続きを読む

ワインオープナーでスイミングをしたらこうなる!という話:月曜から夜ふかし【2019/11/18】 - 何ゴト?

2019/11/19 このエントリーをはてなブックマークに追加 11 users Instapaper Pocket Tweet Facebook Share Evernote Clip 夜ふかし スイミング ワインオープナー 月曜 何ごと

ワインオープナーでスイミングをしていました。 ・平泳ぎ ・クロール ・バタフライ STK ソムリエナイフ ワインオープナー コルク抜き GJ0112 (シルバー) 出版社/メーカー: STKメディア: ホーム&キッチン Amazon 楽天市場 続きを読む

Googlebotが混合コンテンツを読み込まなくなるかも、Chromeのセキュリティ強化はSEOにも影響あり | 海外SEO情報ブログ

2019/11/17 このエントリーをはてなブックマークに追加 34 users Instapaper Pocket Tweet Facebook Share Evernote Clip Googlebot https http デフォルト SEO

[レベル: 上級] Chrome が混合コンテンツ (Mixed Content) をデフォルトでブロックするように仕様が変わります。 この仕様変更は Googlebot のクロールにも影響を与える可能性があります。 HTTPS ページなのに、HTTP で配信されたコンテンツはインデックスされなくなるかもしれません。 混在コンテンツを Googlebot は読... 続きを読む

robots.txtでのnoindexをGoogleが完全にサポート終了、2019年9月1日から | 海外SEO情報ブログ

2019/07/02 このエントリーをはてなブックマークに追加 81 users Instapaper Pocket Tweet Facebook Share Evernote Clip robots.txt noindex REP 構文 上級

[レベル: 上級] robots.txt の noindex 構文のサポートを終了することを Google は告知しました。 REP のインターネット標準化にともなう決定です。 機能していたが未サポートだった robots.txt の noindexクローラのクロールを拒否するために robots.txt では Disallow 構文を用います。 User-agent: * Disallow: /dont... 続きを読む

Google主導のもと、Robots Exclusion Protocol (REP) がインターネット標準に | 海外SEO情報ブログ

2019/07/01 このエントリーをはてなブックマークに追加 14 users Instapaper Pocket Tweet Facebook Share Evernote Clip REP Googlebot robots.txt クローラ

[レベル: 上級] robots.txt の仕様を標準化する取り組みに Google は着手しました。 背景背景を完結に説明します。 検索エンジンのクローラ――Google で言えば Googlebot――のクロールを制御するために robots.txt を利用できます。 robots.txt の仕様を Robots Exclusion Protocol (REP) と呼びます。 REP はもともと Mar... 続きを読む

印象的な1コマからマンガを探せる「アル」のAndroid版登場、2億円の資金調達も | TechCrunch Japan

2019/06/11 このエントリーをはてなブックマークに追加 17 users Instapaper Pocket Tweet Facebook Share Evernote Clip アル TechCrunch JAPAN 資金調達 マンガ にじ

アルは6月11日、マンガ探しアプリ「アル」のAndroid版をリリースした。また、ANRI、East Ventures、ABBA Lab、にしのあきひろ、中川綾太郎氏、片桐孝憲氏などから総額2億円の第三者割当増資を実施したことも明らかになった。 アルは、出版社がウェブで無償公開しているマンガのリンクをクロール・解析し、マンガ探しに困... 続きを読む

1つにまとめたサイトマップと分割したサイトマップ、Googleのクロールに違いは出るのか? | 海外SEO情報ブログ

2019/01/22 このエントリーをはてなブックマークに追加 16 users Instapaper Pocket Tweet Facebook Share Evernote Clip John Mueller インデックス 初級 Google

[レベル: 初級] 1 つのサイトマップにすべての URL を記載して送信する場合と、複数のサイトマップに分割して URL を送信する場合とでは Google のクロールとインデックスに違いが生じてくるのでしょうか? Google の John Mueller(ジョン・ミューラー)氏によれば、サイトマップがどのように分かれていても Google は... 続きを読む

ページのダウンロード時間が1000ミリ秒を超えると、Googlebotがクロールに制限をかける可能性あり | 海外SEO情報ブログ

2018/09/30 このエントリーをはてなブックマークに追加 272 users Instapaper Pocket Tweet Facebook Share Evernote Clip Googlebot 支障 上級 目安 理想

[レベル: 上級] Googlebot がページをクロールするときにかかるダウンロード時間が 1,000 ミリ秒を超えると、クロールに支障をきたすかもしれません。 一応の目安として、100 〜 500 ミリ秒以内を考慮しておくとよさそうです。 ページのダウンロード時間は 100 〜 500 ミリ秒が理想、1,000 ミリ秒は遅すぎ(旧)Search C... 続きを読む

クロールのバタ足、速くなる効果なし むしろ水の抵抗増 - 一般スポーツ,テニス,バスケット,ラグビー,アメフット,格闘技,陸上:朝日新聞デジタル

2018/07/04 このエントリーをはてなブックマークに追加 743 users Instapaper Pocket Tweet Facebook Share Evernote Clip 生体工学 アメフット 水泳 筑波大 抵抗

水泳のクロールで速く泳ごうとすればするほど、キック動作(バタ足)は前に進む力に貢献しにくくなる――。こんな研究結果を、筑波大と東京工業大の研究チームがまとめた。秒速1・3メートル(100メートルのタイムで76秒92に相当)より速くなると、足の動きで生じる水の抵抗が大幅に増えるという。生体工学の専門... 続きを読む

Google、求人検索ためのIndexing APIを公開。即時性が高いクロール・インデックスを可能に | 海外SEO情報ブログ

2018/06/27 このエントリーをはてなブックマークに追加 25 users Instapaper Pocket Tweet Facebook Share Evernote Clip インデックス 即時性 Google 上級 海外SEO情報ブログ

[レベル: 上級] 求人検索に対応した JobPosting 構造化データを設定しているページ向けに、Indexing API という仕組みを Google は公開しました。 Indexing API を利用すると、Google にクロールをダイレクトに要求し最新の状態にインデックスを常に保つことができます。 求人情報ページのみ求人検索には即時性が求めら... 続きを読む

SMXミュンヘンでのJohn Muller氏のMFI関連のセッションについて|CyberAgent SEO Information (サイバーエージェントSEO情報ブログ)

2018/03/21 このエントリーをはてなブックマークに追加 17 users Instapaper Pocket Tweet Facebook Share Evernote Clip index セッション Mobile First すべて

3/20,21にドイツ・ミュンヘンで行われたSMXミュンヘンに参加しています。 そこでGoogle John Muller氏のmobile first indexに関するセッションがあったのでレポートしてみたいと思います。   まずJohn氏はかつてのGooge検索について説明しました。 1,一般的なクロール  - すべてのページを見つけてすべてのページを見る 2,一般的なindex  - ページ... 続きを読む

Google 検索の仕組み | 概要

2017/11/20 このエントリーをはてなブックマークに追加 143 users Instapaper Pocket Tweet Facebook Share Evernote Clip Google 概要 検索 ウェブページ インデックス

検索の仕組み 一般的な検索クエリの場合、関連がありそうな情報を掲載しているウェブページは、数千件どころか、場合によっては数百万件も存在します。 それでは、Google の検索結果に表示される情報はどのようにして見つけ出されるのでしょうか。検索の道のりは、検索キーワードが入力される前から始まっているのです… クロールと インデックス 登録 Google では ウェブ クローラを 使用して、 ウェブ ... 続きを読む

サーバ管理者日誌 続・クロールとDoSの違いと業務妨害罪と

2017/11/14 このエントリーをはてなブックマークに追加 116 users Instapaper Pocket Tweet Facebook Share Evernote Clip DOS 業務妨害 サーバ管理者日誌

と書いたのだが、他の図書館でも、一度タイムアウトすると、同じCookieを持ってアクセスすると応答がなくなるという同様の現象が発生するところが見つかった。 気づいたのはたまたまだったのだが、 岡崎市立図書館と同じ、MELILを採用している図書館のリストが、 日本のソフト別OPACリスト [http://www.asahi-net.or.jp/~gb4k-ktr/indexjv.htm#melil]... 続きを読む

SEO対策に効果的な文章!3つのルールを守れば検索上位にできる | テクワク

2017/10/18 このエントリーをはてなブックマークに追加 24 users Instapaper Pocket Tweet Facebook Share Evernote Clip テクワク クローラー SEO対策 晩酌 ルール

1987年2月生まれ。雑記ブログを2017年5月から始めました。たまに真面目な記事も書いています。栃木生まれ大阪育ちで関西弁が上手く喋れないのが悩み。 趣味:映画、晩酌、ブログ、寝る 家族構成:妻と二人 どうも!イクミヤです! サイト運営をする方にとって重要な文章は検索上位にする上で1番と言っても過言ではありません。 GoogleのクローラーがWeb情報を収集することを「クロール」と言います。クロ... 続きを読む

【犬生初泳ぎ!】愛知県東海市にあるドッグプールに行ってきました!! - 柴犬さくらの生活日記

2017/08/25 このエントリーをはてなブックマークに追加 16 users Instapaper Pocket Tweet Facebook Share Evernote Clip おでかけ 柴犬さくら スポンサーリンク 愛知県東海市 生活日記

2017 - 08 - 25 【犬生初泳ぎ!】愛知県東海市にあるドッグプールに行ってきました!! 柴犬さくらの生活日記 柴犬さくらの生活日記-おでかけ シェアする Twitter Google+ Pocket 【スポンサーリンク】 どうもどうも。 以前の記事でも言ったけど全く泳げない “えす” ですw 昔プール教室に通ってたんだけど、 そこを辞めてからはホントに全然泳げなくなりましたね。 クロール... 続きを読む

クロールで確実にすばやく泳げる7つの方法 - 散るろぐ

2017/07/25 このエントリーをはてなブックマークに追加 70 users Instapaper Pocket Tweet Facebook Share Evernote Clip 平泳ぎ DVD たくさん 方法 7つ

2017 - 07 - 25 クロールで確実にすばやく泳げる7つの方法 Twitter Google+ Pocket クロールを速く泳ぎたいと思っている僕です。こんにちは。 ところで、クロールや平泳ぎに、確実にすばやく泳ぐ方法って、あると思いますか? そんなものありませんよ。もしもあったら、みんなゴールドメダリストじゃないですか。 それなのに、泳ぎに関する本やDVDは、たくさん売られています。そし... 続きを読む

HTMLサイトマップとXMLサイトマップを理解してSEO対策とユーザビリティを向上する | プロモニスタ

2017/07/03 このエントリーをはてなブックマークに追加 17 users Instapaper Pocket Tweet Facebook Share Evernote Clip ユーザビリティ プロモニスタ SEO SEO対策 役割

「HTMLサイトマップ」「XMLサイトマップ」の役割の違いとは。HTMLサイトマップ:ユーザビリティ対応(SEOの効果は現状はない)、XMLサイトマップ:SEO対策(クローラー対応)。最後にXMLサイトマップを検索エンジンにクロール、インデックスしてもらうための2つの方法をご紹介します。「HTMLサイトマップ」「XMLサイトマップ」の役割の違いとは 2つのサイトマップの役割の違いは、それぞれ以下の... 続きを読む

言葉にしたい - クルミ通りのメープル荘

2017/01/30 このエントリーをはてなブックマークに追加 12 users Instapaper Pocket Tweet Facebook Share Evernote Clip メープル荘 クルミ通り ひょうきん族 静けさ お茶の間

2017 - 01 - 30 言葉にしたい 頭の中 言葉にしたい 決まることのない3ポイントシュートと体育館の静けさを 「ひょうきん族」が始まる前のザワザワするお茶の間を なかなか顔を見せずに勿体ぶる、給食ワインゼリーのいじらしさを 言葉にしたい 気になっていた子の視線を感じた視聴覚室の奇跡を 夜中に忍び込んだプールでしか出せない自己ベストのクロールを 誰も居ないはずの保健室から聞こえた会話を 言... 続きを読む

Google ウェブマスター向け公式ブログ: Googlebot のクロール バジェットとは?

2017/01/17 このエントリーをはてなブックマークに追加 60 users Instapaper Pocket Tweet Facebook Share Evernote Clip オートコンプリート Googlebot AMP バジェット

+1 ボタン 2 AMP 9 API 2 App Indexing 8 Google プレイス 2 Merchant Center 8 Search Console 92 イベント 11 ウェブマスターガイドライン 44 ウェブマスタークイズ 2 ウェブマスターツール 83 ウェブマスターフォーラム 6 オートコンプリート 1 お知らせ 41 クロールとインデックス 66 サイトクリニック 4 サ... 続きを読む

脆弱性検査で重要なクロールとは何なのか - Qiita

2016/12/21 このエントリーをはてなブックマークに追加 13 users Instapaper Pocket Tweet Facebook Share Evernote Clip Qiita 脆弱性検査

VAddyは、 継続的なWeb脆弱性検査が簡単に実現できるSaaSです 。 CIと簡単に連携でき、継続的なセキュリティテストが実現できます。 VAddy Adventカレンダー も残り少なくなってきました。 昨日はBrewDog六本木に行ってJack Hammer IPAを飲んできました。やはり美味しいですね。 チリIPAという種類もあって飲ませてもらったのですが、最初は香りが強くて美味しいと思い... 続きを読む

 
(1 - 25 / 73件)