タグ Nutch
人気順 10 users 50 users 100 users 500 users 1000 usersGo AbekawaのGo Global!~Doug Cutting編:Hadoop生みの親が、ゼロックスからアップルに転職した理由 (1/3) - @IT
「Go AbekawaのGo Global!」連載目次 アップルやディズニーなどの外資系企業でマーケティングを担当し、グローバルでのビジネス展開に深い知見を持つ阿部川“Go”久広が、グローバルを股に掛けたキャリアを築いてきたIT業界の先輩にお話を伺うインタビューシリーズ。第15回は「Hodoopの生みの親」Doug Cutting(ダグ・カッティング)氏に登場いただく。 Lucene、Nutch、... 続きを読む
WebCrawler in Scala - Web就活日記
2014-12-30 WebCrawler in Scala Crawler in Scala 検索Crawlerを作る - Web就活日記 以前はnutchを使ったcrawlerを試してみましたが、今回はcrawler自体をscalaで書いているものをまとめようと思います。インターネットで紹介されているものの中には全然使えないものもあったりするので、選択には気をつけてください。個人的にはまとめた... 続きを読む
検索Crawlerを作る - Web就活日記
2014-09-23 検索Crawlerを作る Solr in Action作者: Trey Grainger,Timothy Potter出版社/メーカー: Manning Pubns Co発売日: 2014/04/05メディア: ペーパーバックこの商品を含むブログを見る Nutch + Solr + Hbase + Zookeeper Nutchで特定のWebPageをCrawlingしてSo... 続きを読む
Hadoopがバージョン1.0へ。2.0、3.0の議論も進む - Publickey
大規模分散処理フレームワークのHadoopの最新安定版「Hadoop 1.0.0」が、昨年12月27日に公開されました。これは、これまで安定版として開発されていた「Hadoop 0.20」ブランチの最新バージョンを1.0.0としたものです。 Hadoopは、前身となるNutchが2002年にDoug Cutting氏によって開発され、(このビデオの10分頃のCutting氏の発言によると)2008... 続きを読む