タグ「MapReduce」 - はてブログ

タグ MapReduce

新着順人気順 5 users 10 users 50 users 100 users 500 users 1000 users

(1 - 25 / 47件)

Hadoop の時代は終わってないけど、使いどころは限定されてきたかもしれない - ブログなんだよもん

2017/07/11 35 users Hadoop shiumachi.hatenablog

2017 - 07 - 11 Hadoop の時代は終わってないけど、使いどころは限定されてきたかもしれない読み物分散 id:shiumachi さんが書かれてる下記の記事がとても良かったです。 shiumachi.hatenablog.com 私自身もSparkを触る前は「 Hadoop == MapReduce 」と思ってましたが、どちらかというとYARNや HDFS が Hadoop フ... 続きを読む

第15回　計算機クラスタのためのリソース管理基盤 Hadoop YARN：Hadoopはどのように動くのか ─並列・分散システム技術から読み解くHadoop処理系の設計と実装｜gihyo.jp … 技術評論社

2016/01/26 19 users 並列 Hadoop YARN コモディティ実装

はじめに前回は， MapReduceとその実装であるApache Hadoopの概要について説明しました。今回は， Apache Hadoopにおいて計算機クラスタのリソース管理を行うYARNについて解説します。多種多様な処理系の登場 Hadoopの登場を1つの契機として，コモディティな計算機を複数台用いた計算機クラスタ上でデータ処理を行うことが広く普及しつつあります。たとえば， Hadoo... 続きを読む

第13回　Hadoopの設計と実装～並列データ処理系Hadoop MapReduce［1］：Hadoopはどのように動くのか ─並列・分散システム技術から読み解くHadoop処理系の設計と実装｜gihyo.jp … 技術評論社

2015/12/09 33 users Hadoop YARN 並列焦点 Apache Hadoop

はじめに第一部では，Hadoopなどの並列データ処理系の基礎である並列データベース技術や分散システム技術を解説してきました。第二部では，実際の処理系により焦点を当て，それらの設計と実装を見ていきます。第二部では，最初の4回を用いて，Apache Hadoopの並列データ処理系であるHadoop MapReduceを始めとし，当該処理系のリソース管理を行うYARNおよび，汎用的な並列データ処理系... 続きを読む

分散システム処理モデルに関する動向について（MapReduceからBorgまで） - Yahoo! JAPAN Tech Blog

2015/06/10 497 users Borg 関数プログラミングモデル特徴以下

詳細については後述しますが、MapReduceの処理モデルは、上記の通り各区分ごとにそれぞれ単純化（限定）されたモデルであったと言えます。また、MapReduceの関数プログラミングおよびグラフ的な特徴も合わせて以下に整理してみます。関数プログラミング的な特徴 MapおよびReduceフェーズは、それぞれ関数型プログラミングのMapおよびReduce処理をモデル化したものです。MapReduc... 続きを読む

Treasure Dataを支える(中の人に必要な)技術 - myui's memo

2015/04/15 252 users myui's memo Treasure Data 技術

2015-04-15 Treasure Dataを支える(中の人に必要な)技術 Treasure Data（以下、TD）に入社して早2週間が経ちました。入社してから知ったのですが、平成14年度IPA未踏ユース第1期で同期でスーパークリエイタであった西田さんがTDで働いているのを知りました。MapReduceやHadoopが登場した頃、「Googleを支える技術」という技術書*1でお世話になったの... 続きを読む

誰でも簡単に超高速なクエリができるBigQueryとは？ - Build Insider

2015/03/31 203 users BigQuery クエリパブリッククラウドサービス実装

この2つの技術は、グーグル独自の技術というわけではない。しかし、ハードウェアから構築している、既存のグーグルのクラウド技術を活用し、パブリックなクラウドサービスとして提供可能なレベルの実装になっている点がGoogle BigQueryの強みとなっている。 BigQueryの特徴他の類似サービスとの比較巨大データを処理する技術としては、同じグーグルが使ってきたMapReduceというものがある。... 続きを読む

2015年のHadoopとビッグデータ活用：新春特別企画｜gihyo.jp … 技術評論社

2015/01/02 67 users Hadoop 濱野 YARN SQL 賢一朗

新春特別企画 2015年のHadoopとビッグデータ活用 2015年1月2日濱野賢一朗 Hadoop, MapReduce, Apache Spark, Apache Tez, SQL, YARN この記事を読むのに必要な時間：およそ 2 分あけましておめでとうございます。濱野賢一朗です。 1年は早いものですね。本当にあっという間に過ぎ去ってしまうものです。しかし，いざ1年を振り返ってみると... 続きを読む

ニュース - Hadoop MapReduceを全置き換え、スペインStratioがSpark採用事例を発表：ITpro

2014/08/11 32 users Hadoop MapReduce Spark 発表ニュース

ビッグデータ分析ソフトを手掛けるスペインのStratioは、インメモリーのビッグデータ分析ソフト「Spark」の採用事例を公開した（発表資料）。同社は7年以上前から、顧客向けのビッグデータ分析にHadoop MapReduceを使ってきたが、2013年からSparkの利用を始め、今ではMapReduceを完全にSparkに置き換えたという。同社は2013年までの6年間ほど、MapReduceにリ... 続きを読む

Big Data の調査：Google の DataFlow は、MapReduce の正当な継承者になり得るのか？ | Agile Cat --- in the cloud

2014/07/27 24 users DataFlow wp.me Agile Cat for

Big Data の調査：Google の DataFlow は、MapReduce の正当な継承者になり得るのか？ Data Cloud/Big Data: Google Introduces DataFlow as Successor to MapReduce http://wp.me/pwo1E-7HE By Dick Weisinger – July 25, 2014 http://for... 続きを読む

ニュース - 「Hadoopはビッグデータの“OSカーネル”」、Hadoop Conference Japan開催：ITpro

2014/07/08 28 users Hadoop ITpro オープンソースソフトウエア OSS

オープンソースソフトウエア（OSS）の分散データ処理ソフト「Hadoop」のユーザー会「Hadoop Conference Japan 2014」が2014年7月8日、東京・汐留で開催された。基調講演には、Hadoopのオリジナル開発者であるダグ・カッティング氏（写真1）などが登壇。カッティング氏は「バッチ処理用の『MapReduce』以外の処理方式に対応した現在のHadoopは、ビッグデータを処... 続きを読む

Google、大規模データをリアルタイムに分析できるクラウドサービス「Google Cloud Dataflow」を発表。「1年前からMapReduceは使っていない」－ Publickey

2014/06/26 400 users Publickey Hadoop フレームワーク処理系発表

Google、大規模データをリアルタイムに分析できるクラウドサービス「Google Cloud Dataflow」を発表。「1年前からMapReduceは使っていない」大規模分散処理のフレームワークとしてGoogleが開発し、Hadoopに採用されて広く使われているMapReduce。しかしGoogleはもうMapReduceを使わず、より優れた処理系の「Google Cloud Dataflo... 続きを読む

ニュース - グーグル、MapReduce後継のビッグデータ処理サービス「Cloud Dataflow」を発表：ITpro

2014/06/26 67 users Cloud Dataflow グーグルクラウドサービス

米グーグルは2014年6月25日（米国時間）、ビッグデータ分析のクラウドサービスである「Google Cloud Dataflow」を発表した。グーグルの並列データ処理技術「MapReduce」の後継技術をベースにしたサービスで、バッチ処理だけでなくストリーム処理やリアルタイム処理を実行できることが特徴。25日から同社が米国サンフランシスコ市で開く開発者会議「Google I/O 2014」で発表... 続きを読む

News ＆ Trend - 次世代Hadoop最有力候補の「Spark」、動き始めたエコシステム：ITpro

2014/06/23 34 users trend ITpro ASF Spark Hadoop

次世代Hadoopの有力なビッグデータ分析基盤として期待を集めているフレームワークがある。Apache Software Foundation（ASF）のオープンソースソフト（OSS）プロジェクトである「Spark」だ。インメモリー処理が特徴で、Hadoopにおける処理方式の一つである「MapReduce」を用いた場合と比べて最大で100倍以上、分析処理を高速化できる。 Sparkは当初、研究用途... 続きを読む

MapReduce代替の「Apache Spark 1.0」が登場 | SourceForge.JP Magazine

2014/06/04 47 users Apache Spark ASF JP Magazine

非営利団体のApache Software Foundation（ASF）は5月30日、大規模なデータ処理を行うための分析ソフトウェア「Apache Spark 1.0」のリリースを発表した。「Apache Hadoop」のMapReduceを置き換えることを目指すもので、多くの変更点が加えられている。 Apache Sparkは米カリフォルニア大学バークレー校のAMPLabで開発された分散コンピ... 続きを読む

IBM、新開発のPaaS「BlueMix」をベータ公開。Java、Node.js、Ruby実行環境とMySQL、MongoDB、MapReduce、モバイルBaaSにGitホスティング、Web開発環境など盛りだくさんの対応。IBM Pulse 2014 － Publickey

2014/02/24 130 users Publickey PaaS MongoDB BlueMix

IBM、新開発のPaaS「BlueMix」をベータ公開。Java、Node.js、Ruby実行環境とMySQL、MongoDB、MapReduce、モバイルBaaSにGitホスティング、Web開発環境など盛りだくさんの対応。IBM Pulse 2014 米IBMのイベント「IBM Pulse 2014」が2月24日（現地時間）にラスベガスで開幕しました。SoftLayerを買収以来はじめて、同社の... 続きを読む

(1 - 25 / 47件)

次の25件 »