はてブログ

はてなブックマーク新着エントリーの過去ログサイトです。



タグ wyukawa’s blog

新着順 人気順 5 users 10 users 50 users 100 users 500 users 1000 users
 
(1 - 8 / 8件)
 

データ民主化の負の側面 - wyukawa’s blog

2017/10/01 このエントリーをはてなブックマークに追加 123 users Instapaper Pocket Tweet Facebook Share Evernote Clip 側面 データ民主化

データの活用が当然のことのようになってエンジニア以外でもSQL書いてデータ抽出するのが一般的になってきました。さらにデータサイエンティストの登場により高度な分析もされるようになってきて、顕在化してきたのがHadoopクラスタの無法地帯化とエンジニアの疲弊なんじゃないかと最近思っております。なおHadoopに限らずElasticsearchでも言えたりします。 これって要はユーザと管理者のバランスの... 続きを読む

バッチ処理、ジョブ管理について書いてみる - wyukawa’s blog

2015/06/17 このエントリーをはてなブックマークに追加 173 users Instapaper Pocket Tweet Facebook Share Evernote Clip バッチ処理 ジョブ管理 Hive Python ジョブ

Azkaban, 技術僕はHive, Pythonでバッチ処理を書いてAzkabanでジョブ管理するシステムを構築、運用した経験が2年ほどあるので今日はバッチ処理、ジョブ管理について書いてみようと思います。僕の経験上Hadoop特有の部分、例えばテスト環境が作りづらいとかバッチサーバーはジョブをsubmitするだけなので負荷はそんなにかからないとか、はあるけれど割と汎用的なのではないかと思います。... 続きを読む

2種類のログ解析基盤 - wyukawa’s blog

2015/05/02 このエントリーをはてなブックマークに追加 73 users Instapaper Pocket Tweet Facebook Share Evernote Clip ログ解析基盤 Presto 2種類 insert Hadoop

Hadoop, Presto, yanagishima僕は仕事では2種類のログ解析基盤を見ています。1つ目はどちらかというとエンジニアよりの解析基盤でサービス側のエンジニアがShib, ShibUIを通して好きにクエリを投げることができます。ただしtableをcreateしたりdropしたりinsertしたりはできません。selectのみです。データの更新作業は別途cronのhive batchで... 続きを読む

ETLフレームワークとジョブ管理 - wyukawa’s blog

2015/02/28 このエントリーをはてなブックマークに追加 51 users Instapaper Pocket Tweet Facebook Share Evernote Clip Luigi スクリプト エラー ジョブ管理 意見

AzkabanTreasure Dataが面白い記事を書いていたのでこれに関連してETLフレームワークとジョブ管理について僕の経験、意見を書いてみようと思います。Managing the Data Pipeline with Git + Luigi | The Treasure Data Blogリンク先の記事を僕なりに要約すると、データやそれを加工するスクリプトがちらばって管理が辛くなり、エラー... 続きを読む

rebuildfm 53のRubyのGCとスレッドの話が面白かった - wyukawa’s blog

2014/08/09 このエントリーをはてなブックマークに追加 60 users Instapaper Pocket Tweet Facebook Share Evernote Clip Ruby スレッド Matz rebuildfm クックパッド

RubyRebuild: 53: Less Code Is Better Code (Matz)rebuildfm 53のRubyのGCとスレッドの話が面白かったので書いてみる。RubyのGCというとクックパッドがユーザのリクエスト中にGCを止めるっていう話があったぐらいなので改善が望まれる分野なんだと思います。 例えば GC を止める・Ruby ウェブアプリケーションの高速化 - 2nd lif... 続きを読む

LL言語でのhot deployとJavaでのhot deploy - wyukawa’s blog

2014/04/17 このエントリーをはてなブックマークに追加 94 users Instapaper Pocket Tweet Facebook Share Evernote Clip hot deploy Java LL言語 答え 再起動

JavaJVM Operation Casual Talksで出てた話としてJavaでhot deployってどうしてんの?ってのがありました。hot deployっていうのはアプリケーションコードを変更してもAPサーバーを再起動せずに反映する技術です。この辺別に僕は全然知らないし答えを持っているわけではないですが、まあちょっと興味があったのでLL言語でのhot deployとJavaでhot d... 続きを読む

RDBMSのコネクションプーリングとかその辺の話 - wyukawa’s blog

2013/11/16 このエントリーをはてなブックマークに追加 266 users Instapaper Pocket Tweet Facebook Share Evernote Clip コネクションプーリング コネクションプール RDBMS コネ

技術 データベース技術の羅針盤 from Yoshinori Matsunobuこれは素晴らしい資料で後半のキャリアの話とか面白いんだけど、今回書くのはp6,p8に書かれていた下記の話です。PosgreSQLは接続がプロセスベースなのでLL言語との相性がよくないPgpool(これはプロキシサーバー的に使うらしい)などのコネクションプールと併用することが多いMySQLは接続がスレッドベースなのでコネ... 続きを読む

chefとかvagrantとかfabricとか - wyukawa’s blog

2013/11/10 このエントリーをはてなブックマークに追加 87 users Instapaper Pocket Tweet Facebook Share Evernote Clip VirtualBox Vagrant fabric Chef

chef, vagrant, fabricchefを使いそうなのでその辺素振りしてみる。chefの前にまずvagrantとvirtualboxをそれぞれダウンロードしてインストールBoxファイルの追加 $ vagrant box add centos63 https://dl.dropbox.com/u/7225008/Vagrant/CentOS-6.3-x86_64-minimal.box $... 続きを読む

 
(1 - 8 / 8件)