タグ 安定運用
人気順 5 users 50 users 100 users 500 users 1000 usersSRE と Developer のコラボレーションを支える仕組み - Quipper Product Team Blog
こんにちは。SRE の @int128 です。 Quipper の SRE チームでは、Platform の安定運用や改善だけでなく、Platform を利用する Developer のサポートも重要な仕事と位置付けています。 SRE チームで工夫していることを紹介します。 Issue に記録を残す SRE チームでは課題や疑問などを気軽に相談してほしいと考えています... 続きを読む
転職1年の近況報告 - じんめんメモ
早いもので昨年の8月1日に転職してから1年経ちましたということで近況報告です。 現在のポジションは社内のプライベートクラウドのSREです。クラウドの利用者(=アプリ開発チーム)からの問い合わせ対応やトラブルシューティングだったり、クラウド基盤の開発の支援やキャパシティ管理、安定運用のためのあれこれをやって... 続きを読む
「不適切コンテンツ検出」 の機械化と安定運用 / Automating "unsafe content detection" with Amazon SageMaker - Speaker Deck
「不適切コンテンツ検出」 の機械化と安定運用 / Automating "unsafe content detection" with Amazon SageMaker 第4回 Amazon SageMaker 事例祭り/2019 年 4 月 17 日 https://pages.awscloud.com/AmazonSageMaker20190417-jp.html SNS mixi において固定の人的コストを必要としてきた「不適切コンテンツ検出」という... 続きを読む
Amazon ECSを安定運用するためにやっていること コンテナインスタンス、ログ、モニタリングにおける工夫 - ログミーTech
Amazon ECSを安定運用するためにやっていること コンテナインスタンス、ログ、モニタリングにおける工夫 Amazon ECS の安定運用のために 2018年11月28日、クックパッド株式会社が主催するイベント「Cookpad Tech Kitchen」が開催されました。第20回となる今回のテーマは「クックパッドのマイクロサービスプラットフォー... 続きを読む
はてなブログにつながりにくくなる障害がありました(復旧済み) - はてなブログ開発ブログ
2016 - 11 - 28 はてなブログにつながりにくくなる障害がありました(復旧済み) 障害・不具合 2016年11月28日(月)14:37ごろから16:44ごろにかけて、はてなブログのすべてのページにつながりにくくなる障害が発生しました。原因はデータベースサーバーの一時的な過負荷によるもので、現在は復旧済みです。 ご利用の皆さまにはご迷惑をおかけして申し訳ありません。今後、安定運用に努めてま... 続きを読む
スタートアップでのSaaS利用はユーザサポート体制で選ぶべき、あるいはSendGridのサポートが素晴... — サイタ エンジニアブログ
先日、サイタの MTA を全面的に SendGrid に移行しました。移行後数ヶ月経ち、今では安定運用のフェーズに入っております。実は移行直後はなにかと色々あったのですが、その辺りのゴタゴタも含めて、移行の顛末をお話したいと思います。なぜSendGridなのかこれは、約1年前の検討記事をご覧いただいたほうが良いのですが、当時いろいろ比較した結果、私たちの業務上必要な要件を(APIレベルで)十分に満... 続きを読む
我が家を支えるChatOps
Transcript of "我が家を支えるChatOps" 1. HipChat+Hubot を使った家庭の安定運用 @ogasora50 [著] どのようにすれば 良好な関係を維持できるか 24時間365日 2. 自己紹介 社会人6年目 ほぼ、ソーシャルゲーム開発・運用 時々、芸能サイト開発・運用 いわゆるWEBエンジニア 3. 我が家で行っている ChatOpsをご紹介します 4. ... 続きを読む
今さら聞けないfluentd~クラウド時代のログ管理入門(3):fluentdの効果的な活用例と安定運用のポイント (1/3) - @IT
今さら聞けないfluentd~クラウド時代のログ管理入門(3):fluentdの効果的な活用例と安定運用のポイント (1/3) 効率良く、意味のあるログ管理を実現するツールとして注目されている「fluentd」。最終回では、実際の利用シーンを想定し、より効果的なfluentdの利用法を紹介します。 第1回、第2回でfluentdを使って基本的なログ管理が実現できるようになったのではないでしょうか。... 続きを読む
ミラクル・リナックスがオープンソースとして公開:ZabbixとNagiosの監視情報を一元的に表示する「Hatohol」 - @IT
ミラクル・リナックスは6月27日、オープンソースの統合監視ソフトウェア「Zabbix」と「Nagios」からデータを取得し、一元管理できるようにする統合ビューア「Hatohol」を開発し、オープンソースソフトウェアとして公開した。 ZabbixとNagiosは、サーバやプロセスの稼働状態の監視と障害検知を行い、システムの安定運用を支援するオープンソースソフトウェアで、ともに多くのシステムで採用され... 続きを読む
Amazon EC2でプロセス監視ツールを導入する – monit – | Classmethod.dev()
プロセス監視について 出社してサーバーを見たらプロセスが落ちてた!?こんな経験ありませんでしょうか。24時間365日の安定運用が当たり前に求められる現在、サーバー担当者が張り付きで監視をするにはコスト的にもリソース的にも限界があります。そこで、ある程度作業を自動化しようというのが今回の試みです。 monitとは monitは、プロセス/プログラム/ファイル/ディレクトリ/ファイルシステムを管理/監... 続きを読む
分散データベース「HBase」の安定運用を目指して : Preferred Research
1年経ってiPhone4の電池がヘタってきた、太田です。 指数関数的にエントリ数が少なくなってきた本ブログですがw、景気付けのためにエントリを投稿したいと思います!本日はHBaseについてです。 Linux と Hadoop と HBase と ZooKeeper に詳しいあなた!あなたがターゲットです。 HBaseとは? HBaseとは、HDFS (Hadoop Distributed File... 続きを読む