タグ SRE
人気順 5 users 50 users 100 users 500 users 1000 users「SREをはじめよう」を読んで世界が変わった話
🌟 はじめに 本記事は CyberAgent Group SRE Advent Calendar 2024 の13日目 の記事になります。 本記事では SWE(Software Engineer)である私が 『SREをはじめよう―個人と組織による信頼性獲得への第一歩』 を読んで、SREについての理解を深めた経験を共有します。エンジニア・非エンジニア・社会人・学生など、さまざ... 続きを読む
総論→各論→演習とステップアップ。『SREをはじめよう』翻訳者が推薦する、SREへの理解を深める4冊 | レバテックラボ(レバテックLAB)
総論→各論→演習とステップアップ。『SREをはじめよう』翻訳者が推薦する、SREへの理解を深める4冊 2024年12月10日 SRE書籍翻訳者 山口 能迪 アマゾンウェブサービスジャパン合同会社シニアデベロッパーアドボケイト。AWS製品の普及と技術支援を担当し、特にオブザーバビリティ、SRE、DevOpsといった領域を担当。OpenTele... 続きを読む
組織横断的なSRE活動を始めようとしています - エス・エム・エス エンジニア テックブログ
この記事は株式会社エス・エム・エス Advent Calendar 2024 vol.1の12月9日の記事です。 エス・エム・エスで全社SREというロールで活動しているSecurity Hub芸人1の山口(@yamaguchi_tk)です。 おすすめのAWSサービスは営業です(いつもお世話になっています)。 はじめに SRE(Site Reliability Engineering)は、運用... 続きを読む
大規模投票サービス「WINTICKET」だからこそ SRE の重要性を改めて感じた話 - CyberAgent SRG #ca_srg
メディア統括本部 サービスリライアビリティグループ(SRG)の長谷川(@rarirureluis)です。 #SRG(Service Reliability Group)は、主に弊社メディアサービスのインフラ周りを横断的にサポートしており、既存サービスの改善や新規立ち上げ、OSS貢献などを行っているグループです。 本記事 続きを読む
レガシーサーバーをコンテナで再構築した、その5年後の移行と解体 - KAYAC Engineers' Blog
面白法人グループアドベントカレンダー2024 2日目の記事です。SREの藤原です。 2024年も暮れようとしていますね。ところで今から5年前のこと、builderscon tokyo 2019 というイベントで「レガシーサーバーを現代の技術で再構築する」というタイトルで発表しました。 speakerdeck.com この発表は、当時 Amazon EC2 のシン... 続きを読む
Googleを退職します - YAMAGUCHI::weblog
こんにちは。Google CloudでオブザーバビリティやSREを担当していたエンジニアです。明日でこう名乗るのは最後になります。明日、2024年10月31日付でGoogleを退職します。 pic.twitter.com/dS3WOVCQBj— Yoshi Yamaguchi (@ymotongpoo) 2024年10月30日 かしこまった挨拶 Googleに入社してから10年目までの話は次の記事で... 続きを読む
AWSアカウントを取り違えないための試み - KAYAC Engineers' Blog
SREチームの長田です。 皆さんは操作するAWSアカウントを取り違えたことはありますか? 私はあります。 カヤックのSREは複数のプロダクトを担当することも多く、 ひとつのプロダクトでも環境(本番、ステージング、開発、etc.)ごとにAWSアカウントを分ける場合があり、 扱わなければならないAWSアカウントが多くなる傾向... 続きを読む
エンタープライズ企業におけるSREは「大きい、難しい、早い」からおもしろい |AEON TECH HUB
多くのエンジニアにとって未知の領域であるエンタープライズ企業のSRE。イオンCTO兼イオンスマートテクノロジーCTOの山﨑は、そのおもしろさは「大きい、難しい、早い」にあると語ります。イオンのSREは具体的にどのような取り組みを行っているのか詳しく聞きました。 続きを読む
ISUCONの過去問でObservabilityを体験する - Hatena Developer Blog
システムプラットフォームチームで SRE をしている id:masayoshi です。 今年もISUCON14の開催が決定しましたね! isucon.net ISUCONとはLINEヤフー株式会社が運営窓口となって開催している、お題となるWebサービスを決められたレギュレーションの中で限界まで高速化を図るチューニングバトルです ISUCONは、世の中に実... 続きを読む
GMOペパボを退職します - 地方エンジニアの学習日記
2024年10月30日をもって、約3年間勤めたGMOペパボを退職します。 入社したのは2021年7月なのでした。 ryuichi1208.hateblo.jp ペパボでは主にSREとして、サービスの信頼性に関する施策の考案と実践を担当してきました。入社時にはSREの概念は認知されていましたが、当時はまだ改善の余地が多く、日々多くの課題に取り組... 続きを読む
OSSでオブザーバビリティを実現する (Grafana Stack x OpenTelemetry on Kubernetes) - RAKUS Developers Blog | ラクス エンジニアブログ
はじめに こんにちは。SREの gumamon です! NewRelic、Datadog、モダンな監視ツール(オブザーバビリティ)って良いですよね。弊社もKubernetes(k8s)等を利用した環境が増えてきた折、そろそろ必要になってきたのですが、NewRelic、Datadog等のクラウドサービスはランニングコストが高くなりがちです。 では内製できない... 続きを読む
SREチーム発足と今期の取り組みについて - Findy Tech Blog
はじめに 皆様、はじめまして。Findyでプロダクト開発部/SREとしてジョインしました安達(@adachin0817)と申します。今年の6月に入社し、ちょうど3ヶ月が経ちました。本日は、SREチームの立ち上げに関する0から1のプロセスと、今期の取り組みについてご紹介させていただきたいと思います。 SREチーム発足 2023年までは... 続きを読む
"SRE" doesn't seem to mean anything useful any more
This seems to be a thing now: someone finds out that you worked as an SRE ("site reliability engineer", something from the big G back in the day) somewhere, and now all you're good for is "devops" - that is, you're going to be the "ops bitch" for the "real" programmers. You are the consumer. They... 続きを読む
SREという役割が単なる「オペレーション担当」になっちまった、と愚痴ったブログ記事が海外で話題に
9月5日、「"SRE" doesn't seem to mean anything useful any more」と題したあるブログ記事が話題になっている。この記事では、SRE(サイト信頼性エンジニア)という役割が変容し、現在では単なる「オペレーション担当」へと貶められてしまった現状について詳しく紹介されている。以下に、その内容を紹介する。 SREの本... 続きを読む
はてなブログや GigaViewer で使われている画像変換プロキシを EC2 から EKS に移行しました - Hatena Developer Blog
こんにちは、サービスプラットフォームチーム アルバイトの id:walnuts1018 です。 この記事は、はてなの SRE が毎月交代で書いている SRE 連載の 8 月号です。7 月の記事は id:masayoshi さんの はてなで最近実施している SRE 研修の紹介 でした。 今回は、社内共用の画像変換プロキシである、「Scissors」というサービ... 続きを読む
カヤックのSREチームは「SREに関することなら何に使ってもいい時間」がある - KAYAC Engineers' Blog
SREチームの長田です。 SREsとしての業務がメインではあるのですが、実はSREチームの人事リソース管理を担当していたりします。 今回はそんな立場から「SRE活動用のリソース」について紹介してみようと思います。 SREなのに「SRE活動用」リソース? カヤックのSREは、担当プロダクトチームのメンバーとして動く、いわゆ... 続きを読む
t_wadaさんによる2024年度版TDDワークショップを開催しました - Pepabo Tech Portal
はじめに 技術部プラットフォームグループでSREをしているchiroruです。 ペパボでは、2023年に引き続き今年も日本のTest-Driven Development(TDD) の第一人者である@t_wadaさんをお招きしてTDDワークショップを開催しました。今回は総勢9名で丸っと1日ワークショップに参加してきました。その参加パートナーから開催レポ... 続きを読む
今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶ - Findy Tools
公開日 2024/08/16更新日 2024/08/15今日から始める「システム監視」。大量トラフィックのシステムを安定して運用する知見をアソビューのSREに学ぶ はじめにアソビュー株式会社では、アソビュー!という電子チケットを販売するサイトを運営しています。 システムを安定稼働させるためには、日常的にシステムの状態を監視... 続きを読む
SRE NEXT 2024(のアンドパッドブース)に参加したエンジニアがいまオススメするソフトウェアやサービスとは? - ANDPAD Tech Blog
こんにちは。SREチームの吉澤です。 アンドパッドは、8/3(土)〜4(日)に開催されたSRE NEXT 2024にゴールドスポンサーとして協賛し、企業ブースとスポンサーLTに参加させていただきました! スポンサーLTでは、SREチームリーダーの角井さんが「アンドパッドのマルチプロダクト戦略を支えるSRE」というタイトルで発表しま... 続きを読む
SRE NEXT 2024で「アンドパッドのマルチプロダクト戦略を支えるSRE」というタイトルで発表しました! - ANDPAD Tech Blog
こんにちは。SREチームリーダーの角井です。 アンドパッドは、8/3(土)〜4(日)に開催されたSRE NEXT 2024にゴールドスポンサーとして協賛し、企業ブースとスポンサーLTに参加させていただきました! スポンサーLTでは、私から「アンドパッドのマルチプロダクト戦略を支えるSRE」というタイトルで発表させていただきました... 続きを読む
徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例 - SRE NEXT 2024
2024年8月3,4日に開催された SRE NEXT 2024 での発表資料です。 「徹底的な自動化とトイルの撲滅で実現する効率的なSREの実践例」 https://sre-next.dev/2024/schedule/#sp007 本発表では、数十のウェブサイトを限られた人数で構築・運用するため… 続きを読む
SRE の考えをマネジメントに活かす / applying SRE ideas to management
SRE NEXT 2024 https://sre-next.dev/2024/ 続きを読む
敵対的SRE: 300個のジョブをAIチーム全員で支える技術
Scaling Technical Excellence at 104: Evolution in AWS and Developer Empowerment 続きを読む
SLI、SLO、エラーバジェット導入の前に知っておきたいこと | sreake.com | 株式会社スリーシェイク
1. はじめに こんにちは、「信頼性は可用性ではない」を標語にしているnwiizoです。 近年、サービスの信頼性向上に向けた取り組みとして、SLI(Service Level Indicator)、SLO(Service Level Objective)、エラーバジェットという概念が注目を集めています。これらは、Google発祥のSRE(Site Reliability Engineering... 続きを読む
3フェーズに分けて振り返る atama plus データアーキテクチャ変遷 - Findy Tools
公開日 2024/07/29更新日 2024/07/263フェーズに分けて振り返る atama plus データアーキテクチャ変遷 こんにちは、atama plus株式会社でEngineering Managerや、SRE、データ基盤などplatform系チームのオーナーをしております、前田( @kzk_maeda)と申します。 atama plusでは「教育に、人に、社会に、次の可能性を。... 続きを読む