タグ 耐障害性
人気順 10 users 50 users 100 users 500 users 1000 users【AWS re:Invent 2024】耐障害性を高めるCell-based Architectureを体験してきた - カミナシ エンジニアブログ
はじめに カミナシでID管理・認証基盤を開発しているmanatyです。ラスベガスで開催されているAWS re:Invent 2024に初めて参加しています。今回はワークショップセッションとして開催された「Scaling multi-tenant SaaS with a cell-based architecture」に参加したレポートをお届けします。 Cell-based Architectureとは... 続きを読む
Kubernetesって何? -大規模なKubernetesを運用するKubernetes as a Serviceチームの話を添えて-
本発表では、まずLINEヤフーについて簡単に説明した後、アプリケーションやシステムを外部に公開する際の負荷分散と耐障害性の重要性について話します。これらの課題を解決するための技術として、Kubernetesとコンテナ技術に焦点を当て、その基本的な概念と利点を解説します。 さらに、Kubernetes運用… 続きを読む
障害への不安をぶっ壊す!カオスエンジニアリングを運用しシステムとチームの耐障害性を高める - ZOZO TECH BLOG
はじめに こんにちは、計測プラットフォーム開発本部SREブロックの山本です。普段はZOZOMATやZOZOGLASSなどの計測技術に関わるシステムの開発、運用に携わっています。 我々のチームは、複数サービスを運用する中で障害対応の経験不足や知見共有の難しさといった課題に直面していました。そこで、半年ほど前にカオスエン... 続きを読む
マイクロソフト、Azureでの可用性ゾーン間のデータ転送料金を無料にすると正式発表
マイクロソフトは、Microsoft Azureにおいて、プライベートIPまたはパブリックIPを使用しているかに関係なく、可用性ゾーン間のデータ転送に課金しないことを正式に発表しました。 これにより低コストで高い耐障害性を備えたシステムの設計と構築が容易になるとされています。 可用性ゾーンとは 可用性ゾーンとは、Micro... 続きを読む
Dify の ワークフロー の概要|npaka
以下の記事が面白かったので、簡単にまとめました。 ・Workflow - Dify 1. ワークフロー1-1. ワークフロー「ワークフロー」は、複雑なタスクを小さな「ノード」に分割することで、LLMアプリケーションのモデル推論への依存を減らし、システムの説明可能性、安定性、耐障害性を向上させます。 「ワークフロー」の種類は、... 続きを読む
組織に対するカオスエンジニアリングの実践 - 変化に対応する組織をつくるための課題を探る「カオスWeek」という取り組み - Agile Journey
Agile Journeyをご覧いただき、ありがとうございます。本メディアの運営を担うユーザベースBtoB SaaS事業のCTOを務める林です。本メディアでは、これまで多くの方がアジャイルに関する経験、知見を披露してきてくれましたが、本稿では私たち自身のアジャイルの実践手段のひとつであり、「組織の耐障害性」を高める手段で... 続きを読む
小さなバグが生んだ悲劇、そこから学ぶ耐障害性の高いアプリ設計
会社の先輩とアプリ開発始めてみた!『Fearless Change』のパターンで振り返るサブプロジェクトの始め方 / How to start a subproject 続きを読む
N分N乗JTBCマン on Twitter: "ああああ・・・なんで変えちゃうの・・・ Suica改札はサーバーを介さないことで、首都圏の大量のトラフィックを高速で捌き、かつ、どれだけ障害が起きても「改札
ああああ・・・なんで変えちゃうの・・・ Suica改札はサーバーを介さないことで、首都圏の大量のトラフィックを高速で捌き、かつ、どれだけ障害が起きても「改札だけは通れる」耐障害性を実現した、JRとSONYによる奇跡のシステムだった… https://t.co/HbMyuBmmJ0 続きを読む
Suicaの新改札システムはようやっとキタ感が強いよねって話とか何ができるようになるのかとか耐障害性の話。 - O-Lab +Ossan Laboratory+
あー、やっとアーキテクチャ(システムの構造、の意)が完全に変わるんだ。っていう感想。 私が交通系ICカード開発の仕事に関わってたのがもう20年近く前で(正確には15〜6年前)その頃から今日まで全くアーキテクチャの基本構造が変わってなかったんですよ。 www.watch.impress.co.jp www.itmedia.co.jp 20年変わらない... 続きを読む
なぜ? 「Suica」がサーバ型に移行する理由 25年近く稼働する“安全神話”の象徴に何が
なぜ? 「Suica」がサーバ型に移行する理由 25年近く稼働する“安全神話”の象徴に何が(1/3 ページ) JR東日本はSuicaで新改札システムを導入し、これまで駅改札でローカル処理を行っていた運賃計算をサーバ処理に移管していく。改札機で計算することで高速処理と耐障害性を実現していたSuicaだが、なぜサーバ型に舵を... 続きを読む
Microsoft Azure、わざと障害を発生させてサービスの耐障害性を鍛える「Azure Chaos Studio」発表
マイクロソフトは、Microsoft Azure上で人為的に障害や性能低下などを発生させることで、アプリケーションの耐障害性を確認し改善できる、いわゆるカオスエンジニアリングを実現する新サービス「Azure Chaos Studio」をプレビュー版として発表しました。 カオスエンジニアリングはもともと、動画配信サービスのNetflixが... 続きを読む
AWSクラウドの耐障害性、可用性を高めるための前提知識 | フューチャー技術ブログ
TIGの伊藤真彦です。 最近会社のPodCastであるFuture Tech Castに出演させていただきました。聞いていただけると嬉しいです。 先日クラウドサービスの障害について社内で体系的に説明する機会があり、0から全体的なイメージがつかめるような情報を整理してみました。 まえがき、良質なクラウドサービスWebサービス、ITソ... 続きを読む
AWS、わざとクラウド障害を起こすサービス「AWS Fault Injection Simulator」提供開始 - ITmedia NEWS
AWS、わざとクラウド障害を起こすサービス「AWS Fault Injection Simulator」提供開始 米AWSが、わざとクラウドの障害を起こすことでアプリケーションの耐障害性を検証できるカオスエンジニアリング用サービス「AWS Fault Injection Simulator」の提供を始めた。 米Amazon Web Services(AWS)は3月15日(現地時間)、わ... 続きを読む
AWS、わざとクラウド障害を起こす新サービス「AWS Fault Injection Simulator」提供開始。カオスエンジニアリングをマネージドサービスで - Publickey
AWS、わざとクラウド障害を起こす新サービス「AWS Fault Injection Simulator」提供開始。カオスエンジニアリングをマネージドサービスで Amazon Web Services(AWS)は、わざとクラウドの障害を起こすことでアプリケーションの耐障害性を検証できる新サービス「AWS Fault Injection Simulator」の提供を開始したと発表... 続きを読む
[速報]AWS、クラウド障害をわざと起こす「AWS Fault Injection Simulator」発表。カオスエンジニアリングをマネージドサービスで実現。AWS re:Invent 2020 - Publickey
Amazon Web Services(AWS)は、開催中のオンラインイベント「AWS re:Invent 2020」で、アプリケーションに対してクラウド障害のシミュレーションを行える新サービス「AWS Fault Injection Simulator」を発表しました。 クラウド上で稼働するアプリケーションの耐障害性などを高める手法として実際にクラウド障害をわざ... 続きを読む
KubernetesのPodやネットワークをわざと落としまくってカオスエンジニアリングのテストができる「Chaos Mesh」がバージョン1.0に到達 - Publickey
KubernetesのPodやネットワークをわざと落としまくってカオスエンジニアリングのテストができる「Chaos Mesh」がバージョン1.0に到達 Kubernetes上のシステムに対してわざと障害を発生させることで、システムの耐障害性のテストを行うためのソフトウェア「Chaos Mesh」がバージョン1.0に到達したことを、Chaos Meshの開... 続きを読む
カオスエンジニアリングによる負荷試験を導入するクックパッドが学んだこと 耐障害性の仮説と検証 - エンジニアHub|若手Webエンジニアのキャリアを考える!
カオスエンジニアリング(Chaos Engineering)とは、稼働中のサービスにあえて擬似的な障害を発生させることで、システムの耐障害性を検証する手法です。動画配信サービスを提供するNetflix社が2011年ごろから実践し、ソフトウェアや情報を積極的に公開したことで世界中から注目されるようになりました。 国内ではまだ導... 続きを読む
Windows記憶域プール「双方向ミラー」(RAID1)の作成方法
Windowsの記憶域プール機能を利用することで、RAIDカード(RAIDコントローラ)などを取り付けずに、RAID同様のディスクの耐障害性(冗長化)やディスクアクセスの高速化が可能となります。当ページではWindows10の記憶域プール機能を利用した「双方向ミラー」(≒RAID1)の設定方法を記載しています。 「双方向ミラー」を... 続きを読む
Yahoo!メールのバックエンドシステムのリニューアル - Yahoo! JAPAN Tech Blog
こんにちは、ヤフーの大阪オフィスでメールサービスを担当しているエンジニアの城下です。 2015年から進めてきたYahoo!メールのバックエンドシステムの大規模リニューアル(以下、BEリニューアル)によって、どのように耐障害性を強化できたか、どんなメリットを得られたか、などを紹介します。 こちらの話は、先日、201... 続きを読む
Windows Server 2016でActive Directoryにドメインコントローラーを追加する。故障や障害に強い構成を作成
Active Directoryを運用している環境で、更に耐障害性と障害に強い構成にするために、2台目のドメインコントローラーを追加する手順をどこよりも細かく、丁寧に紹介しています。Active Directoryを1台のドメインコントローラーで構成している環境は、障害が発生したときに膨大なダウンタイムと労力が発生します。是非、2台目のドメインコントローラーを検討してください。今回は、Window... 続きを読む
IstioとKubernetesを使ったマイクロサービスの回復力と耐障害性
IstioとKubernetesを使ったマイクロサービスの回復力と耐障害性 いいね | 作者: Srini Penchikala Srini Penchikala フォローする 21 人のフォロワー , 翻訳者 編集部T 編集部T フォローする 0 人のフォロワー 投稿日 2018年2月14日. 推定読書時間: 3 分 | 共有 | 後で読む マイリーディングリスト IBMのAnimesh Si... 続きを読む
[速報]Amazon Aurora Multi-Master発表。マスターサーバの分散配置でライト性能がスケール、耐障害性も向上。AWS re:Invent 2017 - Publickey
「Amazon Aurora」は、2014年にAmazon Web Services(AWS)が、発表したエンタープライズ向けのリレーショナルデータベースサービスです。 それまでOracleなどの商用データベースが用いられてきた基幹業務向けデータベースの用途を想定し、クラウドに最適化した設計による高性能と高可用性を実現するサービスとして提供されてきました。 AWSは、米ラスベガスで開催中の年次イベ... 続きを読む
AWS、国内2カ所目のリージョン「大阪ローカルリージョン開設」を発表。耐障害性の高い単一のデータセンター。当初は招待制で2018年開設予定 - Publickey
Amazon Web Services(AWS)は、国内で2カ所目のリージョンとなる「大阪ローカルリージョン」を2018年に開設すると、5月30日から6月2日まで開催中のイベント「AWS Summit Tokyo 2017」の基調講演で 発表しました 。 大阪ローカルリージョンの「ローカルリージョン」とは、AWSのこれまでのリージョンとは異なるもののようです。 本リージョンは、ローカルリージョンと... 続きを読む
ASCII.jp:海底ケーブルからカスタムサーバーまでハミルトン先生が語る物理なAWS (1/3)
11月29日、ラスベガスにおいてAmazon Web Services(AWS)は年次イベント「AWS re:Invent 2016」を開催。2日目のナイトイベントに登壇したジェイムス・ハミルトン氏は、AWSを支えるインフラをケーブル、データセンター、ネットワーク機器、電気設備、ストレージ、サーバーのレベルまで解剖し、可用性・耐障害性への注力をアピールした。 AWS VP、Designated E... 続きを読む
第12回 複数のプロセスにおける協調動作のための仕組み─コーディネーション:Hadoopはどのように動くのか ─並列・分散システム技術から読み解くHadoop処理系の設計と実装|gihyo.jp … 技
はじめに 前回は,分散システム技術を基本とする耐障害性のための仕組みとして,レプリケーションとロギングについて述べました。今回は,分散システムにおいて複数のプロセスが協調して動作するための仕組みであるコーディネーションについて,その概要を説明します。 コーディネーションとは 並列データ処理系におけるコーディネーションは,複数のプロセス間において,協調して動作をする,または,同意を取るための技術です... 続きを読む