AWSは、他のプロバイダーと同様に、以前はダウンしています。自身の停止から共有する教訓が迅速にあります

Fastlyの半ば-2021停止にはかなりの時間がかかりましたオフラインのサイト。チーフプロダクトアーキテクトのSeanLeachが、停止が引き続き発生すると考える理由と、自分のリスクを軽減する方法について説明します。

“href =” https://www.techrepublic.com/a/hub/i/r/2021/12/10/ bb119322-281a-493a-8f0c-3cdc569308cd /サイズ変更/770x / f5028213f3eeb379c917300d9675be84/シャッターストック-91288505。jpg “target =” _ blank “>shutterstock-91288505.jpg

画像:Shutterstock / SGM

「最後からの日数」をリセットする時が来ましたAWS本社で「停止」のサインが再び表示され、Webホスティングの巨人が最新の大規模な停止を分析しているところです。今回は、Disney +やNetflixなどのサイトが停止しました。

AWSバスケットには多くのデジタルエッグがあり、残念ながら大規模な停止が驚くほどの規則性で発生しています。ただし、AWSだけではありません。エッジクラウド企業は6月8日に急速に停止しました2021、それはAWSの停止と同様でしたが、それ以外の理由でいくつかの主要なWebサイトがオフラインになりました。

見る: 採用キット:クラウドエンジニア(TechRepublic Premium)

最新のAWSの停止は、まだ少し謎です。私たちが知っているのは、12月7日火曜日に、AWSUS-East-1がオフラインになったということだけです。これはたまたまAWSの最大のデータセンターであり、Amazonの顧客だけでなく、社内の運用にも影響を及ぼしました。 AWSによると、その日の後半の時点で、サービスは復旧しました。

Amazonは、主要なWebサイト、IoTデバイス、およびその他の重要なオンラインサービスをオフラインでノックした停止について、CBS Newsが「簡潔な技術的説明」と説明したことを除いて、停止に関する詳細についてはまだ説明していません。 。 FastlyのチーフプロダクトアーキテクトであるSeanLeachは、AWSの停止の原因については推測しませんが、Fastly自身の6月8日の停止と、Fastlyから学んだ教訓をコンテンツ配信サービスとクライアントの両方に適用する方法について多くのことを述べています。それらを利用してください。

Fastlyの停止は、前月のソフトウェア展開によって導入されたバグが原因でした。バグには非常に特殊なトリガー条件があり、「特定の状況下での特定の顧客構成」によってのみトリガーされる可能性があります、とエンジニアリングおよびインフラストラクチャのFastlySVPであるNickRockwellは述べています。これらの特定の状況に対応するクライアントが、バグをトリガーしてを取得した有効な構成変更を送信したことが判明しました。 Fastlyのネットワークの%がオフラインです。エラーを迅速に発見し、サービスを復元し、同じ日に恒久的な修正を展開しました。

インターネットは車であり、車はメンテナンスが必要です

インターネットの停止が続いているため、疑問が生じます。なぜですか。そして、根本的に何か問題がある場合、インターネットを再構築する必要がありますか?

いいえ、リーチ氏は言った、そしてインターネットもそもそもうまく構築されていた、と彼は付け加えた。インターネットを、権威を争う異種サーバーの塊として考えるのではなく、インターネットを自動車のように可動部品でできたシステム全体として考えてください。

「あなたは自分の車を所有しています。あなたは運転しているので、オイルやその他の液体を交換したり、タイヤを回転させたりすることを確認してください…時々、道路から飛び出して粉々になる岩があります。あなたのフロントガラス、そして今あなたはその予期しない状況に立ち止まって対応しなければならない」とリーチは言った。

リーチは、インターネットの設計に根本的な欠陥はないと言っています。むしろ、彼はそれが当時誰もが思っていたよりもはるかにうまく機能した方法で、その存在の初期に「美しく設計された」と説明しています。はい、物事はうまくいきませんが、それぞれの間違いは、失敗のポイントを学び、排除するチャンスです。

自身の停止から迅速に学んだこと

停止と復旧プロセスから1つの大きな教訓をすばやく学んだ場合、リーチ氏は次のように述べています。透明性が報われるということでした。 「透明性は常に重要な重点分野でした[at Fastly]。停止に対応するために公開したブログでは非常に透明性が高く、お客様は私たちの対応に非常に協力的でした」とリーチ氏は述べています。

リーチ氏によると、透明性は、会社がその過ちとその過ちにどのように対応するかについてオープンであることに利益をもたらすだけではありません。また、将来同様の状況に直面する可能性のある業界の他のすべての人にもメリットがあります。

参照:Microsoft Power Platform:それについて知っておくべきこと(無料のPDF)(TechRepublic)

Tech Twitterを長い間利用している場合は、意味を表す俗語である「HugOps」という用語を聞いたことがあるでしょう。同様の課題を経験したときに技術専門家がお互いに抱く共感の。リーチ氏によると、HugOpsの一部は支援できるという。企業が停止について正直である場合、HugOpsは単にレポートを共有するという単純な問題になり、他の組織の復旧時間を迅速に短縮できます。

「マイク・タイソンの言葉を引用すると、 『誰もが顔を殴られるまで計画を立てている』とリーチ氏は語った。簡単に言えば、私たち全員が互いに助け合うことで、インフラストラクチャが必然的に直面するであろうパンチへの対応を大幅に改善することができます。

インターネットを修正する方法…?

Leachは、Fastlyが検討している2つの大きなことに焦点を当てていると述べましたインターネットの停止の頻度を減らす方法として。

まず、Fastlyは、重要なインフラストラクチャの多くをRustやWebAssemblyなどのメモリセーフな言語に移行しています。 「大規模なクラウドインフラストラクチャ、1秒あたり数テラビットのトランザクションを実行しているもの…その多くはCおよびC ++で記述されています。これらは早い段階で優れた言語でしたが、他の言語と同様に、最終的にはより良い方法を見つけました」とリーチ氏は述べています。

次に、リーチは、周期的であると彼が説明するDDoS攻撃が増加していることを警告します。これに対する対応は、トランザクション容量を増やして、DDoS攻撃が与える可能性のある影響を減らすことです。 「攻撃が大きくなるだけでなく、より複雑になることもあります。攻撃者が何をしているのかを知るには、容量と脅威インテリジェンスに遅れずについていくことが不可欠です」とリーチ氏は述べています。

これらの停止に苦しんでいる可能性のある企業に関して、リーチ氏は、すべての企業に対する彼の最大のメッセージは、クラウドをあきらめないことであると述べました。

「人々が何年にもわたって独自のインフラストラクチャを運用してきたすべての停止と、インフラストラクチャからの復旧がいかに難しいかを考えてみてください。クラウドプロバイダーに切り替えると、多くの専門家にアクセスできるようになります。インフラストラクチャとセキュリティの両方の側面から、迅速に対応し、問題を解決して修正します」とリーチ氏は述べています。

それは冗長性を無視する必要があるという意味ではありません。リーチ氏は、地理的なフェイルオーバーを行うことが重要であると述べていますが、クラウドの安定性に関するすべてのヘミングとハミングはリスクに帰着するとリーチ氏が述べた大きな理由の1つとして、クラウドは依然として最良の選択肢となるでしょう。

「各組織は、セキュリティの場合と同じように、リスクのレベルを選択する必要があります。クラウドで取るリスクのレベルを選択することも、リスクを完全に無視することもできます。」リーチ言った。

見る: iCloudとOneDrive:Mac、iPad、iPhoneのユーザーに最適なのはどれですか? (無料PDF)(TechRepublic)

Leachは、リスクを理解するとともに、クラウド環境が直面するリスクを特定する際に、誰もがすべきもう1つの重要なことを述べました。攻撃対象領域を理解するのと同様に、クラウド表面を理解するということは、どのAPIがどこで実行されているか、どのサービスがどのプロバイダーによって管理されているか、サーバーがどこにあるか、どのプログラミング言語が使用されているかなど、稼働時間を危険にさらす可能性のあるものを知ることを意味します。

セキュリティ体制を改善するための通常のアドバイスはクラウドにも当てはまるとリーチ氏は語った。ドリルを実行して停止をシミュレートし、クラウド環境内のすべてのインベントリを作成します。それ以外の場合は、マップを作成して、避けられないものを専門的に特定し、即座に対応できるようにします。パンクしたタイヤ、フロントガラスの欠け、その他の予期せぬ災害として。

Cloud and Everything as a Service Newsletter

これは、XaaS、AWS、Microsoft Azure、Google Cloud Platform、クラウドエンジニアリングの仕事、クラウドセキュリティのニュースとヒントの頼れるリソースです。月曜日に配信

今日サインアップする

も参照してください

  • マルチクラウド:チートシート(TechRepublic)
  • Apple iCloud:チートシート(無料のPDF)(TechRepublic)
  • 調査:ビデオ会議ツールとクラウドベースのソリューションがデジタルワークスペースを支配しています。 SMBであまり人気のないVPNとVDI(TechRepublic Premium)
  • クラウドコンピューティング:必読のカバレッジが増えました(TechRepublic on Flipboard
  • Related Articles

    Back to top button