PagerDuty 宣布新的 AWS 集成,支援 CloudWatch、GuardDuty、CloudTrail 和 Personal Health Dashboard
正如您所期待的,作為一家由前亞馬遜員工創立的公司,PagerDuty 多年來一直在協助 AWS 用戶自動將任何信號轉化為正確的洞察和行動。我們的 Amazon CloudWatch 集成使團隊能夠主動緩解影響客戶的問題,這反過來讓組織能夠自信地創新和擴展他們的 AWS 及混合環境。
今年早些時候,我們宣布 PagerDuty 訂閱現已透過 AWS 市場及 AWS 市場的企業合約為 AWS 客戶提供。本週在拉斯維加斯的 AWS re:Invent 上,我們很興奮地分享 PagerDuty 正在推出全新的 AWS 集成,支援 CloudWatch 事件、GuardDuty、CloudTrail 和 Personal Health Dashboard。
亞馬遜 CloudWatch(事件和警報):AWS 服務的門戶
AWS 用戶依靠 Amazon CloudWatch 提供的性能數據,以監控他們作為整體 AWS 生態系統一部分部署的 AWS 服務的狀態。利用公共雲資源並不意味著用戶可以忽視支撐它們的服務器的狀態和性能;實際上,隨著公司將關鍵應用遷移到 AWS,監控各種工具的使用變得越來越重要。
PagerDuty 與 CloudWatch 警報的集成,我們的共享客戶已經使用了一段時間,允許用戶通過設定自定義的高分辨率警報閾值來監控資源利用率(例如內存優化)。當這些警報被觸發時,可以通過 PagerDuty 啟動任何需要的解決自動化。這是一個非常強大的組合——毫不奇怪,這是 PagerDuty 提供的最受歡迎的集成之一,如果不是最受歡迎的。
儘管 CloudWatch 警報是一個非常有用的工具,但它只監控特定時間段內的單一指標,並根據該指標相對於時間閾值的值執行一個或多個指定動作。換句話說,警報一次性發生,在特定時間點。本週在 AWS re:Invent 上,我們很興奮地推出 CloudWatch 事件,這是一個新的 AWS 集成,補充了我們的 Amazon CloudWatch 警報集成。
CloudWatch 事件是描述 AWS 資源變更的系統事件流,增強了 CloudWatch 收集的指標。您可以將“事件”理解為對您的 AWS 環境及其支撐服務的任何變化。
對於現代的 ITOps 和 DevOps 團隊來說,跟踪變化對於維持您的生態系統的連續性和性能至關重要。例如,團隊需要知道 EC2 實例從“等待”變為“運行”的狀態變化。他們還需要知道實際發生了多少“擴展”與“自動擴展”。此外,AWS CloudTrail 結合 Amazon CloudWatch,使您能夠跟踪例如 API 調用等事項。
通过在 CloudWatch 警报之上增加 CloudWatch 事件集成,PagerDuty 使团队能够基于更全面的 AWS 数据自动化其数字操作。它还允许 PagerDuty 客户利用更多 AWS 服务的数据,
包括:
- Amazon EC2 实例
- AWS Lambda 函数
- Amazon Kinesis 数据流中的流
- Amazon Kinesis Data Firehose 中的传输流
- Amazon ECS 任务
- Systems Manager 运行命令
- Systems Manager 自动化
- AWS Batch 作业
- Step Functions 状态机
- AWS CodePipeline 中的管道
- AWS CodeBuild 项目
- Amazon Inspector 评估模板
- Amazon SNS 主题
- Amazon SQS 队列
无论您的公司使用本地服务器、AWS、Azure、Google Cloud 还是任何混合基础设施的组合,PagerDuty 都能收集来自您基础设施的关键信号,并利用它们实现实时操作。
Amazon GuardDuty
如今,常听到“安全是每个人的责任”这句话,这与 AWS 的“共享责任”模型很好地对齐。安全是每个人的工作——而 PagerDuty 与 Amazon GuardDuty 的集成通过自动化响应工作流程,以及减少上升到安全专家的摩擦,帮助将安全所有权带给开发者。Amazon GuardDuty 允许用户持续监控可能影响组织的 AWS 生态系统及其上构建的应用的任何恶意或未授权行为。例如,虽然一个意外的 API 调用或可能受到威胁的实例可能没什么可担心的,但最好收集这些信息以便进行更深入的分析。
这就是 PagerDuty 和 DevSecOps 发挥作用的地方。在 CloudWatch 中收集以机器为导向的输出只是第一步——您仍然需要一个工作流程来确定威胁的性质、其总体影响以及采取的正确行动。当 Amazon GuardDuty 检测到威胁时,PagerDuty 会自动通知正确的人员关于关键安全问题,根据您的响应规则。此外,您的团队可以通过使用 PagerDuty 事件情报将威胁与其他问题分组,为您提供解决问题的正确上下文,而不是被类似的警报淹没。所有这些都可以通过与您的各种记录系统(例如 Jira、ServiceNow、Remedy 或 Cherwell)的无缝集成来完成。
Amazon Personal Health Dashboard
AWS 有很多服务。在本周的 re:Invent 上,他们可能还会推出更多服务。虽然这些新服务为 AWS 用户提供了更大的灵活性和能力来构建和支持新软件,但它使得跟踪您的组织所关心的 AWS 服务、地区和区域的当前状态变得更加容易。这里有一个仅针对北美的 AWS 服务健康仪表盘的滚动。
AWS 了解这个问题,这就是 AWS 个人健康仪表盘的用武之地。整体服务健康仪表盘为您提供了 AWS 服务的一般状态视图,但个人健康仪表盘提供了一个个性化的视图,展示了您的团队日常使用的 AWS 服务的性能和可用性。这些您实际关心的服务的警报很有帮助——但您仍然需要利用这些知识做些什么。
新的 PagerDuty AWS 个人健康仪表盘集成让您摄取这些数据,然后自动化如何、何时以及与谁采取步骤解决任何问题。团队然后可以用引起问题的确切 AWS 服务增强支持剧本和票据,为组织中的每个人提供快速解决 AWS 服务中断的所需信息。
如果您正在参加 re:Invent 并希望了解更多关于个人健康仪表盘和 PagerDuty 集成的信息,请查看 AWS 提供的以下会议:
- 会议:使用 AWS 支持工具优化性能并降低风险(ENT316-R)
- 日期和时间:11月26日星期一下午4点
- 地点:贝拉吉奥酒店,1楼,大宴会厅6
- 会议:使用 AWS 支持工具优化性能并降低风险(ENT316-R1)
- 日期和时间:11月27日星期二上午11:30
- 地点:幻影酒店,幻影活动中心 C3
AWS CloudTrail
AWS 和最终用户之间的另一个共享责任是合规性、治理和操作审计。仅仅因为服务器不在您的数据中心,并不意味着您可以忽视那些工作流程。AWS CloudTrail 帮助用户启用其 AWS 生态系统的治理、合规性、操作审计和风险审计。
透過 PagerDuty 的新 AWS CloudTrail 集成,團隊可以收集完整的 AWS 事件歷史記錄,用於 DevSecOps 操作,根據需要自動化操作,並與像 Jira 和 SNOW 這樣的記錄系統無縫整合。PagerDuty 使相關性和分組與其他正在進行的問題並行,為 DevOps 和 DevSecOps 團隊提供他們需要的上下文,以切割操作噪音。例如,團隊可以識別在 Amazon S3 中是否發生潛在的數據外泄,或者當 Amazon Virtual Private Cloud 中的安全組規則發生變化時立即得到警報。在這兩個例子中,PagerDuty 都可以用來實時自動化正確的響應。