如您所知,网站全天候运行-监控.html“>AWS监视功能提供了对关键计算资源、存储、资源利用率和性能的全面了解,以及在Amazon Web services(AWS)云中为应用程序提供动力的数据库服务。从现在起,您不仅可以识别可能影响应用程序性能的问题,而且可以跨多个AWS资源自动调用操作任务,以快速解决这些问题
在我们了解各种预定义的自动化以及如何最好地使用它们的策略之前,我们需要更多地了解组成我们的IT自动化框架
您可以创建一个自动化配置文件,作为主动监视策略的一部分,在该策略中,您可以创建故障保险(如触发重新启动)以减轻系统损坏,或者作为成本优化策略的一部分,在该策略中,您可以识别未充分利用的资源,并通过停止这些资源来节省资金
当Amazon检测到硬件或软件问题时,您可以选择重新启动EC2实例。使此重新启动操作更加强大的是,您可以将其与内存使用量(Site24x7作为其增强的一部分提供的仅限于代理的指标)相关联EC2监视功能),用于检测内存泄漏并在应用程序的性能开始下降
通过对使用情况数据的可见性,您可以确定为运行应用程序而配置的计算和数据库资源是否符合实际需求。要控制自配置的云使用并优化您的环境,您可以建立自动化来监视资源使用情况统计信息、检测未充分利用或未使用的实例,并关闭它们。此外,如果您是AWS托管服务合作伙伴,请利用Site24x7&\39;sMSP平台来监视您的客户环境,然后您可以将这些停止自动化配置文件分配给被监视的资源,以帮助减少实例时间和降低运营成本
如果您正在运行诸如媒体转码之类的批处理计算作业,那么您配置的按需EC2实例将只在特定时间段内满负荷运行。在这种情况下,您可以设置阈值来监视度量数据点,包括平均CPU使用率和网络I/O,并分配一个自动化配置文件,以便在度量数据达到您定义的级别时自动停止EC2实例。这样,未充分利用的实例将不会闲置并累积每小时的费用
如您所知,Site24x7已经提供了许多方法来通知您停机。通知选项的范围从传统的通知渠道(如电子邮件、短信和聊天应用程序)到使用webhook触发定制的HTTP回调。通过包含对Amazon Simple Notification Service(SNS)的支持,您可以触发到以前创建的SNS主题的自定义消息,然后触发订阅该主题的所有端点)以实现灵活的警报
如果预定义的操作不能剪切它,那么可以编写Lambda函数,并在达到阈值时自动调用它,以便获得所需的响应。例如,您可能正在开发环境中运行RDS数据库实例;为了节省成本,您可以编写一个Lambda函数来创建快照并终止实例。然后,您可以创建一个操作配置文件,以便在RDS性能指标“连接”低于指定值时调用此函数
你还在等什么?注册30天免费试用站点,设置自动化,跟踪并自动响应警报事件,释放您的运营潜力!在