用于管理和故障排除的云自动化用例

用于管理和故障排除的云自动化用例
2020年11月26日 14:56 TechWeb

原标题:用于管理和故障排除的云自动化用例

【TechWeb】由于基础架构由服务提供商拥有,因此对云环境进行管理和故障排除可能具有挑战性。让我们研究一些使您的云管理更容易解决的方法。

首先,考虑云自动化用例。尽管所提供的特定功能将取决于云供应商,但这些可以简化对云实施的监督。有些人隐藏了云API之间的差异,如果您考虑使用多云或混合云部署,那么这将是一个好处。市场上有许多多云的编排工具,对于那些想要推出自己的公司的公司,也可以使用Ansible和Python等开源软件包。

无论采用哪种方法,请确保它充分掩盖了云供应商之间的差异。只需确保您选择的工具不会隐藏太多细节,以免掩盖了进行精确故障排除所需的可见性。

使用工作流程管理云

自动化通用工作流程将成为您最有价值的机制。供应,取消供应,审核和故障排除等任务至关重要。支持敏捷软件开发的组织将使用支持持续集成以及持续交付和部署的工作流。您可以部署的自动化程度越高,管理云计算资源所需的人工工作就越少。

云管理应集中在以下五个领域。

1.减少费用

使用云提供商的优势之一是,与维护物理基础架构相关的任何费用都将转移给提供商,但是这种好处只有在正确管理流程的情况下才能获得回报。为此,必须将IT系统和流程设计为根据需要自动配置和取消配置资源,从而将手动交互降至最低。所谓的僵尸IT可以轻松消耗预测的节省。

2. IT安全

对云计算的一个普遍误解是,它在某种程度上比企业托管的计算更安全。不是。实际上,它提出了一些新的挑战。为了确保您的数据受到保护,请与安全公司签约,后者可以提供经过验证的产品来保护飞行中的数据和静止数据。在所有云自动化用例中,创建和维护良好的云安全性是最明显的。

3.表现

如果没有正确设计和实施云计算环境,则应用程序性能可能会受到影响。应用程序的关键部分应由单个云提供商提供服务,以最大程度地减少组件之间的通信延迟。可以利用多个云实例的应用程序可以优化客户端到云的位置选择。

监视云性能的一种方法是通过OpenTelemetry云可观察性框架。它是一个开源的,与供应商无关的系统,用于从云计算系统收集遥测数据。收集度量和日志的软件代理已加载到计算系统上。收集到的数据被转发到可以分析系统性能的各种分析系统。请与您的云提供商联系,以查看是否受支持。

4.弹性

好的云计算设计将融合一个基础,该基础要求在多个可用性区域或由多个云提供商运行应用程序。但是要小心;很容易出错,并且发现应用程序依赖于被忽略的非冗余内部组件。验证弹性的最佳方法是运行主动测试。考虑外部组织来验证测试;我们经常看到测试快捷方式使弹性测试无效的情况。

5.故障排除

对您不拥有或无法控制的基础结构进行故障排除具有挑战性。无法获取用于对企业网络进行故障排除的数据;相反,用户必须依靠数字体验(DX)监视,将综合事务和实时流量监视结合在一起。

详细的诊断信息由软件代理捕获并进行关联,从而生成了客户端到服务器应用程序性能的全面视图。在NetCraftsmen,我们使用DX工具来诊断各种问题,这些问题包括ISP路由协议问题和客户端Wi-Fi信号强度,而所有这些都无法访问所涉及的网络和网络设备。

寻找最有效的方法

另一个步骤涉及使用ChatOps自动化工作流来简化故障排除过程并减少解决时间。当检测到问题时,机器人会运行预定的工作流程来收集诊断信息。该机器人将诊断信息发布到Slack或Teams聊天空间中,例如,IT团队成员可以在其中开始故障排除过程。可以根据需要创建更多的bot工作流,从而使IT团队不必手动调查或收集性能数据。

从企业计算向云计算的转变带来了挑战和机遇。您不仅可以采用企业中有效的方法,还可以将这些系统和工作流程迁移到云中。所需要的是仔细评估云自动化用例,以确定哪些工具将使您能够按需扩展资源,同时避免手动流程中固有的错误。【TechWeb】

自动化云计算
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片