在高性能工作负载中使用云计算的情况正在上升。现在大多数云提供商提供的最先进的CPUs、GPUs、高性能存储和网络的HPC节点。尽管如此,决定是否使用云计算也突然变得棘手。在这篇短文,我们讨论五个关键考虑因素,来帮助你决定云计算是否适合你的业务。
(云计算)
1、计算真实成本
云计算比管理本地服务器便宜是公共认知。虽然经常是真的,这也不是一直在任何情况下都正确,花些时间比较成本是值得的。
在云计算中运行的好处是令人信服的。您可以随时添加或删除最先进的基础设施,避免头痛的软件安装和硬件故障的排除,降低供应商管理成本,避免为闲置资源付费,而且不用考虑不断贬值的资本资产,您就能享受灵活的基于消费的定价云计算。您还可以从各种各样的驻留云服务(如语音到文本转换器或图像识别方案)中获益,这些服务在本地部署成本高的离谱。
云提供商通常根据实例类型、虚拟CPUs(vCPUs)的数量和可用的内存和存储来销售服务器实例。预约一个Amazon Web Services(AWS)高性能的c5d.9xlarge实例目前的成本为每小时0.558美元。在这个价格点上,一个20个节点集群(由720个vcpu、1.44 TB RAM和10 TB的SSD组成)将花费您每年10万美元。即使在考虑了电力、冷却和设施成本之后,云中的长期资源使用通常比本地部署更昂贵。
然而,在云爆发的场景中(下面讨论),或者在需要几个星期或几个月的专业资源的情况下,经济性的决定更偏向于云计算。
当在云中规划容量时,要确保你能做对等比较。云vCPU通常对应于超线程核心上的单个线程,因此,在所有条件相同的情况下,您可能需要比本地核更多的云vCPU来获得同等的吞吐量。另外,要谨慎地假设云计算将降低人员成本。虽然基于云的工具可以提高效率和避免一些成本,但是除非您运行的是纯软件服务(SaaS)环境,否则您仍然需要熟练的技术人员来管理基于云的系统和应用程序。
尽管有这些谨慎,但在大多数情况下,优点胜过缺点。使用得当,云计算可以帮助大多数组织简化他们的环境并降低成本。
2、数据中的魔鬼
除了成本之外,当考虑迁移到云时,数据的数量和性质是另一个考虑因素。
大多数云提供商都提供了多种存储选项,包括块存储、对象存储、数据库、在某些情况下得共享文件系统的方案。大型存储环境可能难以管理和备份,因此云存储可能具有吸引力,并有助于避免显著的复杂性。有各种各样的解决方案可以有效地同步本地和驻留云集群之间的数据。
区块存储的月成本从每GB每月约0.05美元到0.13美元不等,这取决于你选择的是磁盘还是更昂贵的固态存储器。按照这个价格,在云中存储50 TB的数据将花费在每月2500美元到6500美元之间。对象存储更便宜(在相同数量的数据的每月1000美元以内),但是如果您打算使用对象存储,您可能需要修改您的应用程序或工作流。
不要低估将大型数据集迁移到云上的挑战。尽管云提供商通常不收取导入数据的网络费用,但移动大型数据集并非微不足道。有了专用的1 Gbps连接和一个WAN优化方案,达到700 Mbps是最好的情况,这样传输1 TB数据的时间也超过3个小时。大多数云服务提供商也提供物理数据传输解决方案,对于像视频库、图像存储库或基因组学数据这样的大型数据集的初始传输非常有用,但这也是有代价的。
根据经验,将处理程序靠近您计划的存储大型数据集的地方是个好主意。虽然云数据管理解决方案可以解决大多数应用程序,但数据需求可能要求至少一些应用程序保持在本地。
3、突发
HPC中的一个常见用例是“云突发”。根据您的应用程序,您可能需要大量的计算能力,但只是周期性的或短时间的。与其让资产闲置,不如在本地维护一个更小的集群,并在“突发”时需要云容量是更划算的。
如上所述,云突发的可行性将取决于您的应用程序和数据。对于一些工作负载,比如在各种情况下为保险产品的盈利能力建模,或者运行一个大型的计算流体动力学(CFD)模拟 (中间数据可能很大,但是模型本身相对较小),云突发可以是一个很好的解决方案,可以获得显著节省成本,并提升生产力的好处。
如果你在运行商业软件,软件许可是另一个考虑因素。虽然ISV的许可对云更加友好,但是检查许可是否可以与您选择的云提供商一起使用,并且供应商支持适合于云突发的场景的基于使用定价,这才是一个好主意。
有效云突发的关键是自动化。部署和销毁云应用程序环境的过程需要对最终用户是可靠和透明的。人们的成本往往主导着基础设施成本,如果要在云计算中建立一个工作环境需要数小时或数天的手工工作,那么任何财务上的好处都会很快消失。理想情况下,云突发应该与您的工作负载管理器集成,这样您就可以控制哪些应用程序更适合进行突发,并使其过程和应用用户无缝地对接。
4、关注您工作负荷的多样性
根据您所处的业务,您可能会运行数十个应用程序。例如,CAE环境可以运行各种商业和开源模拟器,用于有限元素分析、动态模拟和CFD。有了本地部署的集群,所有这些应用程序通常都共享相同的基础设施,尽管有些主机类型可能更适合某些工作负载。
对于特定供应商的工具,托管应用程序服务(软件即服务)听起来很有吸引力,但用户需要小心。在追求简单性的过程中,通过为垂直式的重复基础设施付费,很容易放大成本。理想情况下,云环境应该支持您的所有工作负载。一些应用程序在本地运行,而另一些则在云中运行的混合方法是很有效的,但是重要的是要对所有的应用程序进行评估,并避免在工作流变得更加复杂、不可靠或由于需要的本地和云之间来回传输数据而减慢的场景出现。
虚拟化和容器技术正在帮助解决这一挑战,随着越来越多的应用程序可以部署在容器中,跨云的可移植性和管理应用程序的多样性正变得越来越不是一个重要的问题。
5、安全与监管问题
在一个对一系列网络威胁越来越关注的时代,对于大多数组织来说,安全是最重要的。虽然安全性是一个真正的问题,但这是云计算可能受到严重影响的一个领域。因为恶意行为者发送的、穿越internet的数据包不区分本地数据中心和公有云——他们只看到路由器和防火墙以及它们是如何配置的。
这就是在IT界常说的:“安全不是你买的东西,而是你练习的东西。”这是一个很好的赌注,大多数主要的云服务提供商在保护网络和系统方面比他们的公司It兄弟更成熟。”也就是说,云用户仍然有责任充分利用可用的工具来帮助他们保护环境。这些工具包括防火墙、证书管理、跨VLANS的服务器适当分割、专用实例或专用主机、网络和文件系统加密等。
根据他们的业务,组织可能会受到法律和法规的约束,包括HIPAA、PCI、GDPR或各种财务需求。保护数据的失败可能导致严重后果。在分析和人工智能(例如机器学习模型训练)中,新兴的高性能应用程序越来越多地在监管所覆盖的数据集上运行。对一些应用来说,监管可能不是一个令人担忧的问题,但企业仍然担心保护自己的知识产权。
无论数据驻留在企业数据中心还是在云提供商,组织都要对满足监管要求所负责。管理云服务提供商的诀窍是确保您将所有适用于您的业务的法律和法规要求都应用到您的供应商。
企业需要对云提供商进行尽职调查,考虑到它们的财务稳定性、数据中心的物理安全、灾难恢复计划以及技术专长水平等问题。尽管风险是真实且重要的,但无论谁运营基础设施,它们都可能存在。
了解更多资讯就到金睿教育官网www.jinruiedu.com
本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:我们究竟如何考量云计算是否适合自己的业务? - Python技术站