随着人工智能的成熟和规模化,各组织必须决定:这些高密度工作负载将在哪里运行?
对许多人来说,人工智能起源于云端,但它不会永远停留在云端。 数据中心和基础设施团队正在意识到,当所有 AI 处理都推向超大规模设施时,将会带来延迟、成本和控制方面的权衡。
因此,越来越多的 AI 工作负载正在回归企业和托管环境。 但这种转变存在一个问题:这些环境是在人工智能应用之前很久就建造的,它们的电力和冷却方案无法应对这种密度。
并非所有组织都有资金(或意愿)在每次人工智能需求激增时都建造新的数据中心空间。 而且,尤其是在企业内部,他们的团队既没有专业知识也没有时间为每个新项目设计新的高密度解决方案。
决定人工智能居住地时需要考虑的因素
企业开始部署人工智能时,最初大量依赖云和超大规模提供商是合理的。 产能充足,资源可以快速扩展,试点项目试验速度快、风险低。
随着人工智能从小型、封闭的概念验证发展到大规模、始终在线的服务,异地运行工作负载并不总是支持快速、可靠访问的最佳方式。’ 这就是为什么越来越多的团队正在寻找方法,以在他们已经运营的数据中心内满足人工智能需求。’
数据中心和 IT 领导者在决定哪些 AI 工作负载应该在哪里运行时,需要考虑三个因素:AI 服务需要多快的响应速度、它们与什么类型的数据交互以及它们的长期成本和容量需求必须有多可预测。
1. 人工智能需要多快做出反应?
许多人工智能应用对延迟非常敏感,这意味着它们需要快速、稳定的响应时间才能有效发挥作用。 这包括以下应用:
- 金融交易中的欺诈检测
- 智能建筑控制系统可根据入住情况和环境条件调节供暖、制冷和照明。
- 面向客户的数字体验中的实时个性化
- 智能校园运营协调各建筑物的能源使用、空间利用和服务
在这些情况下,将数据发送到远程数据中心并等待响应可能会增加运营无法容忍的延迟。
将人工智能堆栈的一部分移至关键数据生成和使用的位置附近,有助于减少延迟,从而保持性能和用户体验。
2. 人工智能在哪些领域运行最具经济效益?
成本是促使人工智能重返企业和托管设施的另一个因素 。 全天候运行的高密度 GPU 集群在云端托管成本可能很高。
许多组织会遇到这样的情况:将某些工作保留在超大规模环境中,同时将关键任务工作负载迁移到他们控制的基础设施中,这在财务上是合理的。 原因:成本和产能规划更可预测。 团队可以更好地预测硬件生命周期内的支出,避免意外的消耗高峰,并管理预算和升级。
3. 人工智能需要使用哪些类型的数据?
人工智能依靠训练和推理将原始数据转化为对企业至关重要的决策。 这些活动涉及大型敏感数据集,由于法规、内部政策甚至客户期望等原因,企业并不总是希望将数据集迁移到外部环境。
在企业或托管数据中心运行 AI 可以帮助组织通过保持关键数据在附近来保护数据,简化合规性并减少与数据来回传输相关的运营开销。
将现有数据中心空间改造为人工智能
将人工智能引入企业内部意味着要求电力、冷却和空间有限的场所来满足一系列新的要求。
虽然一些数据中心 可能还有空间容纳更多机架,但这些机架现在都装满了 GPU,每个机架消耗的电量是空间设计容量的数倍。 如何额外提供 20 kW 至 40 kW 甚至更多功率,以及如何消除机架上的相关热量,则是另一回事。 传统的冷却方式是针对传统负载设计的,但往往难以将高密度 AI 集群保持在安全的工作范围内,同时又不会导致房间其他部分过冷或产生热点。
应对不断变化的需求的关键
除了应对高密度部署问题外,将部分人工智能引入公司内部的团队还必须规划出灵活性。 人工智能发展迅速,其电力和散热需求也在快速变化。
随着需求的增长,数据中心运营商需要能够增加或改变高密度计算能力,而无需每次都重新考虑整个空间。
这意味着要部署能够实现以下目标的解决方案:
- 支持更高的机架密度
- 与旧设备共存
- 兼容多厂商服务器、存储和网络设备
- 无需进行全面机械检修即可部署在特定通道或舱位中
- 尽可能与现有的电力和冷却基础设施连接
- 根据产能需求,以模块化、可重复的“模块”进行扩展。
为机架引入冷却技术有助于人工智能发展
随着密度的增加,采用机架级电源和冷却方法至关重要;AI 集群将更多电力集中在更少的机架中。 机架级冷却不是让整个房间吸收热负荷,而是将热负荷转移点转移到机架上。
后门热交换器从源头上解决了这个问题。 冷却后门可以捕获并带走机架排出的热量,而不是让热废气泄漏到房间里。
对于改造项目而言,这尤其重要。 后门和其他机架级解决方案通常可以添加到现有机架中,而不会对运行环境中的机器造成太大干扰。 您可以根据需要,在需要的地方和时间增加密度,以支持关键工作负载。
Belden 和 OptiCool 助力构建人工智能就绪型基础设施
为了应对这些挑战,Belden 和 OptiCool 正在合作创建集成的机架级解决方案,使企业和托管运营商能够在现有设施或新设施内支持高密度 AI 工作负载。
通过将 OptiCool 的后门热交换器与 Belden 的机架和机柜集成,现在可以将先进的冷却技术直接带到机架上,从而提供可靠、可扩展、支持 AI 的数据中心运营。 配合 Belden 的高速、低延迟网络布线和配电系统,即使在 IT/OT 混合环境中,整个机架也能可靠运行。
OptiCool’后门热交换器从源头去除热量。 其主动式 RDHx 采用两相制冷剂技术:变速风扇将热废气吸入门上的蒸发器盘管,在热量进入白色空间之前,每个机架最多可捕获 120 kW 的热量。 专用制冷剂回路将热量输送到外部排气装置。 因此,现有机房空调/机房空调机组或冷水机组的热负荷大大降低。 减少能源消耗 并可在现有基础设施的基础上实现安全、高密度运行。
借助这种高密度机架级冷却方案,团队可以……’他们无需投入时间或专业知识来设计和集成自己的人工智能就绪基础设施—或者投入资金建设新设施,以满足日益增长的工作量。 由于这些解决方案是以软件包(机架、电源、连接和冷却)的形式提供的,因此可以快速部署,而无需传统设计和集成带来的复杂性。
我们可以携手帮助您确定哪些 AI 工作负载需要更靠近数据和用户。—以及支持他们的最佳方式。 欢迎莅临 2026 年数据中心世界展 437 号展位,参观配备 OptiCool 60 kW 后门热交换器的 Belden 机架以及其他数据中心解决方案。