我们做了国内首个 Serverless GPU 产品

Nexmoe 2025年5月27日

步入 2025 年，AI 应用的蓬勃发展让我们见证了技术变革的力量，但作为深耕 AI 领域的开发者，我们却在实际部署中屡屡碰壁——要么是高昂的 GPU 租赁成本让项目举步维艰，要么是传统云服务的刚性供给无法匹配波动性需求，亦或是复杂的基础设施管理消耗了大量精力。我们深知，这些痛点不仅困扰着我们，更是整个 AI 行业面临的共同挑战。于是，一个念头在我们心中萌生：为何不打造一个真正解决这些问题的 Serverless GPU 平台？于是，共绩算力应运而生。这不仅是一个产品，更是我们对 AI 算力服务理想形态的探索与实践，希望它能为那些致力于 AI 创新的开发者们，开启一个全新的算力时代。

picture-2025-05-27-14-29-26

开发共绩算力的初衷：解决 AI 推理算力市场的结构性困境

在使用算力的过程中，我们深刻感受到 AI 应用对推理算力需求的激增，但同时也观察到国内算力市场存在的结构性问题。高昂的推理成本正在阻碍 AI 应用的落地与创新，这促使我们思考如何解决这些痛点：

服务僵化，弹性不足： 我们发现供需矛盾严重影响了效率和用户体验。
模式传统，阻碍增长： 长租模式和高固定投入限制了企业的快速迭代能力。
管理繁琐 & 效率低下： 基础设施管理耗费了工程师大量精力。
资源错配，寻卡无门： 我们观察到算力闲置与高性能 GPU 短缺并存的矛盾现象。

这些问题构成了我们所说的 AI 算力市场 “弹性、稳定、低价”不可能三角，企业很难兼得这三个特性。目前多数云平台提供的三类服务：整租（低价&稳定）、按量租（高价&稳定）、抢占式 SPOT 实例（低价&弹性），都无法完美解决这个问题。

传统 GPU 整租模式难以匹配 AI 推理的波动性需求，导致高昂的”空闲成本”或服务中断，这正是我们要解决的核心问题。

picture-2025-05-27-14-29-50

图：刚性供给与弹性需求之间的矛盾，直接影响了 AI 应用成本和用户体验

面对这一矛盾，我们将目光投向了近年来兴起的 Serverless 计算理念。我们认为，它通过按需付费、自动伸缩和简化运维，为 AI 推理提供了理想的解决方案。

Serverless GPU 允许开发者按需调用 GPU 算力，无需管理硬件，特别适合请求量不稳定的 AI 推理场景。我们研究了全球 Serverless GPU 市场的发展，发现如 RunPod 等平台已经提供按小时计费、容器化部署等服务。

picture-2025-05-27-14-30-08

然而，我们发现国内专注于 Serverless GPU 服务的平台较少，资源储备不足限制了本土 AI 应用的 Serverless 部署。这正是我们决定开发共绩算力的关键原因。

我们的解决方案：共绩算力 Serverless GPU 平台

基于对市场痛点的深入理解，我们开发了”共绩算力”（suanli.cn），这是我们专为 AI 推理打造的 Serverless GPU 平台。我们的目标是打破行业”不可能三角”，真正实现弹性、稳定、低价。

picture-2025-05-27-14-30-22

我们为共绩算力平台设计的核心价值：

极致弹性： 我们实现了随流量自动扩缩容，毫秒级按量计费，彻底告别资源浪费和空闲成本。
部署极简： 我们采用 Docker 容器化技术，五步快速上云，兼容各类平台，并提供全程技术支持。
海量资源： 我们整合了全国算力资源，提供万卡级别的资源池，以高性价比保障稳定供给（如 4090 单卡低至 1.68 元/小时）。

我们自研的闲时算力调度平台整合了多家智算平台的资源，不仅提供了 Serverless 按需付费特性，还通过跨平台资源整合破解了”供需错配”这一行业难题。

限时优惠：立即体验我们的 Serverless GPU 服务

我们的 NVIDIA RTX 4090 单卡推理服务：仅需 1.68 元/小时！

即日起至 6 月 18 日，新用户注册并首次充值，我们额外赠送 20% 积分！

邀请好友使用我们的服务，通过您的邀请码成功拉新，您和被邀请人各得 50 元积分！

参与方式： 活动期间，通过我们的官方网站 suanli.cn 登录用户后台，选择在线充值即可自动参与并获得赠送金额。具体活动细则以官网届时公布为准。

picture-2025-05-27-14-30-55

立即访问 suanli.cn，体验我们打造的 AI 推理新纪元，让算力不再是您创新的瓶颈！