大多数 AI 数字人 demo 都在理想条件下构建和测试:开发者工作站、专用办公室 WiFi、一次只跑一路会话。体验看起来很好。然后你尝试部署到零售 kiosk、现场技术员平板或酒店大堂屏幕,问题就开始出现。
本文专门讨论边缘部署:那些网络不是专用、硬件不是旗舰、数字人需要在非理想条件下可靠运行的真实环境。
Why Cloud Streaming Doesn’t Fit Edge Deployments
标准 AI 数字人架构是在云端服务器渲染视频,并通过 WebRTC 推流到显示设备。它有一个硬依赖:持续视频带宽。标准质量下每路会话需要持续 1–2 MB/s。这是视频编码物理约束决定的下限。低于这个值,质量会下降或视频流会卡住。
这个约束会在边缘环境中造成结构性问题:
共享 WiFi 不是专用连接。 零售门店网络同时承载 POS 终端、库存管理系统、顾客设备和后台流量。高峰期每台设备可用带宽不可预测。每路 kiosk 会话 1–2 MB/s,如果同一地点有多台设备,就会直接与关键业务流量竞争。
蜂窝连接是波动的。 仓库、工厂或户外环境中的现场平板会遇到弱 4G 信号和波动信号。晴天能提供 4 Mbps 的连接,在钢结构建筑内部可能只有 500 Kbps。云端推流视频约需要 1 MB/s 才能工作,并没有有意义的降级模式。
多设备带宽累积很快。 10 路并发 kiosk 会话,每路 1–2 MB/s,需要现场承诺 10–20 MB/s 带宽,还没算其他网络使用。对于 50 个门店的零售部署,提供这类专用带宽的基础设施成本并不小。
云端 GPU 成本随会话增长。 按行业平均约 0.15 美元/分钟计算,一个每天运行 8 小时、50% 占用率的高流量 kiosk,会在每台设备上累积可观的月度成本。
On-Device Rendering: The Architecture That Fits
Spatius 使用不同方法。它不是在云端渲染视频再推流,而是让 Spatius 云端 GPU 运行轻量 driving model,将 TTS 音频转换成 FLAME 表情参数,也就是描述数字人面部如何运动的紧凑数学数据。这些参数以 10–20 KB/s 传到客户端设备。Spatius 的渲染 SDK AvatarKit 使用这些参数在本地渲染 3DGS 数字人。
官方对该方法的描述是:“用轻量数据流替代沉重云端渲染,并在边缘设备上完成渲染。”
带宽对比是 10–20 KB/s 对 1–2 MB/s,约 99% 降低。10 路并发 kiosk 会话总共只需要约 100–200 KB/s,对任何商业网络来说都很小。数字人渲染本身在本地进行,因此网络质量影响的是响应速度(FLAME 参数到达速度),不会影响渲染帧率或视觉质量。
重要说明: Spatius 是渲染 SDK,不是完整 AI 平台。你构建并拥有自己的语音 AI 栈,包括 ASR、LLM 和 TTS。Spatius 连接到你的 TTS 音频输出,并从那里负责数字人动画和渲染。
Hardware Requirements
因为 AvatarKit 只做渲染和音频对齐,不在设备端做 ML 推理,GPU 工作负载很轻。Spatius 官方支持入门级芯片上 60fps 运行。覆盖的硬件范围包括:
验证过的芯片: G88、S565、8189、RK3576,都不需要独立 GPU。这些代表商业 Android kiosk 硬件和预算移动设备中的常见芯片等级。
入门级 SoC: 持续负载下稳定 25fps。
中端硬件: 30–60fps。
Web 部署: 任何能运行支持 WebGL/WebGPU 的现代浏览器设备,包括运行 Chrome OS 的商业显示硬件,或 Linux / Windows IoT 上的标准浏览器。
3DGS 数字人模型约 5–10 MB,初次下载后保存在设备上。后续会话从本地缓存加载。
Deployment Patterns for Common Edge Scenarios
Retail Kiosk
环境: 固定位置 Android kiosk 或带嵌入式计算的商业显示屏。门店共享 WiFi 会随顾客流量波动。
该架构解决的问题: 每路会话只消耗 10–20 KB/s,所以 10 台 kiosk 同时运行也只需要约 100–200 KB/s,不受共享网络负载影响。AvatarKit 可通过 Web SDK(WebGL/WebGPU)在 kiosk 嵌入式硬件上原生运行,无需额外 GPU。
降级行为: 如果到 Spatius 云端 driving model 的 WebSocket 连接在 15 秒内失败,AvatarKit 会自动切换到 audio-only mode。TTS 音频继续,动画暂停。在面向公众的走近式安装中,这种优雅降级很重要:硬失败会形成坏屏体验,audio-only 至少还能继续服务用户。
成本对比: Spatius Scale 计划为 0.007 美元/分钟(0.42 美元/小时),相比行业平均约 0.15 美元/分钟(约 9 美元/小时)。在 50 台设备的中等利用率部署中,这个差异会明显影响单元经济性。
Field Technician / Mobile Deployment
环境: Android 平板。4G 蜂窝网络波动,例如仓库、工厂、户外场地或射频屏蔽设施。
该架构解决的问题: 10–20 KB/s 在弱 4G 或波动 4G 上仍然可用。短暂信号下降不会影响数字人渲染,只会延迟下一批 FLAME 参数,让数字人发言出现短暂停顿,而不是视频流冻结或断裂。AvatarKit 提供原生 Android SDK(Gradle: ai.spatialwalk:avatarkit,Vulkan renderer)。
连接考虑: Spatius 云端 driving model 需要网络连接来生成 FLAME 参数。对于间歇连接环境,15 秒后切换到 audio-only mode 是一个安全网。
Hospitality / Commercial Display
环境: 带嵌入式计算或外接 mini-PC 的大尺寸商业显示屏。共享宾客 WiFi。
该架构解决的问题: 在共享宾客网络中,每台设备可用带宽不可预测。10–20 KB/s 几乎可以适应任何 WiFi 条件。Web SDK(WebGL/WebGPU)可直接在商业显示硬件的浏览器中运行,无需独立 GPU。
Healthcare Information Point
环境: 支架上的平板或触摸屏。医院 WiFi 往往有严格的网络分段和每设备带宽限制。对话可能涉及敏感信息。
该架构解决的问题: 10–20 KB/s 带宽要求通常符合网络分段限制。隐私方面,AvatarKit 只接收 AI 生成的 TTS 音频数据,渲染在用户本地设备上运行。敏感用户对话内容不会通过 Spatius 渲染基础设施。
In-vehicle / AI hardware: Spatius 明确列出 In-Vehicle & Kiosks 和 AI Hardware 作为支持部署类别。AvatarKit 的低带宽和端侧渲染让它适用于嵌入式车载显示和独立 AI 硬件,而这些场景通常不适合云端视频推流。
Integration
AvatarKit 支持三个平台:
| Platform | Distribution | Rendering Engine |
|---|---|---|
| Web | npm: @spatialwalk/avatarkit | WebGL / WebGPU |
| iOS | AvatarKit.xcframework (Metal) | Metal |
| Android | Gradle: ai.spatialwalk:avatarkit | Vulkan |
有三种集成模式:
- Basic Mode — 设置成本最低,Web/iOS/Android,中等延迟
- LiveKit Plugin — 超低延迟,仅 Web,适合已有 LiveKit Agents 基础设施的团队
- Custom Mode — 超低延迟,完整传输控制,Web/iOS/Android
服务端 SDK 支持 Python(pip install spatius)和 Go(go get github.com/spatius-ai/spatius-sdk-go)。
Web、iOS、Android 和 Flutter 的完整工作示例可在 Voice Agent Demo repository 中查看。
Pricing
| Plan | Monthly | Per minute | Per hour |
|---|---|---|---|
| Free | $0 | — | — (~50 min included) |
| Starter | $19/mo | $0.009/min | ~$0.54/hr |
| Scale | $299/mo | $0.007/min | $0.42/hr |
| Enterprise | Custom | Custom | Custom |
Credits 不会按月结转(订阅 credits 每个周期重置)。永久免费层可用,无需信用卡。
Getting Started
playground 会在浏览器中运行 AvatarKit,适合在正式集成 SDK 前快速验证具体设备。若要评估边缘部署范围或企业设备 fleet,可联系 Spatius 团队。
Related Reading
硬件要求详解 → AI Avatar on Entry-Level Chipsets: How On-Device Rendering Works on Budget Hardware
架构对比 → On-Device AI Avatar vs Cloud Streaming: Architecture, Bandwidth, and Cost
测试 SDK → Avatar SDK Demo: How to Test a Real-Time AI Avatar Before You Commit to a Platform
完整平台格局 → Interactive Avatar: The Complete Guide to Real-Time AI Avatars in 2026