边缘部署中的 AI 数字人：在 Kiosk、零售设备和低带宽环境中运行实时数字人

大多数 AI 数字人 demo 都在理想条件下构建和测试：开发者工作站、专用办公室 WiFi、一次只跑一路会话。体验看起来很好。然后你尝试部署到零售 kiosk、现场技术员平板或酒店大堂屏幕，问题就开始出现。

本文专门讨论边缘部署：那些网络不是专用、硬件不是旗舰、数字人需要在非理想条件下可靠运行的真实环境。

Why Cloud Streaming Doesn’t Fit Edge Deployments

标准 AI 数字人架构是在云端服务器渲染视频，并通过 WebRTC 推流到显示设备。它有一个硬依赖：持续视频带宽。标准质量下每路会话需要持续 1–2 MB/s。这是视频编码物理约束决定的下限。低于这个值，质量会下降或视频流会卡住。

这个约束会在边缘环境中造成结构性问题：

共享 WiFi 不是专用连接。 零售门店网络同时承载 POS 终端、库存管理系统、顾客设备和后台流量。高峰期每台设备可用带宽不可预测。每路 kiosk 会话 1–2 MB/s，如果同一地点有多台设备，就会直接与关键业务流量竞争。

蜂窝连接是波动的。 仓库、工厂或户外环境中的现场平板会遇到弱 4G 信号和波动信号。晴天能提供 4 Mbps 的连接，在钢结构建筑内部可能只有 500 Kbps。云端推流视频约需要 1 MB/s 才能工作，并没有有意义的降级模式。

多设备带宽累积很快。 10 路并发 kiosk 会话，每路 1–2 MB/s，需要现场承诺 10–20 MB/s 带宽，还没算其他网络使用。对于 50 个门店的零售部署，提供这类专用带宽的基础设施成本并不小。

云端 GPU 成本随会话增长。 按行业平均约 0.15 美元/分钟计算，一个每天运行 8 小时、50% 占用率的高流量 kiosk，会在每台设备上累积可观的月度成本。

On-Device Rendering: The Architecture That Fits

Spatius 使用不同方法。它不是在云端渲染视频再推流，而是让 Spatius 云端 GPU 运行轻量 driving model，将 TTS 音频转换成 FLAME 表情参数，也就是描述数字人面部如何运动的紧凑数学数据。这些参数以 10–20 KB/s 传到客户端设备。Spatius 的渲染 SDK AvatarKit 使用这些参数在本地渲染 3DGS 数字人。

官方对该方法的描述是：“用轻量数据流替代沉重云端渲染，并在边缘设备上完成渲染。”

带宽对比是 10–20 KB/s 对 1–2 MB/s，约 99% 降低。10 路并发 kiosk 会话总共只需要约 100–200 KB/s，对任何商业网络来说都很小。数字人渲染本身在本地进行，因此网络质量影响的是响应速度（FLAME 参数到达速度），不会影响渲染帧率或视觉质量。

重要说明： Spatius 是渲染 SDK，不是完整 AI 平台。你构建并拥有自己的语音 AI 栈，包括 ASR、LLM 和 TTS。Spatius 连接到你的 TTS 音频输出，并从那里负责数字人动画和渲染。

Hardware Requirements

因为 AvatarKit 只做渲染和音频对齐，不在设备端做 ML 推理，GPU 工作负载很轻。Spatius 官方支持入门级芯片上 60fps 运行。覆盖的硬件范围包括：

验证过的芯片： G88、S565、8189、RK3576，都不需要独立 GPU。这些代表商业 Android kiosk 硬件和预算移动设备中的常见芯片等级。

入门级 SoC： 持续负载下稳定 25fps。

中端硬件： 30–60fps。

Web 部署： 任何能运行支持 WebGL/WebGPU 的现代浏览器设备，包括运行 Chrome OS 的商业显示硬件，或 Linux / Windows IoT 上的标准浏览器。

3DGS 数字人模型约 5–10 MB，初次下载后保存在设备上。后续会话从本地缓存加载。

Deployment Patterns for Common Edge Scenarios

Retail Kiosk

环境： 固定位置 Android kiosk 或带嵌入式计算的商业显示屏。门店共享 WiFi 会随顾客流量波动。

该架构解决的问题： 每路会话只消耗 10–20 KB/s，所以 10 台 kiosk 同时运行也只需要约 100–200 KB/s，不受共享网络负载影响。AvatarKit 可通过 Web SDK（WebGL/WebGPU）在 kiosk 嵌入式硬件上原生运行，无需额外 GPU。

降级行为： 如果到 Spatius 云端 driving model 的 WebSocket 连接在 15 秒内失败，AvatarKit 会自动切换到 audio-only mode。TTS 音频继续，动画暂停。在面向公众的走近式安装中，这种优雅降级很重要：硬失败会形成坏屏体验，audio-only 至少还能继续服务用户。

成本对比： Spatius Scale 计划为 0.007 美元/分钟（0.42 美元/小时），相比行业平均约 0.15 美元/分钟（约 9 美元/小时）。在 50 台设备的中等利用率部署中，这个差异会明显影响单元经济性。

Field Technician / Mobile Deployment

环境： Android 平板。4G 蜂窝网络波动，例如仓库、工厂、户外场地或射频屏蔽设施。

该架构解决的问题： 10–20 KB/s 在弱 4G 或波动 4G 上仍然可用。短暂信号下降不会影响数字人渲染，只会延迟下一批 FLAME 参数，让数字人发言出现短暂停顿，而不是视频流冻结或断裂。AvatarKit 提供原生 Android SDK（Gradle: ai.spatialwalk:avatarkit，Vulkan renderer）。

连接考虑： Spatius 云端 driving model 需要网络连接来生成 FLAME 参数。对于间歇连接环境，15 秒后切换到 audio-only mode 是一个安全网。

Hospitality / Commercial Display

环境： 带嵌入式计算或外接 mini-PC 的大尺寸商业显示屏。共享宾客 WiFi。

该架构解决的问题： 在共享宾客网络中，每台设备可用带宽不可预测。10–20 KB/s 几乎可以适应任何 WiFi 条件。Web SDK（WebGL/WebGPU）可直接在商业显示硬件的浏览器中运行，无需独立 GPU。

Healthcare Information Point

环境： 支架上的平板或触摸屏。医院 WiFi 往往有严格的网络分段和每设备带宽限制。对话可能涉及敏感信息。

该架构解决的问题： 10–20 KB/s 带宽要求通常符合网络分段限制。隐私方面，AvatarKit 只接收 AI 生成的 TTS 音频数据，渲染在用户本地设备上运行。敏感用户对话内容不会通过 Spatius 渲染基础设施。

In-vehicle / AI hardware： Spatius 明确列出 In-Vehicle & Kiosks 和 AI Hardware 作为支持部署类别。AvatarKit 的低带宽和端侧渲染让它适用于嵌入式车载显示和独立 AI 硬件，而这些场景通常不适合云端视频推流。

Integration

AvatarKit 支持三个平台：

Platform	Distribution	Rendering Engine
Web	npm: `@spatialwalk/avatarkit`	WebGL / WebGPU
iOS	`AvatarKit.xcframework` (Metal)	Metal
Android	Gradle: `ai.spatialwalk:avatarkit`	Vulkan

有三种集成模式：

Basic Mode — 设置成本最低，Web/iOS/Android，中等延迟
LiveKit Plugin — 超低延迟，仅 Web，适合已有 LiveKit Agents 基础设施的团队
Custom Mode — 超低延迟，完整传输控制，Web/iOS/Android

服务端 SDK 支持 Python（pip install spatius）和 Go（go get github.com/spatius-ai/spatius-sdk-go）。

Web、iOS、Android 和 Flutter 的完整工作示例可在 Voice Agent Demo repository 中查看。

Pricing

Plan	Monthly	Per minute	Per hour
Free	$0	—	— (~50 min included)
Starter	$19/mo	$0.009/min	~$0.54/hr
Scale	$299/mo	$0.007/min	$0.42/hr
Enterprise	Custom	Custom	Custom

Credits 不会按月结转（订阅 credits 每个周期重置）。永久免费层可用，无需信用卡。

Getting Started

playground 会在浏览器中运行 AvatarKit，适合在正式集成 SDK 前快速验证具体设备。若要评估边缘部署范围或企业设备 fleet，可联系 Spatius 团队。

硬件要求详解 → AI Avatar on Entry-Level Chipsets: How On-Device Rendering Works on Budget Hardware

架构对比 → On-Device AI Avatar vs Cloud Streaming: Architecture, Bandwidth, and Cost

测试 SDK → Avatar SDK Demo: How to Test a Real-Time AI Avatar Before You Commit to a Platform

完整平台格局 → Interactive Avatar: The Complete Guide to Real-Time AI Avatars in 2026

AI avatar kiosk edge deployment retail avatar low bandwidth AvatarKit

分享 X (Twitter) LinkedIn