🧩 赛道与命题

📌 版本 v0.4 📅 2026-03-05

一、赛道总览（3+1 结构）

赛道	方向	类型	定位
A：企业端侧 Agent	智能导购 / 工业 SOP 诊断 / 销售合规助手	命题	当下落点，48 TOPS 完全够用
B：端侧感知与交互	多模态交互、语音/图像理解、人机协作	命题	桥梁，连接 Agent 与物理世界
C：AI Box 底座能力	插件系统 / 多 Agent 编排	命题	平台化能力验证
D：自由创新	不限，机器人/具身方向可设专项奖	开放	未来窗口，鼓励探索

二、赛道 A 具体命题

已选定 3 个命题方向，均突出 AI Box 端侧优势（隐私/低延迟/离线）。

A2：智能客服/导购 Agent

项目	内容
场景	零售/电商场景：基于商品信息和用户意图，做推荐、答疑、下单引导
端侧优势	低延迟交互、个性化推荐不依赖云端、门店离线可用
验收标准	多轮对话完成至少 3 个完整导购场景（浏览-咨询-推荐-下单引导）

A3：工业 SOP 诊断助手

项目	内容
场景	设备故障排查/维保流程引导：输入故障描述，按 SOP 逐步引导操作员排查
端侧优势	离线可用（车间/工厂网络差）、低延迟、数据不出产线
验收标准	完成至少 5 个故障场景的端到端排查流程

A4：销售话术/合规助手

项目	内容
场景	销售现场实时提供话术建议、合规检查（如金融/保险销售的话术红线提醒）
端侧优势	实时性（销售现场秒级响应）、隐私（客户信息不上云）
验收标准	模拟对话场景中能实时给出合规提示和话术建议

三、赛道 B 命题细节

假定 SDK 对摄像头和语音模块的支持已到位。

子方向	支持的外设/模块	可能的命题示例
视觉感知	USB/CSI 摄像头、深度相机等	端侧物体识别与分拣助手、门店客流统计、货架合规巡检
语音交互	麦克风阵列、扬声器模组等	离线语音对话 Agent、端侧声纹识别门禁、多语言实时翻译
多模态融合	视觉 + 语音 + 文本联合交互	智能前台（刷脸+语音+工单联动）、无障碍辅助助手

命题文档中需明确：SDK 支持的模组型号清单、接口规范、最小可运行示例，以及当模组不可用时的兜底方案。

四、赛道 C 具体命题

侧重 AI Box 的平台化能力和生态价值。

C1：插件系统/技能扩展

项目	内容
场景	为 AI Box 开发可复用的 Agent 插件（如天气/日历/文件搜索/数据库查询），并设计标准化插件接口
验收标准	插件可独立安装/卸载、有标准化接口规范、可被其他 Agent 调用、附带开发文档
生态价值	获奖作品可直接沉淀为 SDK 的插件生态组成部分

C2：多 Agent 编排引擎

项目	内容
场景	实现轻量级多 Agent 协作框架：定义任务→拆分子任务→分配给不同 Agent→汇总结果
验收标准	至少 3 个 Agent 协作完成 1 个复杂任务
生态价值	编排引擎是 AI Box 作为「Agent 底座」的核心能力

五、赛道 D 开放赛道方向包

开放赛道仍要求「真实需求」，但提供方向包避免无边界发散，便于评审横向比较。

方向	说明
行业一线提效	零售/连锁门店/仓储物流等的本地智能助手
安全与合规	隐私敏感场景的端侧智能（本地检索/推理/审计）
公共服务/社会价值	养老/无障碍/应急科普/教育辅助（可用性优先）
端侧多模态	语音/图像/文本结合的现场交互（强调低延迟与离线兜底）
「盒子即平台」扩展	开发者工具、模型管理、可观测性
端云协同	在不泄露敏感数据前提下的云端增强（需说明数据策略）