一、赛道总览(3+1 结构)
| 赛道 | 方向 | 类型 | 定位 |
|---|---|---|---|
| A:企业端侧 Agent | 智能导购 / 工业 SOP 诊断 / 销售合规助手 | 命题 | 当下落点,48 TOPS 完全够用 |
| B:端侧感知与交互 | 多模态交互、语音/图像理解、人机协作 | 命题 | 桥梁,连接 Agent 与物理世界 |
| C:AI Box 底座能力 | 插件系统 / 多 Agent 编排 | 命题 | 平台化能力验证 |
| D:自由创新 | 不限,机器人/具身方向可设专项奖 | 开放 | 未来窗口,鼓励探索 |
二、赛道 A 具体命题
已选定 3 个命题方向,均突出 AI Box 端侧优势(隐私/低延迟/离线)。
A2:智能客服/导购 Agent
| 项目 | 内容 |
|---|---|
| 场景 | 零售/电商场景:基于商品信息和用户意图,做推荐、答疑、下单引导 |
| 端侧优势 | 低延迟交互、个性化推荐不依赖云端、门店离线可用 |
| 验收标准 | 多轮对话完成至少 3 个完整导购场景(浏览-咨询-推荐-下单引导) |
A3:工业 SOP 诊断助手
| 项目 | 内容 |
|---|---|
| 场景 | 设备故障排查/维保流程引导:输入故障描述,按 SOP 逐步引导操作员排查 |
| 端侧优势 | 离线可用(车间/工厂网络差)、低延迟、数据不出产线 |
| 验收标准 | 完成至少 5 个故障场景的端到端排查流程 |
A4:销售话术/合规助手
| 项目 | 内容 |
|---|---|
| 场景 | 销售现场实时提供话术建议、合规检查(如金融/保险销售的话术红线提醒) |
| 端侧优势 | 实时性(销售现场秒级响应)、隐私(客户信息不上云) |
| 验收标准 | 模拟对话场景中能实时给出合规提示和话术建议 |
三、赛道 B 命题细节
假定 SDK 对摄像头和语音模块的支持已到位。
| 子方向 | 支持的外设/模块 | 可能的命题示例 |
|---|---|---|
| 视觉感知 | USB/CSI 摄像头、深度相机等 | 端侧物体识别与分拣助手、门店客流统计、货架合规巡检 |
| 语音交互 | 麦克风阵列、扬声器模组等 | 离线语音对话 Agent、端侧声纹识别门禁、多语言实时翻译 |
| 多模态融合 | 视觉 + 语音 + 文本联合交互 | 智能前台(刷脸+语音+工单联动)、无障碍辅助助手 |
命题文档中需明确:SDK 支持的模组型号清单、接口规范、最小可运行示例,以及当模组不可用时的兜底方案。
四、赛道 C 具体命题
侧重 AI Box 的平台化能力和生态价值。
C1:插件系统/技能扩展
| 项目 | 内容 |
|---|---|
| 场景 | 为 AI Box 开发可复用的 Agent 插件(如天气/日历/文件搜索/数据库查询),并设计标准化插件接口 |
| 验收标准 | 插件可独立安装/卸载、有标准化接口规范、可被其他 Agent 调用、附带开发文档 |
| 生态价值 | 获奖作品可直接沉淀为 SDK 的插件生态组成部分 |
C2:多 Agent 编排引擎
| 项目 | 内容 |
|---|---|
| 场景 | 实现轻量级多 Agent 协作框架:定义任务→拆分子任务→分配给不同 Agent→汇总结果 |
| 验收标准 | 至少 3 个 Agent 协作完成 1 个复杂任务 |
| 生态价值 | 编排引擎是 AI Box 作为「Agent 底座」的核心能力 |
五、赛道 D 开放赛道方向包
开放赛道仍要求「真实需求」,但提供方向包避免无边界发散,便于评审横向比较。
| 方向 | 说明 |
|---|---|
| 行业一线提效 | 零售/连锁门店/仓储物流等的本地智能助手 |
| 安全与合规 | 隐私敏感场景的端侧智能(本地检索/推理/审计) |
| 公共服务/社会价值 | 养老/无障碍/应急科普/教育辅助(可用性优先) |
| 端侧多模态 | 语音/图像/文本结合的现场交互(强调低延迟与离线兜底) |
| 「盒子即平台」扩展 | 开发者工具、模型管理、可观测性 |
| 端云协同 | 在不泄露敏感数据前提下的云端增强(需说明数据策略) |