🧩 赛道与命题

📌 版本 v0.4 📅 2026-03-05

一、赛道总览(3+1 结构)

赛道 方向 类型 定位
A:企业端侧 Agent 智能导购 / 工业 SOP 诊断 / 销售合规助手 命题 当下落点,48 TOPS 完全够用
B:端侧感知与交互 多模态交互、语音/图像理解、人机协作 命题 桥梁,连接 Agent 与物理世界
C:AI Box 底座能力 插件系统 / 多 Agent 编排 命题 平台化能力验证
D:自由创新 不限,机器人/具身方向可设专项奖 开放 未来窗口,鼓励探索

二、赛道 A 具体命题

已选定 3 个命题方向,均突出 AI Box 端侧优势(隐私/低延迟/离线)。

A2:智能客服/导购 Agent

项目 内容
场景 零售/电商场景:基于商品信息和用户意图,做推荐、答疑、下单引导
端侧优势 低延迟交互、个性化推荐不依赖云端、门店离线可用
验收标准 多轮对话完成至少 3 个完整导购场景(浏览-咨询-推荐-下单引导)

A3:工业 SOP 诊断助手

项目 内容
场景 设备故障排查/维保流程引导:输入故障描述,按 SOP 逐步引导操作员排查
端侧优势 离线可用(车间/工厂网络差)、低延迟、数据不出产线
验收标准 完成至少 5 个故障场景的端到端排查流程

A4:销售话术/合规助手

项目 内容
场景 销售现场实时提供话术建议、合规检查(如金融/保险销售的话术红线提醒)
端侧优势 实时性(销售现场秒级响应)、隐私(客户信息不上云)
验收标准 模拟对话场景中能实时给出合规提示和话术建议

三、赛道 B 命题细节

假定 SDK 对摄像头和语音模块的支持已到位。
子方向 支持的外设/模块 可能的命题示例
视觉感知 USB/CSI 摄像头、深度相机等 端侧物体识别与分拣助手、门店客流统计、货架合规巡检
语音交互 麦克风阵列、扬声器模组等 离线语音对话 Agent、端侧声纹识别门禁、多语言实时翻译
多模态融合 视觉 + 语音 + 文本联合交互 智能前台(刷脸+语音+工单联动)、无障碍辅助助手
命题文档中需明确:SDK 支持的模组型号清单、接口规范、最小可运行示例,以及当模组不可用时的兜底方案。

四、赛道 C 具体命题

侧重 AI Box 的平台化能力和生态价值。

C1:插件系统/技能扩展

项目 内容
场景 为 AI Box 开发可复用的 Agent 插件(如天气/日历/文件搜索/数据库查询),并设计标准化插件接口
验收标准 插件可独立安装/卸载、有标准化接口规范、可被其他 Agent 调用、附带开发文档
生态价值 获奖作品可直接沉淀为 SDK 的插件生态组成部分

C2:多 Agent 编排引擎

项目 内容
场景 实现轻量级多 Agent 协作框架:定义任务→拆分子任务→分配给不同 Agent→汇总结果
验收标准 至少 3 个 Agent 协作完成 1 个复杂任务
生态价值 编排引擎是 AI Box 作为「Agent 底座」的核心能力

五、赛道 D 开放赛道方向包

开放赛道仍要求「真实需求」,但提供方向包避免无边界发散,便于评审横向比较。
方向 说明
行业一线提效 零售/连锁门店/仓储物流等的本地智能助手
安全与合规 隐私敏感场景的端侧智能(本地检索/推理/审计)
公共服务/社会价值 养老/无障碍/应急科普/教育辅助(可用性优先)
端侧多模态 语音/图像/文本结合的现场交互(强调低延迟与离线兜底)
「盒子即平台」扩展 开发者工具、模型管理、可观测性
端云协同 在不泄露敏感数据前提下的云端增强(需说明数据策略)