2025软创赛题解读

100%个人看法,仅供娱乐

以下内容均为dinglz个人看法与建议,仅供参考,可能存在部分误区

概述

今年的赛题在这里:AI无界 · 创见未来,我当时看到第一眼的就是三个字:“移动端”,我心想完蛋了,好多Idea做不了了,后来想想也不奇怪,组委会oppo是做手机的,总之我认为,今年的赛题主要强调的关键点有四个:“全场景”、“随身智能体(Agent)”、“多模态”和“端云协同”

与往年不同的是,今年强调的是Agent:这不仅仅要求是回答问题的能力(直接弄死去年接近一半的获奖项目),更主要的是要能感知环境->主动决策->执行任务(这下做agent的笑嘻嘻地把做workflow的给踹进下水道了)我倒是觉得还挺合理,作为面向大学生的赛事,不需要考虑商用级的稳定性,那自然是要对标最前沿的agent,狠狠地信任llm的能力(关于这点,我倒是觉得有点不公平,即大家能接触到的模型水平,感觉玩gemini和claude的,在二者水平一致的情况下,狠狠把玩deepseek和qwen的甩在后面了;但是,showcase可以是理想场景,希望大家有所领悟)

下面进入正式的分析:

赛题核心逻辑

在完成你的作品之前,首先你要明确评委看重的到底是什么

1. 移动端

本次强调了移动端,但注意,你的想法不需要被手机所局限,平板、手表、AR眼镜、VR眼镜都属于移动设备,后面两个可能在创新性上具有很大的优势,但限制于设备,仅供参考

在这方面,你需要考虑到,移动端的优势到底是什么:

  • 移动优势:随身、方便 -> 对比示例idea:随身会议总结
  • 硬件优势:摄像头、麦克风、GPS、陀螺仪等等各类传感器,怎么把这些利用起来将成为你最核心的思考

根据以上,我可以断言:如果你的idea可以在网页端完美运行,那它对于本赛题来说,大概率不是一个好的idea

2. 多模态

你的交互一定不能局限在文字上,必须要包含视觉 && 听觉 甚至是触觉or生理数据(手表),只有文字的交互是一个巨大的灾难

因此,如何借助移动端硬件优势?你或许得好好想想

3. 智能体Agent

你需要把更多自主权交还给AI,抛弃掉所有简单的prompt交互、workflow;把决策还给AI

拿天气感知来说,从以前的调用api查询天气,要转变成 感知到下雨 -> 自动查询路况 -> 调整闹钟 -> 叫车这种自动范式上来

我后面会有一篇详细的关于google agent development kid的教程,带大家入门agent,敬请期待

4. 端侧能力

赛题中提到了端云协同、设备支持、低bit量化等等,那么说明你需要考虑到端侧小模型,应该端侧和云端协调

要考虑考虑端侧小模型的优点(响应快、隐私好)来考虑考虑是否要在自己的idea中引入端侧小模型,大家或许都忘了,手机也是一个性能相当不错的计算终端;上届vivo aigc决赛我在作品中引入了7B小模型的直接在端侧上推理,结合云端可以大大提速 && 提效

误区解析

  1. 不要做一个prompt调用机器,不要套壳;要把AI隐藏在功能背后,比如“一键生成PPT”显然优于“教我怎么写PPT”。(说句题外话,我一直觉得对话不是llm的最终范式,只是当时chatgpt打了个样罢了)
  2. 不要忽略移动端优势,多想想什么是移动端能做但是网页端做不了的
  3. 一定要闭环;不光是感知,更重要的是行动:比如 | 识别到用户想去旅行(感知) -> 自动规划行程(决策) -> (关键一步)调用 API 把行程添加到系统日历,并唤起地图导航(执行)。 | 最后一步才是最重要的

赛题之外

  1. 好好做ui!好看的ui比什么都重要
  2. 好好写文档!全篇ai会被评委一脚踢死
  3. 好好优化用户体验,dog feed,要让自己愿意用自己的app
  4. 把功能实现了优于牛逼的技术,当一个实干家

技术栈推荐

点这里看我的全部推荐 && 优缺点解析

结语

祝大家都能取得自己满意的成绩,遇到问题也欢迎和我沟通

Last updated on Dec 18, 2025 02:00 UTC
copyright © dinglz
Built with Hugo
Theme Stack designed by Jimmy