2月21日-23日,2025 GDC全球开发者先锋大会在上海徐汇举办。大会以“模塑全球 无限可能”为主题,围绕金融、医疗、教育智能制造等各类场景公司,AI开发工具、多模态大模型、企业级服务以及开源生态等多个领域的技术提供商汇聚一堂,探讨大模型产业化和技术前沿的最新方向。
22日GDC开幕式上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋,上海科学智能研究院院长、复旦大学浩清特聘教授漆远,阶跃星辰创始人、CEO姜大昕,商汤科技联合发起人、副总裁杨帆等重要嘉宾,分享和探讨关于 AI 大模型、DeepSeek、开源大模型与Agent(智能体)应用等线日下午,
AI 公司商汤科技还宣布开源可构建多Agent大模型应用开发框架LazyLLM,商汤大装置上线万象平台,包含模型开发平台与Agent应用开发平台,并已上架DeepSeek系列模型,企业客户和开发者可在商汤大装置万象平台中可获3个月内1000万tokens免费使用权益;大模型应用层面,商汤发布全新代码小浣熊2.0、办公小浣熊2.0,实现从Copilot迈向Agent转变。此外,
商汤科技联合发起人、首席科学家王晓刚透露,日日新大模型6.0也将在今年发布。很显然,进入2025年,AI 智能体应用、开源模型软件将成为一个新的趋势。
公开信息显示,2024年,上海市AI产业规模超过4500亿元,同比增长超过7%,累计完成60款生成式AI大模型备案。
据《关于人工智能“模塑申城”的实施方案》显示,到2025年底,上海要构筑起一个涵盖算力、语料、模型、应用等层面的世界级AI产业生态,打造世界级的高端 AI 产业集群。
沈向洋强调,现在来讲,闭源模型的份额实际上还是远超于开源份额,但可能接下来这一两年,这件事情的改变会非常的大。所有的事情都必然有一个平衡方式,因此,我们应该思考未来。
他指出,此前以OpenAI的GPT系列模型为代表,这是一种“快思考”模式,大模型都是在做预训练拓展,主要原理是预测下一个token,而推理模式则注重任务完成,允许反复试错和修正,更接近人类的“慢思考”。模型会先打草稿,反复试错找到正确路径后,总结过程和答案,训练的是模型慢思考的能力。因此,
这种新模式通过逐步抽象化复杂问题并推导解决方案,已在视觉推理等领域得到应用。
对于近期广为讨论的人与机器的相处关系到底应该是AI(Artificial Intelligence,人工智能)还是IA(Intelligence Augmentation,智能增强)?沈向洋指出,智能增强(IA)是指通过技术扩展人类的能力,帮助人们更高效地达成目标,而不是取代人类。
2025年1月,DeepSeek发布开源的推理模型R1,在强大的推理能力之外,还有超高的性价比的特性,其复现的训练成本仅为o1的4%,Grok-3的0.2%,推理成本仅为Grok-3的18%,o1-mini的3.7%。
“DeepSeek在有限算力下的普惠智能,是开源开放的胜利。”上海科学智能研究院院长、复旦大学浩清特聘教授漆远说,开源将有效加速新技术的渗透率,导致 AI 技术大规模的应用。
据悉,漆远团队已经研发了燧人物质大横型、伏羲气象大模型等多个技术产品,同时,漆远创立的无限光年公司,致力于研发独特的可信大模型及工具链技术,聚焦“一横一纵”的产品体系和全球化发展的策略:一横光语启智是“训推用”一站式智算服务平台,是中国领先的专门面向科学智能的智算平台;一纵 「光语金帆」精准推理大模型及Agent应用,专为金融专业技术人员打造的智能助手,光语金帆已在招商证券、汇丰银行等头部金融机构落地应用。
漆远指出,我们实际上当前低估了大模型带来的未来发展,也许Transformer之后还有新的架构出现,我们讲稀疏架构,一系列新的技术相信会促进推进人工智能的发展。“土壤、水分、阳光三位一体”之后,将加速科学智能的发展,而如果我们有了开放的生态,对高校、有突出贡献的公司、新锐公司能够产生一个非常好的推动作用。
“回看过去四、五十年,整个信息社会的发展,整个计算机行业的发展,最重要的一件事,其实就是人如何去使用计算机,哪个公司抓住了人和机器交互的入口,就会变成全球上最伟大的公司。当年PC时代,Windows这样的产品成就了微软,互联网时代搜索陈旧了谷歌,移动时代成就了TikTok,如今 AI 时代,DeepSeek正在驱动中国 AI 领头羊。”沈向洋称,发展人工智能过程中,一定要牢记“以人为本的 AI”这样以一个思路,关注到 AI 人才、AI对社会等影响。
DeepSeek热潮下,国内 AI 应用发展成为关键课题,在开幕式上,商汤科技联合发起人、副总裁杨帆提到了一个小故事,引发思考。
“说起落地应用选择,其实这也是满困扰我的问题。商汤也做了很多算法、算力和应用,但现在技术发展太快了,我说要不我问一下2024年非常火的一款大模型,我说2025年会有什么关键的重大机遇,它跟我说4条:应用场景拓展、国产算力突破、数据质量提升、国际竞争优势。我问一下DeepSeek,它就跟我说服务器繁忙,请稍后再试。”
AGI目标,是商汤科技全新十年的主线,基于大模型的落地应用也进入了加速期。2月22日全球开发者先锋大会商汤分论坛上,商汤科技公布了全新多Agent大模型应用开发框架LazyLLM、商汤大装置上线万象平台,以及全新
代码小浣熊2.0、办公小浣熊2.0,实现从Copilot迈向Agent转变。
实际应用中,代码小浣熊可帮助开发者提升编程效率超 50%,为企业研发全流程提效超 30%。
而全新的商汤办公小浣熊2.0,通过结合“日日新”融合大模型强大的原生融合多模态能力,实现赋能更多场景。用户都能够借助多模态理解和交互,更好的完成更通用的日常工作,比如文档处理、数据分析等,能够迅速实现垂直任务的分析、调研和最终报告生成。
钛媒体AGI了解到,目前,商汤代码小浣熊与办公小浣熊的企业用户超过300家,覆盖众多行业互联网、金融、汽车、制造等,拥有超过100万直接个人用户,以及超过1500万的最终个人用户,日token数高达100亿以上。
同时,商汤还发布万象Agent应用开发平台,是面向企业级大模型应用开发与管理的一站式服务平台,在模型管理平台的基础上,额外具备可视化编排、数据管理、知识库管理、工具管理、Prompt管理等功能,提供数十种控件画布控件和资源控件,支持无限层级的画布嵌套,支持多人协同办公。
依托商汤大装置的万象大模型平台,包括模型管理、微调、开发、调用,以及应用全链路服务,提供完整的企业级原生开发工具链和完善的技术服务能力。模型开发平台与大模型Agent应用开发平台能够助力原生AI应用全流程最优落地。此外,商汤大装置万象平台内置5种以上商汤“日日新”融合大模型体系的自研大模型,以及超过500个高质量预置大模型,
包括最新上架DeepSeek系列模型等,推理性能领先业界50%,且大模型平台支持开箱即用,仅需1分钟即可上手。
目前,商汤大装置万象已广泛服务于央国企、运营商、金融、互联网、汽车、泛科技等多个行业客户,
商汤科技大装置研发总监王志宏对钛媒体AGI表示,2023年大模型发展初期大多分布在于模型本身,包括基模型训练和模型微调,但随技术成熟和市场需求推进,慢慢的变多企业加速 AI 布局,需求也逐步从单个模型变为综合应用。过去一年商汤不断探索 AI 落地关键技术,结合落地经验沉淀出 AI 应用开发框架 LazyLLM,用于加速 AI 应用开发。
王志宏认为,2025 年被视为 AI 应用落地关键节点,金融、医疗等多个行业对 AI 大模型需求持续增长,这些成功案例既验证了 AI 技术落地的可行性,也为各行各业数字化转型提供有力支持。他指出,现在客户数量是慢慢的变多的,客户逐步地从一开始的基模型训练或者模型微调,到现在的直接面向垂直行景场景的一个应用落地。
王志宏表示,商汤第一时间接入了DeepSeek-R1-蒸馏版推理服务,用户通过LazyLLM直接访问DeepSeek 的线上服务,同时团队也把 DeepSeek 相关的思维链蒸馏能力迁移到了LazyLLM上面,持续加大LazyLLM的应用服务体验,逐步在实际应用场景把概念验证(PoC)能力提高到80%-90%。
“LazyLLM本质上它不是一个只做模型训练和推理的平台,而是把我们各种各样的功能工具以及新的大模型把它融合起来,然后通过我的精细化编排做成一个Pipeline(管道)去对外提供应用服务的能力。”王志宏对钛媒体AGI表示。
按照规划,今年3月,商汤集团将公布最新年报,以及基于“1+X”新战略架构的进展;今年4月举行的商汤技术交流日上,有望发布日日新大模型6.0以及一系列的企业级 AI 应用。
当前,AI热潮加速演进,在DeepSeek等公司持续发力下,国内正在加速发展 AI 产业,通过加强完善开源开放生态系统,加快推进垂直领域规模化应用,持续提升 AI 发展能级和核心竞争力。
工业与信息化部副部长熊继军表示,工信部将坚持创新驱动、应用牵引,为广大开发者营造良好的开发环境,为实现新型工业化提供有力支撑。一是下好创新“先手棋”,提升关键技术创造新兴事物的能力。二是完善开源“生态圈”,构建先进的开源服务体系。三是打造应用“试验场”,加快技术产品落地赋能。四是筑牢人才“蓄水池”,激发全球开发者创新活力。五是融入国际“大舞台”,拓展全球交流合作空间。