刘庆峰：“讯飞的代码部分能力已超越ChatGPT”，大模型下一个战场在哪里

记者陶炜张智南京报道

“讯飞星火大模型的代码生成和补齐能力已经超过了ChatGPT，其他各项能力正在快速追赶。当前代码能力的逻辑、算法、方法体系、数据准备已就绪，所需要的就是时间和算力。”在2023年亚布力论坛夏季高峰会上，科大讯飞（002230）创始人、董事长刘庆峰发表演讲时如此表示。

(资料图片)

据科大讯飞相关人士向《》记者介绍，星火5月6日发布以来，100天间开发者数量同比增长282%，开发者行业分布中排名第一的是“企业服务”，说明大模型真正开始赋能到刚需应用中。

自美国人工智能实验室OpenAI研发的对话式大型语言模型ChatGPT在2022年11月30日横空出世以来，国内科技公司在大模型这条赛道上的追赶就一刻未歇。只看这8月以来的新闻，就有腾讯、百度、快手、钉钉等科技巨头发布大模型方面的相关进展。如今，刘庆峰更用“代码能力已经超越ChatGPT”这一表述给了人们一个小小的震撼。当代码已经不再是障碍之后，接下来的发力点会在哪里？

《》记者研究各家科技企业近期在大模型方向上的举措后发现，对于应用场景的聚焦似乎是各家更加重视的方向。

代码和算力或已不再是障碍

代码能力或许已经不再是国产大模型追赶ChatGPT的障碍。

据刘庆峰介绍，前不久讯飞星火V2.0正式发布。讯飞星火2.0对代码能力进行了代码生成、代码补齐、代码纠错、代码解释、单元测试生成5个维度的升级。根据Open AI构建的代码能力公开测试集HumanEval，星火V1.5 Python语言的效果只有41分，V2.0已经到了61分，接近ChatGPT。

“讯飞星火大模型的代码生成和补齐能力已经超过了ChatGPT，其他各项能力正在快速追赶。当前代码能力的逻辑、算法、方法体系、数据准备已就绪，所需要的就是时间和算力。”刘庆峰称，讯飞定了一个目标，到今年10月24日，星火认知大模型将对标ChatGPT，实现中文超越、英文相当，明年上半年将对标GPT4。

根据刘庆峰的表述，算力或许也已经不再是问题。“大家知道，去年10月美国对中国极限施压，其中A100中国是不能买的，在今年的815，我们跟华为联合发布了讯飞星火一体机，能够在国产平台上自己做训练做推理，这是非常了不起的。我特别高兴地告诉大家，华为的GPU能力现在已经跟英伟达一样，任正非高度重视，华为的三位董事到科大讯飞专班工作，现在已经把它做到了能对标英伟达的A100。”刘庆峰说。

应用场景或是下一个战场

当代码和算力不再是障碍，大模型的下一个战场在哪里？从科大讯飞和其他科技企业近期的动向来看，接下来或许是应用场景的竞争。

8月15日，讯飞星火认知大模型V2.0升级发布会上，科大讯飞在发布代码能力和多模态能力升级的同时，也发布并升级了搭载讯飞星火认知大模型V2.0能力的多项应用和产品。例如，面向各学段学生、商务人士等广大英语学习爱好者的口语陪练老师，科大讯飞发布了讯飞语伴2.0，除了能够进行主题对话、虚拟人对话，重点推出两大核心能力——口语模考和情景交流，可用AI实现真人式陪练。又比如开始内测的“AI创作助手”，可在办公、学习、生活、社交等多个领域为用户提供场景化文案服务。

上述科大讯飞相关人士向《》记者介绍，星火5月6日发布以来，100天间开发者数量同比增长282%，开发者行业分布中排名第一的是“企业服务”，说明大模型真正开始赋能到刚需应用中。据悉，在讯飞星火中目前已有4109个助手开发者团队开发出7862款星火助手，“我们希望通过通用人工智能极大降低社会的创新创业门槛。”该人士说。此外，讯飞星火营则将与高校联合培养通用人工智能领军人才，与开发者共建技术交流平台。

“大模型重新定义了人机交互；大模型会重新定义营销和客服；大模型会催生AI原生应用。”百度创始人、董事长兼CEO李彦宏在2023中关村论坛发表题为《大模型改变世界》演讲时表示，新的国际竞争战略关键点，不是一个国家有多少个大模型，而是大模型上有多少原生的AI应用，这些应用在多大程度上提升了生产效率。今年10月17日，“Baidu World 2023”将发布多款解决方案及全新“AI原生应用”，并分享百度如何通过AI原生思维及大模型技术，重构百度的每一个产品，每一个业务，打造全新应用、赋能产业及生态。

8月22日召开的2023年钉钉生态大会上，钉钉总裁叶军公布了钉钉智能化的最新进展：已有17条产品线、55个场景全面接入大模型；钉钉还同时宣布向生态伙伴和客户开放智能化底座AI PaaS。

大会现场，叶军实景演示了基于AI PaaS和生态伙伴共创的新产品“数字员工”，以及会议、点餐、教育等多种场景、行业的AI解决方案。“数字员工可以看成具备AI能力的工作助手。”在现场叶军用“智能小助手”加好友，它可以帮助写招聘、发布简历，实时生成会议记录，“它会不断学习能够成长，跟人一样”。钉钉还尝试着给出了行业内首个大模型落地应用场景的商业化方案，在原有收费版钉钉的基础上配置大模型调用额度，根据测算，调用一次大模型不到5分钱。

8月25日，奇安信集团在京发布了Q-GPT（奇安信大模型）安全机器人和大模型卫士。据悉，Q-GPT安全机器人是基于奇安信大模型的“虚拟安全专家”，可以全天候工作，集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源、大模型应用分析等为一体，帮助企业更安全地向大模型要生产力。会上，京东方集团（600811）和吉利汽车集团等客户现场签约，成为国内首批Q-GPT安全机器人和安全大模型用户。

“在商业化之前，人们通常更关注大模型的训练成本，但却忽略了真正的商业化和规模化之后，最大的成本来自推理。最后的商业化一定是效果不断提升、成本不断下降的平衡点。一方面，模型的聪明程度要不断地满足日益提升的需求，解决行业的实际问题；另一方面，还要充分考虑客户的实际付费能力。长期来看，大模型是基础设施，商业的生态繁荣主要还是要看应用和插件的井喷。只有大家都基于大模型做开发，把大模型的应用都用起来，才是真正的商业化落地。”百度集团科技与社会研究中心主任余欢对本报记者说。