千亿巨头发布能力超ChatGPT？

“俗话说‘男子汉大丈夫宁死不屈’，但是俗话又说‘男子汉大丈夫要能屈能伸’，请问这两句话怎么理解？”“如果一个小伙子跟女朋友吵架了，他应该宁死不屈还是能屈能伸？”

(相关资料图)

在5月6日的讯飞星火认知大模型(简称“星火大模型”)成果发布会上，市场期待已久的科大讯飞（002230）大模型正式亮相，对上述有些刁钻的问题做出了“高情商”回答：星火大模型不偏不倚地回复了第一个问题，第二个问题却明显“站队”――小伙子和女朋友吵架，“能屈能伸”是更好的选择。

除了测语言理解，科大讯飞董事长刘庆峰与科大讯飞副总裁、研究院院长刘聪还在发布会现场，实测了星火大模型的长文本生成、数学计算等核心能力，并发布了在教育、办公、汽车、数字员工四大行业的应用成果。

不过，刘庆峰也直言，目前大模型技术还有待攻克的缺陷，但这些问题在今年会有明显改进。刘庆峰随即预告了星火大模型未来持续升级的多个关键里程碑。其中，在10月24日，星火大模型将实现通用模型对标ChatGPT，中文超越ChatGPT的当前版本，英文能做到相当水平，并在教育、医疗等领域做到业界领先。

三大能力已超ChatGPT

科大讯飞董事长刘庆峰

在发布会现场，刘庆峰与刘聪围绕星火大模型的七大核心能力，即多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力，展开了多轮实测。

刘庆峰认为，星火大模型展示了通用人工智能的曙光，星火大模型已在文本生成、知识问答、数学能力三种能力上超越了ChatGPT。首先在长文本生成上，星火大模型能写邮件、做方案、写新闻通稿、编故事。刘庆峰指出，星火大模型在国内明显领先，并且在中文方面超过了ChatGPT，并且在持续进步中。

科大讯飞副总裁、研究院院长刘聪

其次在数学能力中，除了常规计算、几何、情景应用等，刘聪在现场抛出了复杂的计算题，星火大模型很快准确给出了答案，并给出了解题步骤。刘庆峰表示，数理能力一定程度代表了一个大模型的聪明程度，星火大模型不仅在国内系统中遥遥领先，也超过了ChatGPT。

刘聪还展示了大模型面向泛领域的开放式知识问答，星火大模型具备很好的通识知识，能够对生活常识、科学知识、工作技巧，以及医学知识等应对自如，该能力也已超过了ChatGPT。此外，星火大模型也具备逻辑推理能力与代码能力，未来还将进一步升级多模态输入和表达能力，不断实现自身迭代进化。

不过，刘庆峰也直言，目前大模型技术还有待攻克的缺陷，比如新知识难以及时更新、事实类问答容易“张冠李戴”，史实、传统典籍等容易“编造情节”等，但这些问题在今年会有明显的改进。

刘庆峰随即公布了年内星火大模型技术持续升级的三个关键里程碑节点：6月9日，将突破开放式问答、多轮对话能力明显提升、数学能力再升级；8月15日，代码能力升级以及多模态交互能力提升，希望能帮助到更多的合作伙伴及开发者团队；10月24日，将实现通用模型对标ChatGPT，中文超越ChatGPT的当前版本，英文能做到相当水平，并在教育、医疗等领域做到业界领先。

落地多个行业应用

刘庆峰透露，在2022年12月15日，科大讯飞正式启动“1+N”认知大模型专项攻关，其中“1”就是指通用认知智能大模型，“N”就是大模型在教育、办公、汽车、人机交互等各个领域的落地。在本次发布会上，围绕星火大模型“1+N”架构中“N”个领域的内容，科大讯飞还发布了大模型在多个方向的行业应用成果。

具体来看，包括“大模型+AI学习机”，让AI 像老师一样批改作文，像口语老师一样实景对话；“大模型+智能办公本”，根据手写要点自动生成会议纪要，助力办公效能进一步提升；“大模型+讯飞听见”，一段录音、一键成稿，一分钟输出流畅会议文案；“大模型+智能座舱”，实现车内跨业务、跨场景人车自由交流；“大模型+数字员工”，基于自然语言生成业务流程和RPA，帮助企业员工完成大量重复性工作。

除了上述领域外，星火大模型还将赋能包括医疗、城市、政法、工业等在内的更多行业，满足更多专业领域的需求，向更广阔的产业领域延伸。

值得一提的是，刘庆峰表示，这一次没有专门发布讯飞医疗专用大模型，原因是医疗更加严肃、更加谨慎。但讯飞智医助理不仅比现在ChatGPT的医疗能力强，比ChatGPT4.0也要强很多，预计医疗专用大模型将在10月24日正式发布。

“今天要看一个大模型系统到底好不好，首先要看它是不是能解决刚需、是不是真的有用，而不是一个简单的单点测试。”刘庆峰说。

“我们要向OpenAI致敬和学习，同时也要快速追赶并努力超越，而这需要一套科学系统的评测体系。”刘庆峰说，科大讯飞通过认知智能全国重点实验室牵头设计了通用认知大模型评测体系，并与中科院人工智能产学研创新联盟和长三角人工智能产业链联盟共同探讨形成了覆盖7大类481个细分任务类型。在科学的评测体系中，推动大模型的发展。

算力硬件由华为提供

“科大讯飞一直认为，人工智能的发展绝不是单个企业和单个科研机构的事情，而是需要大家合作共赢的。”刘庆峰说。

目前，讯飞开放平台已经开放了560项AI能力，并聚集了超过500万生态合作伙伴。刘庆峰宣布，首批来自36个行业的3000余家企业开发者将接入星火大模型，联合各行业合作伙伴共建大模型“星火”生态。

在备受关注的算力方面，刘庆峰透露，星火大模型算力硬件主要由华为提供，华为已经给讯飞派驻“特战队”，让大模型的算法在国产硬件上应用有更好的效果。

刘庆峰认为：“目前国内的AI算力落后美国一代，但是未来AI竞争的关键不是算力。就国内做大模型的企业来看，算力和数据是国内企业共同的短板，而不是科大讯飞一家的短板。”

他表示，算力方面科大讯飞将联手华为，“使我们未来认知大模型的持续进化，要在我们自主可控的平台上，不断地提升。”