7月7日,2023年世界人工智能大会在上海开幕。东吴证券研究所作为本届大会产业投资主题论坛的主办方,与上海人工智能协会共同承办本场人工智能产业投资论坛。本场论坛邀请众多经济及金融领域领导和专家、A股最头部人工智能上市公司创始人及核心管理层、头部大模型企业创始人及管理层、国内外资深一二级投资者大咖云集在此,共同探讨人工智能产业的未来发展趋势及广阔投资前景。
昆仑万维(300418)CEO方汉受邀参加本次论坛,发表了主题演讲《昆仑万维的大模型发展以及应用探索》,他表示“通过我们的"一揽子"技术包装,把所有的技术细节隐藏起来,交付给用户的是端到端的内容生成工具,这才有商业价值。”
以下是演讲精华内容:
(资料图片)
大模型唯有落地,才能带来商业价值
人工智能近半年的发展可以说是日新月异,我自己感受非常明显,我从1995年开始从事互联网,赶上了互联网的大发展,也赶上了移动互联网的大发展。我从去年下半年到现在大概读了200篇左右的论文,因为这波的创新不能去市场上找想法,而是要去博士论文上找想法,这波的发展是非常明显的技术驱动的一个本质原因。另外,像ChatGPT也是我见过的渗透到人们生活里面最快的产品,AI真的是对普通人开始有作用了。
昆仑万维是国内AIGC领域,是一家典型的自力更生从头干起的大模型技术路线的公司,现在公司的战略也是All in AGI与AIGC。我们认为大模型本身只是一门技术,就像游戏领域的3D引擎一样,无法带来直接的社会效益,要让游戏大模型真正带来商业价值,那么一定是将它更好的去落地。
端到端的内容生成工具制作新的UGC社区
对于国内市场,我们的判断是B端的商业大模型一定是碎片化的,而C端一定是免费化的。2021年我们在训中文预训练大模型的时候遇到一个问题,很多的行业数据的格式并不是纯文本的,其次是没有解题过程,就导致所有的大模型企业要真正落地到各个行业,首先要把每个行业切切实实进行数据文本化,补足它的推理过程,这样大模型才能在行业的相关任务里面学会这个能力,这也导致了大模型企业很难有一家一统天下,没有一个大模型能够不学习这个行业的任何数据,就能在这个行业落地。所以我们的判断是,在B端必然是各个大模型企业在自己熟悉的行业率先落地,这需要一个过程。
C端免费化,大家知道OpenAI在美国的ChatGPT收费模式是订阅,还有它的API收费模式,这两点在中国都有一定的落地难度,首先中国人习惯免费。所以我认为国内的C端一定是以免费的信息服务模式为主,VIP模式为辅。同时办公软件、即时通讯、浏览器会成为主要的C端大模型服务入口。在API方面,中国的中小创业企业对于大公司的API是心存顾忌的,我认为中国的中小企业可能更倾向于自己去用开源模型搭自己的服务。
对于海外市场的判断,肯定是以C端为主,因为B端牵扯到太多的政治因素以及文化因素,最主要的是文化因素,最典型的就是中国的飞书、钉钉,对比海外的最流行的Slack、Teams,能发现这几个产品在设计文化上有根本的差别。我们在海外的C端逻辑就是制作端到端的内容生成工具,从而形成新的UGC平台。 解释一下为什么是端到端的内容生成工具?大家现在可能用StableDiffusion和Midjourney来做文生图的很多,但是它们的使用门槛非常高。第二,它生成的是素材,而不是真正的内容,这个素材要变成内容还需要再加工,这对于普通用户来说是无法忍受的,对此通过我们的"一揽子"技术包装,把所有的技术细节隐藏起来,交付给用户的是端到端的内容生成工具,这才有商业价值。
昆仑万维六大AI业务矩阵将逐步落地
我们现在有六大AI业务矩阵,包括:
AI大模型。有自己的AI大模型才不会被别人卡脖子,才能在特定领域的能力得到极大的加强。
AI搜索。这个搜索并不是大搜索,我们认为做搜索首先要解决大模型的两个问题,时效性和幻觉,这一定是通过搜索解决的。其次,只有通过搜索把全世界所有语种的知识通过大模型本体的最底层的知识迁移,让中国普通用户享受到,从而赋能大模型。
AI游戏,现在讨论AI游戏更多的是,用StableDiffusion去做美术工具,把2D美术人员全替代掉,用ChatGPT大模型去帮助策划文档等,但这只是一种简单的增效的工具。AI与游戏的结合,本质上我认为是通过AI创造新的游戏范式,这样才能形成下一代的红利。
AI社交,我们的理解是,所有的社交平台上,本质上供给和消费方完全不均衡,处于底层的用户很难在社交平台上获得稳定的情绪供给。但是AI的出现补充了最广泛的底层用户的社交情绪供给。举个例子,在线教育一对一模式是最不可持续的,因为能消费一对一服务的只有大城市的顶层的人,所有人能够消费起的是录播课,因为它是无限复制的。再往中间相对融合的就是AI小班课。我们认为AI社交即通过AI给人群提供服务。
AI动漫和AI音乐,全世界在AI音乐开展工作比较多的国外是微软和谷歌,国内是我们和字节,目前我们已经开始做音乐生成软件的测试和落地了。我们认为AI在AGI和AIGC落地最容易的一定是在容错率最高的场所。我一个朋友是做金融的,他不敢用AIGC写东西,万一写错了一个小数点,就会造成很严重的后果。但目前在图像生成领域多画一根手指头客户并不在意。所以AI在内容生成领域是落地最快的方向。
目前还有一个没有被攻克的问题就是AI生成视频的一致性,我们所有人都在研究这个问题,就我目前的观察来看,这个问题大概在今年底到明年就会得到解决,这个问题一旦得到解决以后,可以说在内容领域,从小说到漫画,从音乐到视频,这4个领域都会被AI彻底改变。
我常举的例子,像宫崎峻、新海诚两位的第一部成名作都是在40岁左右,因为只有这个时候他才有能力攒两百人的团队,花费一年创作作品。我认为在AI介入之后,以后可能一个不到10人的小组、花3个月的时间就可以出品宫崎峻质量的动画片,这意味着我们每年生产的高质量的产品规模,将直接乘以10甚至100,我们认为这个空间非常大的,所以我们在AI音乐生成和AI动漫生成也在投入力量,我们的产品可能Q3左右将在海外正式测试。
我们的观点就是AIGC这波大潮将起,但任何一个技术总是起起伏伏,它现在可能是在泡沫阶段,下一个阶段可能是挤泡沫阶段。但是最重要的是落地为王,我们一定要想着我们的大模型、AIGC能力是否形成产品、能否获得用户、能否帮助用户获得生产力。送大家一句话"大潮将起,落地为王"。