当前位置:

Enjoy出海 >

新闻资讯>

2024年,大模型公司、投资人、游戏厂商如何看待AI?

2024年,大模型公司、投资人、游戏厂商如何看待AI?
码字机器  ·  Aug 28, 2024 11:49:03 AM

近两年,国产AI大模型成长显著。由智谱AI、百川智能、月之暗面、MiniMax等头部公司领衔,AI大模型在理解、推理和创造方面的能力得到了显著提升,也为AI在各个应用领域的落地提供了强大支持。2024年,AI效率工具应用、AI陪伴社交应用等均有成功产品在国内和海外市场跑出。

 

从不同的角度看待AI,每隔一段时间都会诞生新的答案。每一次关于AI的行业交流,一定程度上都在推动着智慧的飞跃,加深我们对未知世界的探索。

 

2024年ChinaJoy期间,出海【生·长】「智启新境 游遍星辰」 游戏&AI开发者峰会在上海徐汇区举办。期间在主题为「生生不息,探索AI创新」的圆桌对话中,MiniMax B端产品负责人武僧、连尚网络投资总监王慧超和武汉多比特AI事业部VP程伟光,从大模型公司、投资人、游戏厂商这三个角度,分享了他们对AI变化的观察、决策过程、成就和未来布局的深入思考。

 

图片

以下为圆桌讨论的精华内容整理:

 

主持人感谢大家参与今天的圆桌会议。先请三位嘉宾做个简单的自我介绍。

 

武僧大家好,我是武僧,来自MiniMax,负责B端业务的产品。感谢此次活动的邀请。

 

王慧超:大家好,我是连尚网络的王慧超,我们主要投资于AI和机器人相关的赛道。谢谢大家。

 

程伟光:大家好,我是来自武汉多比特的程伟光,主要负责公司的AI相关业务。

 

不再只是展示PPT,也能下载APP了

 

主持人过去一年,AI发生了天翻地覆的变化,每隔一段时间就有颠覆性的技术和产品问世,国产大模型后来居上,AI应用愈发成熟,在座的嘉宾有做大模型的公司,在B端或C端场景下研发了对应的解决方案和产品,也有高度关注AI的游戏公司,以及投资人,从你们的角度来看待过去一年,你们观察到的变化有哪些?

 

武僧:有两个直接感受。第一,越来越多的公司积极寻求将AI融入到自己的产品和应用场景中,我们称之为“产品+AI”。过去一年,市场上不断涌现出各种AI产品。

 

第二,关于大模型基座能力的变化和多模态的发展,速度超出我们预期。国内大模型通常每3-6个月进行一次迭代,此外在多模态能力上,现在除了文本模型,语音、图像和视频模型的多模态技术也在储备中。

 

图片

MiniMax B端产品负责人武僧

 

主持人:不久前武僧也和MiniMax一起参加了世界人工智能大会。这次到线下感受如何?大家对AI是怎样的态度?

 

武僧:我很幸运参加了过去两届大会。去年大家主要讨论未来的AI产品和可能性,而今年则明显转向落地的场景和应用。

 

直观感受是,现在的展台不再只是展示PPT了,而是可以下载他们的APP。这表明大家在模型应用结合上有了显著进展,不再是空中楼阁,而是能直接提升产品体验和用户增长,甚至具备未来的ROI想象空间。

 

主持人从投资人的角度,王总的看法是怎样的?

 

王慧超:我们从去年就开始关注AI方向,特别是这两年涌现出很多优秀的创业公司,比如MiniMax。

 

今年模型能力显著提升,成本快速下降,呈现出指数级的变化。多模态能力如图像、视频、语音等也在不断涌现,各个团队纷纷展示各自的技术。

 

去年在B端和C端应用上还较少看到成果,但今年许多团队以AI为核心,开始在应用层面取得了显著成果。一些团队在流量和用户认可方面表现突出,另一些则在商业化上取得了良好进展。

 

对比国内和美国,硅谷在B端的AI SaaS和多模态方向上比较活跃,而国内在AI的C端应用能力方面表现得非常强劲。这是我们观察到的明显现象。

 

主持人王总也出席了世界人工智能大会和Founder Park举办的AGI Playground,对一些项目感受如何?

 

王慧超:AI应用层的产品变得非常多,有各种AI方向的展厅,机器人也是一个强烈的主题。虽然机器人是一个讨论了几十年的话题,但这次的热度再次上升,其实是因为大模型为其提供了新的想象力,大模型可能会成为机器人的“大脑”。

 

在应用层面,我印象深刻的是这次大会上的“AI Future 100”。虽然并没有100家公司,但有几十家专注于应用方向的企业,从全国各地汇聚而来。此外,徐汇区也有许多优秀的AI公司。

 

主持人从游戏公司的视角,程总感受到的变化是什么?

 

程伟光:我觉得整体趋势与前两位的看法非常相似。去年大家可能更多关注模型的新版本和新能力,而今年大家更希望将这些能力实际应用到业务场景中。


这一变化体现在多个层面。例如,去年我们在接入各种模型能力时,会面临成本高、上下文长度不足或不支持多模态等技术限制。然而,今年我们看到许多以前考虑过但未能实施的项目正在被尝试。

 

我最近统计了一下,我们在发行、研发、图像设计、宣传和产品运营等多个维度上,已经有十几个场景在实际应用。之前我以为我们并没有这么多应用,但细看后发现其实有很多场景正在落地,这个变化非常明显。

 

主持人在前天的Unity大会上有一场AI的闭门讨论,程总作为嘉宾也做了分享。我比较好奇,这次闭门讨论产生了哪些观点和碰撞?

 

程伟光:我们探讨了如何将AI相关技术落地到具体的企业场景中。尽管我们公司有专门的部门和人员在做这方面的研究,但实际上,对于绝大部分企业而言,落地仍然面临一些门槛。虽然我们知道可以通过API等简单调用方式使用这些技术,但技术如何与应用场景结合,仍然很模糊。

 

大家开始时会吐槽,为什么所有的AI产品都是对话框,但在实际使用中,发现对话框并不是最佳方式。例如,我们公司在图片领域有许多应用,因为有许多美术人员。最初,我建议他们使用显卡和FUI(功能用户界面),但后来发现,不仅美术人员需要使用,策划人员也希望参与。

 

此外,设计人员面对一些技术性的内容时,仍然有高门槛。我可以看教程,但作为非专业人员,仍需研究如何运行命令,处理报错或内存溢出的问题。这些技术门槛与工作场景的割裂使得美术人员在实际操作中感到困难。

 

例如,美术人员平常使用PS和AI,但我们单独将这些功能放在网页上,生成图片后还需复制粘贴回去,显得不够方便。在探索阶段,这种方式还算可以,但真正将其融入工作环境后,会发现使用上非常不便。他们虽然希望使用,但却难以实现。

 

因此,我们正在尝试将这些能力转化为API,嵌入到我们的业务流程和系统中,甚至融入PS插件和其他工具流中,以降低使用门槛。这次讨论中,同行们也关注到了这一点。虽然他们并不是不会使用,但在与工作场景结合上仍有一定距离。

 

务实地看待AI、积累经验,不盲目随波逐流

 

主持人AI是一个新事物,尤其对于在座很多出海公司来说,涉及到AI的一些决策往往会考虑的更多。我相信每位嘉宾在探索AI的路上都有不同程度上的深入思考甚至是纠结的时刻,比如大模型公司会考虑底层模型和应用场景该怎么平衡精力,投资人考虑比较多是在资本密集的模型游戏之后再怎么去投资,游戏公司就很关注AI怎样让我更快赚钱的问题。你们有没有这样的时刻,每家公司是怎么决策的?

 

武僧:从B端的视角来看,我们与合作伙伴的纠结主要在于是否使用AI。尽管大家愿意尝试,但实际落地的过程和时间周期各有不同。许多公司虽然意识到AI的潜力,但却不知道如何有效利用它,缺乏可复制的参考案例。

 

在过去的一年中,成功的企业往往是那些愿意投入时间和精力去适配AI的,但这并不保证他们一定会成功。通常,企业的第一步不是直接开发出现象级的产品,而是积累AI相关的经验。比如,现在市场上有一个新兴职位——AI产品经理,这在去年之前并不存在。这个职位的出现说明了企业在适应AI方面的需求在增长。

 

我认为,随着科技的发展,企业需要寻找突破口和差异化的点,从而在AI红利到来之前抢先一步。

 

王慧超:我最近一直在思考AI对我们的生活和经济形态的影响。我认为AI将引领新一波红利,类似于移动互联网和PC时代的转变。我在纠结如何捕捉到最具潜力的AI项目。尽管市场上有很多创意和应用方向,但我希望能找到最具潜力的投资机会。

 

图片

连尚网络投资总监王慧超

 

从数据来看,去年全球对AI的投资确实达到了顶峰,而今年有所回落。但实际上,热情仍在。务实地看,无论如何,改变时代的始终是那些先行者,比如MiniMax这样的优秀企业在商业上面临激烈竞争。

 

程伟光:我认为会有阶段性的思考。最近我和朋友讨论这个话题时,他问我们作为游戏公司为何要使用AI。我们通常称之为AIGC或生成式AI,它能创造新的内容。

 

从本质上讲,游戏行业和目前流行的短剧本创作都涉及内容的生产,因此我们可以预测,AI将对游戏产生深远的影响。AI的出现意味着我们可以更实时、高效、个性化地生产内容,这将改变消费者的体验。

 

在宏观视角下,我们必须评估AI对业务的具体影响。实际上,决策并没有想象中那么困难。大家都知道在ChatGPT这一轮火起来之前,前置的还有Stable Diffusion,包括谷歌的Disco Diffusion 2022年5月份就有这个版本。虽然在早期,生成一张图需要半小时很夸张,但不到三个月的时间,Stable Diffusion就把这一过程缩短到了5秒钟。

 

从技术上看,AI能快速生成内容,这将极大地影响游戏的剧情设计、概念设计以及宣传素材的制作。过去两年,游戏行业讨论最多的一个话题是工业化,而AI能帮助我们更高效地完成游戏研发、设计和发行。

 

所以我们从这两个视角考虑AI的应用。刚开始时,大家对AI的理解有些模糊,尤其是关于大模型的问题。当我们提到AI时,常常被问及是否在开发大模型。尽管去年大家都在关注大模型,但我们的内部决策没有明确是否要开发大模型。

 

我们希望AI能帮助提升业务效率,例如提高研发生产效率和发行效率。利用AI与游戏内容结合,给用户带来更多价值是我们最终的目标。如果需要自己训练大模型,我们会考虑,也可能使用一些相关厂商的API。最重要的是根据具体情况进行评估,而不是盲目追逐潮流。作为管理者,我们必须务实地看待AI,评估它在我们的业务中所能带来的实际价值。

 

关于AI,各自取得了哪些成果?

 

主持人经历了决策层面上的取舍之后,这个问题更多聚焦一些案例,大家分别取得了哪些阶段性成果?

 

武僧:实际上,行业的发展速度比我们预想的要快得多。从去年开始,我们就是最早一批做B端的公司之一,早在去年4月份,我们就将MiniMax的文本模型和声音模型能力开放出来。

 

在场景应用方面,可以分为两个维度来讲。第一,我们在许多大厂头部公司的产品中加入了很多AI属性和玩法。大家如果留心观察,可能在五六款APP中就会发现一款具备AI功能或新产品形态的APP。虽然这些功能可能不是在一级入口,但至少证明了大家在产品形态上找到了与AI结合的方式,趋势是明确的。

 

第二,我们在一些新赛道上推出了AI+产品的形态,原本没有这样的产品形态,它是基于我们大模型的基础能力。例如,我们开发了人与AI交互的产品。传统的NLP逻辑通常是一问一答,没有发散性的思维或随机生成的可能性。目前市面上已经有几百款类似的应用。对我们来说,真正将模型与产品结合,并实现落地,是作为一家大模型创业公司能够带来的核心价值。

 

王慧超:从投资成果方面来说,今年我们正在积极储备AI和机器人方向的项目,并计划在下半年会有密集的投资行动。上半年我们已经出手了一些项目,但尚未披露。我们看好AI的应用方向,包括B端和C端的项目。对于机器人方面,我们关注了一些具身机器人和其他小型机器人的发展,这就是目前的情况。

 

主持人王总还比较关注短剧赛道,关于短剧与AI的结合,行业中有哪些案例?

 

王慧超:短剧加AI这个方向其实去年就有关注到,出现了几种不同的做法。首先是用AI生成视频,偏向真人的方向,这个难度是最大的。其次是AI生成的2D人物视频,最后还有一种是AI生成图片并将其组成视频。这些方向都涉及到整个故事脚本、配音和市场选择,不同市场对内容的要求也不同。目前在我提到的这些方向上,国内已经有很多公司在进行探索。

 

主持人多比特内部的成果如何?程总是否方便透露在AI上的人力成本和其他成本?

 

程伟光:我先分享一下我们的整体思路。虽然现在无论是图片还是文字的大模型看似已经降低了实现效果的门槛,但实际上,从尝试和验证阶段进入实际工作中的使用,门槛仍然较高。我可以坦白说,我们在内部花了很多时间。我们的核心目标是希望让更多人能够更容易地使用这些技术。

 

像MiniMax的API已经降低了门槛,但具体落到场景中,仍然需要懂AI和具体业务的人去结合应用。我觉得这是一个大的脉络。

 

图片

多比特AI事业部VP程伟光

 

例如,我们在图片相关能力的开发中,会将底层能力做成API。这是因为使用这些能力的人和场景是非常分散的,不仅仅是美术人员会用到,还可能嵌入到许多系统中。因此,我们希望通过API的方式,让这些能力能够原子化,嵌入到各种场景中。

 

第二块是考虑业务场景中的工作逻辑。例如,用户在Photoshop中使用插件,直接使用而无需考虑显卡等问题。这是我们沿着这个脉络去做的事情。

 

除了图片能力外,我们还在探索其他方向,比如本地化。AI技术的出现使得翻译变得更加高效。使用大模型翻译的最大价值在于,我们可以在提示词中提供场景和专业术语,模型会基于这些信息进行翻译。

 

在游戏场景中,专业名词的使用也很常见,因此我们可以将行业知识融入到翻译中。比如,我们开发了一个本地化系统,用户只需提供当前页面和场景信息,就可以使用我们构建的提示词,实现更好的翻译效果。

 

总体来说,我们在内部花了很多时间和精力在这方面。关于人力成本,我们认为不能把事情想得太简单。虽然MiniMax有API,但在接入后如何使用好仍然需要对业务流程、数据和场景进行梳理和整合,这个过程并不容易。

 

此外,我们还尝试将AI能力商业化。作为休闲游戏开发公司,我们成立了独立的AI部门,除了提升内部研发和发行效率外,也在探索对外商业化的方案,像刚才说的图片,PS插件,我们也都有一些对外的商业化方案。

 

未来先找到一些60分的场景,然后努力提高到80分

 

主持人:最后一个话题,怎样看待AI的“不确定性”,哪些环节需要我们未来去不断完善,让它变成一种“确定性”?以及从大模型公司、投资人、游戏公司的视角,下半年我们该如何发力AI?

 

武僧:这是个很好的问题,如何将不确定的事情转变为确定的事情。关于AI究竟能产生什么样的影响,我认为这在不同的应用场景和行业中是不同的。可以确定的是,AI的科技进步能够颠覆传统的用户思维和产品思维。

 

在大模型的时代,我们可以相信AI将会改变一些现有的状况,虽然具体会改变什么尚不清楚,但科技进步肯定会使人类生活更加便利,并带来更多的创新和玩法。

 

第二个问题,谈到模型能力的发展,我认为国内正在逐渐出现多模态集成类的模块。随着4o能力的出现,行业内开始探索端到端的交互模式,这种技术模式的变化将加速用户体验多模态带来的变化。可以类比于3G向4G的转变,网络速率的提升推动了移动互联网的发展,未来可能会出现类似的路径变化。

 

王慧超:关于不确定性,确实充满了未知,但我认为有一个主轴是比较确定的,那就是AI的能力正朝向AGI发展。虽然实现AGI的时间可能会很长,我们可以推测其具备的能力,并反向推导现在可以尝试实现的能力,而这并不局限于当前的大模型。

 

在下半年到明年,我认为AI手机和AI加硬件将会对生活产生重大变化。随着AI端侧能力的提升,个体感受到的AI应用将变得完全不同。虽然可能第一代产品未必能实现强大的功能,但我们会看到一些积极的变化。

 

程伟光:关于不确定性,我有两个层面的解读。首先,大家提到的大模型技术中常常面临“幻觉问题”,这带来了不确定性。尽管我们可能认为幻觉是个bug,但也许它的创造性与幻觉并存。在实际应用中,我们需要找到适合的场景来解决这些不确定性,或用其他方式弥补不适合的场景中存在的问题。

 

另外,用户对AI的应用落地时常充满焦虑,关键在于找到AI能做的事情并实施。这个过程是动态的,不会有完美的解决方案。我们可以先找到一些“60分”的场景,然后努力提高到“80分”。

 

当前已经有许多应用场景表现良好,例如客服领域,很多企业在市场营销和客服上运用大模型能力取得了显著成效。

 

在变化方面,我注意到技术与用户之间的距离正在缩小。随着技术的不断增长和迭代,更多的用户,包括不在行业内的人,开始感受到AI的存在与价值。这种趋势将加速发展,让更多人了解AI。

 

开通会员,查看完整内容