专访第四范式戴文渊:澄清AI热潮背后的误解,向“无穷大”前进

2024-08-12 16:14:07 每日经济新闻 

一部由史蒂文·斯皮尔伯格(Steven Spielberg)执导的电影《人工智能》,讲述的是一个小男孩最终发现自己是人工智能的故事。

人工智能什么时候才能达到这样的水平?难道人工智能的作用就是制造一个类人智能体吗?这是第四范式创始人、董事长戴文渊投身人工智能产业早期最令他迷惑的两个问题。

最终,他在图灵奖获得者詹姆斯·尼古拉·格雷(James Nicholas Gray,昵称Jim Gray)2007年《科学发展的四个范式》的演讲中找到答案。其中,第四范式阶段是指数据科学——随着数据爆发式增长以及技术演进,科学理论由计算机从海量数据中发现。

戴文渊所创立的人工智能公司“第四范式”的名字也由此而来。这家成立于2014年的企业级人工智能平台企业,迎着人工智能的潮起与潮落成长至今,作为掌舵者,戴文渊向《每日经济新闻》记者分享的心得是,不要太在乎AI(人工智能)是不是能做所有事,或者不能做所有事,因为这对于市场来说也不重要,客户关心的问题是:“我是卖鸡翅的,AI能做的所有的事情,跟我有什么关系?重要的是我的鸡翅能不能(通过AI)卖得更好。”

大模型时代,第四范式主张对模型进行“剪裁”,以求用最“经济”的方式做领先的AI。在戴文渊眼中,通用大模型和行业大模型是实现AGI的不同路径,区别在于是用一个模型去实现AGI,还是用很多模型去实现AGI。而两相比较之下,行业大模型是他认为最“经济”的方式。

热潮与误解一同翻涌,市场期望AI解决所有的问题

新的热浪翻涌在第四范式成立的第十年,这也促使戴文渊作出了一些改变。

2023年,很多人找到戴文渊,问他:“ChatGPT会怎么帮助到我的企业?”上一次他被问及类似的问题是在2016年,那时,问句的主语是AlphaGO。

更有趣的是,这一次,几乎所有的客户、投资人、媒体记者都在使用“技术的语言”来提问,“参数”成为高频词,与之前的状况大不相同。

戴文渊说:“要把AI做好,就先不要谈AI的问题,先谈谈公司是做什么的,把这些问题谈清楚,咱们再回头看看AI是不是可以(对公司)有帮助。”

市场和客户都对新技术感到兴奋时,戴文渊希望能借此机会引导一个正确的“AI价值观”:“不能先把参数做到一千亿,再想这千亿的参数到底能干什么?”

市场期望AI解决所有的问题,这反映了一种恐慌心理:万一AI能做但是自己没有用到,那可能会失去一些机会。戴文渊将此视为一个机遇,“担忧”打开了世人想要了解AI的窗子,但误解也同热潮一同翻涌,第四范式要做的,是把AI的价值带到众人面前。

ChatGPT,这个目前最火爆的大模型应用,将大模型带到了人工智能圈层以外的世界,热浪之下,一些人对于大模型的理解或许是:和ChatGPT一样的技术。

直至今天,市场中最受关注的大模型依旧是以大语言模型为主,即“预测下一个字”的模型,年初爆火的Sora则是“预测下一帧画面”的模型。

但应用是更加实际的事,对于绝大多数企业而言,“预测下一个字”解决不了核心问题。例如,金融机构需要解决风控问题,但这不是语言问题;大语言模型可能会辅助金融机构解决客服事宜,但这可能不是它的核心问题。真正的行业大模型应当是针对不同场景,构建不同模态,去预测下一个“事情”。

这背后有一个更大的误解——很多人问,能不能基于开源大模型底座或GPT,训练行业需要的新模态模型。但即使同样出自OpenAI之手,要在GPT模型上直接精调出Sora,也是不可能的事情。

戴文渊介绍,大多数行业大模型是要基于特定业务所积累的特定模态的数据,训练出一个基座大模型,就像目前训练底座的大语言模型、视频模型一样。

其实,行业大模型这件事,其实已经发生了十年之久。2014年,第四范式推出人工智能平台——先知1.0,用建模型的方式,挖掘业务数据价值,提升业务效果。如今“先知”已经迭代到了5.0版本,定位于降门槛,让企业自行构建高价值场景所需的行业大模型,例如预测疾病风险、欺诈行为、灾害险情、设备故障等,打破大语言模型只能生成文字、图像、视频的局限。

信心不再是问题,但市场的耐心有限

1956年夏天,在达特茅斯学院举办了一场人工智能研讨会,主题研究“让机器能像人那样认知、思考和学习,即用计算机模拟人的智能”的科学。

这次会议被普遍视为人工智能技术的起点,由此出发,人工智能开始沿着一条波浪式的曲线前进,经历着巨大的潮起与潮落,穿梭在失望与希望之间。

两到三年,戴文渊认为这是市场能给一场技术热潮的最大耐心。

距离我们最近的一次潮起被认为来自2016年,基于强化学习算法的AlphaGo战胜人类围棋选手李世石,“机器是否会代替人类”在彼时引发市场关注,商汤科技、旷视科技等一批人工智能“独角兽”站到台前。

第四范式是一家幸运的公司,这家公司诞生于2014年,从诞生的第一天就开始做企业端的生意。不过那时候,很多企业告诉戴文渊,自己没有人工智能预算。随着AlphaGO成为那枚投向平静水面的石子,突然之间,所有的客户都找来问他:“你们是人工智能企业,你来给我讲一讲AlphaGO可以帮我做什么?”“我们有预算,我们要AlphaGO。”

两三年的时间,人们理想中的人工智能工具没有诞生,市场信心在2019年崩盘。据猎豹全球智库数据,与2018年相比,2019年中国人工智能企业的融资金额由1484.53亿元下降至967.27亿元,下降幅度达到34.8%,融资数量也由737个下降至431个,下降幅度达四成。

直到ChatGPT成为下一颗石子,这场“寒冬”结束,AI市场再度迎来热潮。

戴文渊认为,在2023年以前,市场对AI是信心问题;从2023年开始,不再是信心问题,而是要找到正确路径的问题。“不用担心客户认为AI没有用,需要解决的是,引导客户反过来想业务的问题。”戴文渊说。

潮起潮落,似乎已经成为人工智能行业的常态。潮为什么落,戴文渊认为和“价值”相关。2016年,每家企业都陷入“怎么去用AlphaGO帮助到我”的问题中,这个潮落了。今天也一样,如果每家企业想的都是“怎么用ChatGPT帮助到我”,可能这个潮也会落。

戴文渊判断,两三年内,如果大模型不能创造巨大价值,可能就会再度潮落,等待下一颗“石子”——或许是一个新的能够吸引眼球的东西,或许是能够在合理的投入产出中创造出足够价值的技术。

当下的机遇是市场的目光重新被吸引,但挑战同样在于,两到三年内能否兑现大模型的价值?

市场关注到人工智能“+”,戴文渊认为这个加号非常重要,这意味着,未来的两到三年,人工智能有可能可以去创造很大的价值,如果大家想的都是ChatGPT能不能帮到企业,可能不见得能创造市场预期的价值。

“以语言模型而言,去年主要的落地场景都与客服相关,如果在这么大的关注度之下,落地的应用全是问答类场景,可能两三年以后大家就失望了。”他说。

AI是一个实验的过程,目标是提升“北极星指标”

目前来看,大模型赋能行业,依旧是一个充满前景的故事。每个行业都有人在做贡献,有人在的地方,AI就有发挥作用的机会——理论上不存在大模型无法赋能的行业,人效上可以充分发挥想象力。

目前,绝大多数企业的核心业务都由人来作决策,但人作决策时往往面临两个困境:水平参差不齐、精力有限。当AI能力提升,哪怕其能力尚未全面超越人类,即便仅达到人类的平均水平,但如果能复制很多“人”,就很有可能提供更好的业务价值。

企业招聘员工时,并非需要每个员工都达到顶尖水平,而是注重每个员工是否能为企业带来积极的贡献。因此,戴文渊认为,尽管第四范式的目标是使得AI的表现超越绝大多数业务专家,但从实践角度来看,AI即使仅仅达到专家平均的能力水平,也有可能为企业带来显著的价值提升。

从数字化时代开启到数智化时代来临,赋能传统企业与实体经济始终是市场对技术的期待。随着大模型来临,数字技术从传统的信息搜集、传输、整理、储存,逐渐走到辅助决策甚至替代决策阶段。

戴文渊指出,一些企业当前在使用AI时,依旧存在数字化时代的惯性思维,即过于依赖同行业的成功案例,试图直接移植成熟方案落地到本企业。但实际上AI和企业核心竞争力相关以后,不同企业的目标是不一样的。

这背后的根本原因在于,数字化时代,技术解决的不是核心业务问题,而是通过提升边缘问题的效率,进而让整个企业的效率提升,但是核心问题仍然是人在解决。进入AI时代,核心问题将交由机器学习,所以每家企业所定位的核心竞争力也不同,无法完全复制。

理想状态下,大模型应该能够帮助企业完成核心决策。为此,第四范式将企业的战略目标转化为计算机可以记录和跟踪的语言,即企业的“北极星指标”,以此作为企业最核心的关键指标。

戴文渊认为,对于企业而言,在使用AI前,需要先想明白一点:对于提升“北极星指标”,什么叫好,什么叫不好。以实体零售企业为例,其核心效率体现在每平方米所贡献的效益上,这可能就是一家零售企业的“北极星指标”。所有围绕这一指标的改进,都需要量化其对“北极星指标”的实际影响,无论是提升还是下降。

戴文渊强调,企业的“北极星指标”永远是正确目标的近似。因为方向总会发生偏移,需要及时调整后又前进。而定位的调整,需要企业的核心决策者来完成。他认为,企业有效使用大模型的核心是,一定要变成企业的“一把手”工程,因为“一把手”需要告诉AI什么是对的,什么是好的,否则转型很难成功——在人工智能的世界里,0和1是确定的。

而在实践中,AI的应用并不意味着每一步都能带来提升。

“AI其实是一个实验的过程。”戴文渊举例,假设有一百万的客户基础,可能将九十万作为基线,剩余的十万,每一万作为一个实验组,持续尝试模型的优化与迭代。“早期的实验基本上是成功的,每次实验都会比九十万更好。但是到了一定阶段绝大多数的实验都是失败的,也没有关系,往往到了一定的规模体量以后,一百次体验如果能成功一次,就能赚回前面九十九次失败的所有成本。”戴文渊说。

AI是一个实验的过程,这是戴文渊的认知,但尚未在客户中达成共识。

客户的认知提升是AI产业发展至关重要的一环。如果认知迟迟没有发生变化,AI会重新变成“需要有一个大模型、交付一个大模型,这个大模型的参数是不是一千亿,是一千亿就验收通过付款、结束”的过程,也许再经过一年半载,客户会觉得,大模型好像没什么用。

这时,热潮可能将会再度遗憾告终。

AI是科学问题,AI应用是经济问题

在通往通用人工智能(AGI)的路上,通用大模型和行业大模型是两条不同的技术路线,戴文渊认为,大家都是朝着AGI的方向前进,区别在于是用一个模型去实现AGI,还是用很多模型去实现AGI。

在他看来,从架构角度、算力、能源成本而言,用一个模型去解决所有的问题,不是最经济的。

戴文渊还提出了一个更为少见的观点:并不存在真正的通用大模型,所谓的通用大模型,本质是将多种场景融入一个模型中。例如,通过收集网络上的广泛语料,并进行切分以支持不同垂直场景。优化通用大模型的过程,需要对其各项能力进行全面评估,一旦发现某项能力相对薄弱,再增加相关数据,以强化该能力。从某种程度上讲,这可以视为不同场景的组合。

而第四范式的做法是,进行剪裁,先做垂直的行业模型。如果模型仅针对某一特定场景进行应用,就先通过该场景的数据模态构建专用模型,同样参数量往往能实现更好的效果。相反,若模型被设计为一个通用大型模型,最后通用大模型应用到某一具体场景,往往很可能是不经济的。

戴文渊说:“比如我现在是人工智能的从业者,其实也是被剪裁的,我花了绝大多数的脑细胞去干AI,没有花心思去学习怎么写小说。如果我是一个全才,每个方面都很厉害,我去选择做AI就很屈才了。从经济角度说,一个被剪裁过的模型更好。”

“经济”,在一个小时的采访里,戴文渊至少5次提到这个词。“我们致力于把这个问题(解决),或者把这个技术做出来,如果我选择了不经济的一条路,可能最后我会做不出来,我们要综合考虑每一种方向,每一个路线所面临的问题,最后找到一个最有可能的解决方法。”戴文渊说。

“做最领先的AI是特别特别贵的事,需要花很多钱。”或许正因为如此,在技术信仰派和商业信仰派之争中,戴文渊认为自己处于两者之间。

AI显然是个科学问题,但做出最领先的AI技术,是个需要计算的经济问题。

戴文渊认为,经营一家AI技术公司,需要站在商业的角度思考问题:最领先的AI技术需要海量的算力和数据,如果不能和商业更好(地)结合,那么长期持续的资金投入将变得难以为继,“既需要技术又需要商业,如果你要做最好的东西,就必须要都有”。

此外,对于AI从业者的自我修养,戴文渊认为,还需要具备韧劲与恒心,“人工智能就是一个起起伏伏的赛道,可能这两年又被大家关注到了,甚至被吹上天,被吹上天的时候你不要觉得自己是神仙。同时,被踩到地下的时候,也不要觉得自己没有价值”。

波浪式前进的过程中,可以肯定的是,通往AGI的道路并没有一个标准的指路牌。

“AGI是我们所有人的理想,AGI就是我自己心目当中的一个无穷大。”戴文渊从来不认为AGI是一件三年、五年甚至十年就能实现的事,相反,他觉得,AGI是一件永远做不到,但永远都在做的事。他又补充道,可能在不久的将来所诞生的人工智能,在人类看来已经是AGI,判断的因素在于,“对于人来说,人工智能究竟是不是AGI,在于能不能发现它还有地方不会。如果发现不了,那这对人来说已经是AGI了”。

每日经济新闻

(责任编辑:郭健东 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读