AIGC的一小步,人类文明的一大步

2022-12-27 20:12:52 阑夕 微信号 

文 | 阑夕

1779年,奥地利女皇玛利亚·特蕾莎收到了一份特殊的礼物,一位发明家声称创造出了可以自动下棋的仿真人类,因为造型身披土耳其礼服,所以这个装置被称作是「土耳其机器人」,在宫廷巡游里,它击败了多名国际象棋高手,甚至包括本杰明·富兰克林和菲特烈大帝,很快便声名鹊起。

「土耳其机器人」的秘密并不复杂,它的体内其实藏了一个精通国际象棋的侏儒,通过透镜折射,侏儒能够看到棋盘走势,并通过磁铁操纵所谓的机器人移动棋子对弈,与其说这是一件科学工艺的作品,不如说它更接近于现代魔术,障眼法才是真正的妙诀所在。

但是,「土耳其机器人」的故事并非就此结束,1819年,英国数学家查理斯·巴贝奇和它下过2次棋——很遗憾,都输了——然后猜出了这个骗局的本质,不过巴贝奇没有就此揪着不放,而是将这种自动化的思路放在了对于分析机的设计里,他的毕生都在致力于做出一个能够自动计算函数表格的机器,就像「土耳其机器人」那样准确无误。

如果说巴贝奇是在制造最早的计算机,那么他的同事阿达·洛芙莱斯就开发了最早的软件,她敏锐的意识到分析机能做的事情绝非只有自动化的计算,而是有潜力发展出全新的「诗意科学」(Poetical Science),在程序的驱动下,这种机器甚至将能自主编写不可思议的曲谱。

只是,当时谁都没有想到,这个充满乐观的设想,还要花上几百年才能实现。

· · ·

就在这个月,昆仑万维(300418)开源了名为「昆仑天工」的AIGC全系列算法模型,模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力。

以天工巧绘SkyPaint为例,你可以在小程序中随性输入一句话即可得到一幅画作,哪怕是中英文双语输入也能得到多种风格的AI绘画作品。在这背后发挥作用的,是全球第一款多语言Stable Diffusion分支模型和1.5亿中英双语语料,这也是国内为数不多的支持中英双语的文图生成模型。

天工乐府SkyMusic则是国内第一款商用级作曲AI模型,它不但可以编曲,还能基于旋律或是文案素材创作歌词,迄今为止已经发行了近20首AI生成的商用歌曲,甚至都有ISRC版权认证,在交易市场买卖流通。换句话说,你在Spotify、网易云和QQ音乐随机听到的歌曲,可能就有天工乐府SkyMusic的AI作品,在短视频BGM和有声书配乐等要求相对更低的领域,AIGC的覆盖率还会更广。

天工妙笔SkyText可以为用户提供续写、对话、中英翻译、内容风格生成、推理、诗词对联等功能服务。比起《庆余年》里只会背诗的范闲,天工妙笔SkyText更具创造力,能够带来让人耳目一新的佳作。这些创造性思维,是由千亿级别的高质量中文数据集训练而来,在训练4周、后续优化2周后最终得到百亿参数量的GPT-3生成模型。

天工智码SkyCode是全球第一款多语言开源编程大模型,支持多种主流代码语言SkyCode能够生成的代码,不仅包括使用广泛的python、Java、C等,还涵盖了php、go、swift等共计十余种编程语言,使不同语言的使用者都能来体验SkyCode强大的代码生成能力。换言之,天工智码SkyCode就是一位可被你随时随地调动的AI智能编程助手。

巴贝奇和洛芙莱斯看到的那个未来,以及「诗意科学」的开枝散叶,至此真正成为了近在咫尺的现实。

在把模型开源并上传到GitHub之后,昆仑万维的CEO方汉说,他坚信开源才能推动AIGC的生态发展,这种选择在中文互联网的环境下并不多见,甚至连近来大热的ChatGPT,其背后公司OpenAI就都还没有开源GPT-3模型。

开源本身的价值在于,它可以经由第三方的大规模使用,加快模型更新迭代的效率,和「一家独大」的ChatGPT不同,AI绘画的爆发——似乎每家互联网公司都搞出了一款输入文案生成图画的产品出来——就得益于文图生成模型Stable Diffusion的代码开源,而所有的训练数据,终将反哺Stable Diffusion变得更加聪明。

昆仑万维大概也希望在模型层的布局能够强化这家公司的竞争壁垒,毕竟它从2020年开始就在AIGC赛道砸进了重磅资源,它的主要业务——游戏、社交、音乐等等——也都对AIGC的工业化应用有着高度需求,投入产出的真章,都会见于技术力的厚度。

事实证明,人工智能的指数级进化,和它新增的落地场景有着正比关系,从AlphaGo击败李世石和柯洁,到ChatGPT和网友们谈笑风生,人和机器之间的边界越是模糊,生产力的变革也就越是急迫。

至少,行业内的共识都是:大的要来了。

· · ·

学术界有一个经久不衰的讨论话题,就是何为人类的独特性,比较主流的解释包括但不限于直立行走、懂得使用工具、拥有复杂的语言系统、具有理性等等。

历史学家尤瓦尔·赫拉利在代表作「人类简史」里把上述归因都杠了个遍,比如他说能够直立行走的远非智人——即现代人的先祖——像是直立人和尼安德特人都是能跑能跳的人属,只不过它们没能存活下来罢了。

最后,赫拉利的结论是人类拥有虚构能力,这是所有其他物种都不具备的素质,因为可以创造并相信虚构的故事,人类文明诞生了神祇、国家、民族、货币、权力等等诸多认知,这才彻底拉开了与野兽之间的差别。

有趣的是,赫拉利在「人类简史」出版十周年时,要求GPT-3模仿自己写了一篇新序,最后生成出来的结果让他「毛骨悚然」,以致于他说,斧头、车轮和火药都给予了人类新的力量,然而有史以来第一次,人工智能这种力量可能会脱离人类之手。

赫拉利当然应该惊慌,因为他用了很多年研究出来的那个终极答案——人类的独特性在于能够虚构和创造——被轻而易举的颠覆了,神圣的权柄悄然旁落,一切的坚固也就荡然无存。

在拥有天工乐府SkyMusic这种AI作曲产品之后,昆仑万维成立了一家名为MusicX Lab的实验室,旨在落地AIGC的商业模式,除了在全球发行完全由人工智能创作出来的歌曲之外,它还联系了很多青年歌手,说服他们接受AI成为自己的「合伙人」。

在MusicX Lab筹办的夏令营里,学员的角色被定义为「参与式原创」,相比李宗盛那样自己给自己写歌的传统唱作人,新生代歌手们更像是工程师,他们输入要求、管理过程、监督结果,最终由AI补齐成品,歌手直接拿着写好的歌词和谱子进录音棚。

从不同的角度来看,这种生产关系的改变必然有着二象性,悲观者会认为,这是人类在让渡创造性的溃败史上的又一次投降,对于未来的机器人军团抢走饭碗这件事情浑然不知,而乐观者却能看到工具价值的提高对于人类工作效率的增益,就像没有人会因为汽车取代了步行而感到难过。

无论如何,艺考教材上的一道对错题恐怕需要把标准答案从「正确」改成「错误」了:艺术创作是人类特有的一种高级的、复杂的精神活动与实践活动。

· · ·

根据测算,ChatGPT的对话成本大概是几美分一次,聊个十来分钟可能就相当于一个巨无霸汉堡的价格了,考虑到使用规模,发展这类业务的最大难题,还是在于如何解决商业模式的可持续问题,OpenAI可以依靠融资暂时支持ChatGPT「广迎宾客」,但在产业端,真正的定心丸,还要等到羊毛出在谁身上的答案出炉。

或者,就像昆仑万维的试探方向:「你已经是一个成熟的AI了,该学会自己挣钱了。」

因为旗下游戏产品相当丰富,昆仑万维实际上长期都对场景音乐的制作或是技能图标的绘制有着极高的需求,而在过去的采购清单里,外包一首乐曲的费用是2万块钱起步,设计一个游戏图标则要600块钱,积微成著下来,开销向来不低。

而在有了AIGC的硬投入之后,昆仑万维率先成为了自家技术的买单方,由人工智能生成的乐曲,平均每首的成本不到5块钱,而图标设计的成本更是低到可以忽略不计,更重要的是,生产周期都开始以秒为单位进行,对于公司降本增效的赋能很大。

这很容易让人联想到AWS的历史。

弹性计算云的诞生,本来是杰夫·贝佐斯用来解决公司内部各条业务线之间过度损耗的问题,但是后来亚马逊意识到,它遇到过的问题,很有可能在其他公司也会出现,所以AWS作为解决方案,完全可以做成商业服务卖出去,避免「重复造轮子」的浪费——更重要的是,它们造出来的轮子,可能还没有亚马逊的好。

所以AWS后来成为了亚马逊集团里最能挣钱的一片飞轮,也证明了科技公司的能力溢出价值:在苛刻的标准里,能够自产自销的产品,一定也拥有行业上的横向竞争力。

在昆仑万维的布局里,AIGC的商业价值也在于它在内容端的生产能力,以及在toB场景下作为智慧杠杆的劳动替代能力。

如果说模型层的开源是一种互利互惠的考虑——为社区贡献技术资源,同时借助社区的数据交互更新算法——那么应用层的变现,则是可以把AI封装为辅佐专业人员以及公司的助手,「不眠不休」的为他们写代码、编曲子、画地图……而在toB场景中,随着各种AIGC工具的产品深度不断提升,甚至可以逐渐驾驭各种专业型内容的产出,从底层商业逻辑上去改变内容产业。比如,创意公司不再需要担心核心员工的突然跳槽,也不再害怕因为员工个人情绪波动而影响公司的创意质量。

从这个角度来看,数据是科技时代的石油这个说法并不准确,比特本身没有价值,使用比特的结果才有价值,所以智能才是未来的能源,它的廉价化和无处不在,才会改变地球上每一个人的生活方式。

· · ·

在制作分析机时,巴贝奇和洛芙莱斯找到了一个愿意资助他们工作的有钱人、同时也是物理学家的大卫·布儒斯特,他在目睹了「土耳其机器人」及其引起的科学探索之后,说了一句意味深长的话:

「那些本来为了取悦普通人而发明出来的自动化玩具,现在正在用于开拓我们人类的能力并将文明带向更新的境界。」

AIGC的热潮,也在呼应着这句几百年前的箴言,成千上万的网民在各种实验性的应用里玩得不亦乐乎,兴奋的把光怪陆离的图片和对答如流的截图发到社交媒体里,也让人工智能成了一个充满猎奇属性的乐子。

但在普通人看不到的代码深海里,在每一张芯片、每一块显卡的功耗里,智能的进化从未停止,并且,越来越快。

本文首发于微信公众号:阑夕。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。

(责任编辑:周文凯 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读