4月17日,昆仑万维(300418)正式发布大语言模型“天工”,宣布即日起启动邀请测试,并在官方直播中对大模型进行了现场演示。官方称,该模型已经非常接近OpenAI ChatGPT的智能水平。
这是国内继百度、阿里、商汤之后,第四家发布大语言模型的公司。不过,它对于很多人来说或许有些陌生——事实上,昆仑万维是第一批进军海外游戏市场的中国厂商,以页游研发和全球发行业务起家,旗下拥有浏览器Opera、社交娱乐平台StarX、全球移动游戏平台Ark Games等产品。
(资料图片)
根据官方资料,该公司在2020就已投入数千万元组建研发团队,在去年的北京AIGC技术发布会上,昆仑万维CEO方汉也宣布推出“昆仑天工”AIGC全系列算法与模型,包括图像、音乐、文本、编程并宣布模型开源。当前,相关模型在GitHub上最高超过500星。
而此次发布的“天工”大模型由昆仑万维与国内AI团队奇点智源联合研发,据悉,“天工”模型成本投入为数亿元,模型参数量为千亿级,基于3万亿中文单词数据进行训练,最高能支持1万字以上的文本对话,实现20轮次以上用户交互。
同时,官方也表示,“天工”是国内第一个真正实现“智能涌现”的GPT类大模型,并称“友商模型的逻辑推理是靠定向优化来覆盖特定题库,而不是靠大模型的智能涌现来解答较为复杂的问题”,而靠“人工打补丁、定向优化”的方式是不能真正实现人工智能的。
昆仑万维官方所说的“智能涌现”指的是一种自组织、自适应的现象,即在大规模的互动和协作中,系统呈现出一些出乎意料、无法预测的新属性和行为。
“涌现”(Emergence)这一概念常在AI领域被提到,比如,当人们用更高的算力,在更多数据上训练更大的模型时,除了定量改进所带来的稳定的提升之外,模型还可能“解锁”一些没有被直接训练过的新能力,包括较为复杂的推理能力、总结段落等。
从复杂系统科学的角度来说,一个AI大模型能够展现出涌现的能力也就表示模型已经成为了一个能够灵活适应环境,甚至能在少量提示下就可以学到全新技能,拥有自主学习能力的复杂系统。
而对于“天工”模型当前以及未来的应用方向,昆仑万维CEO方汉在17日的直播上表示,当前昆仑集团的各个业务都在AI化,包括游戏的美术设计、游戏策划、内容运营、编辑、广告策划等文字工作较多的工种,很快也将开放“天工”模型的B端API接入的计划。
在直播最后,方汉也表示,他认为当前通用人工智能(AGI)已经实现了从0到1的突破,在未来15年内或许就会出现更大的突破。而对于业界当前这一轮AIGC的竞争过程中,一定会诞生新的互联网巨头或领军企业。
综合:南都记者杨博雯
ChatGPT
记者