记者:在网络上保障安全,一些商业化的公司,甚至都可以去做,那为什么你要去做?
高文:遇到很难的问题,需要团队实力非常强,有一些商业公司,它不见得解决得了。
记者:它的难点是在哪儿?
高文:常规的那些公司用的一般方法,比如上一个工具程序,从头到尾把数据扫一遍,看看里面有没有异常。但是通常高手不会让你找到,所以可能就需要技术更专业一点,我们这个团队有很多工具,看响应是什么,根据这个再来分析,可能会有蛛丝马迹,最后把东西挖出来。
2022年,“中国算力网”一期工程“智算网络”正式上线。它连接并管理了20多个不同地域、不同类型的算力中心,汇聚算力规模逐步增加到5E Flops,相当于每秒完成5万亿亿次计算。其算力枢纽节点之一,就是鹏程实验室的人工智能算力平台“鹏城云脑Ⅱ”。
高文:你从这看过去,这是八行,八行其实就相当于是四台机器,每两行是一台机器。
记者:你那它的耗电量大不大?
高文:不小,每个月可能都要一两百万的电费。
“鹏城云脑Ⅱ”是鹏城实验室与相关企业联合研发的超级智能计算机,峰值算力达到每秒完成100亿亿次计算,于2020年启动运行。它比每秒能完成100千万亿次计算的“鹏城云脑Ⅰ”,计算能力强了10倍,而完成这次升级,仅用了一年时间。
记者:只用了一年提高了10倍?发生了什么?
高文:我们做“鹏城云脑I”的时候,那时候还是做判别式人工智能,通常它需要的算力没有那么大,100P其实已经可以满足需要了。通常我们会预判,对语言模型需要的计算和存储的能力,会比图像的应该要求更高一些,因为语言的语料更容易获得,可能语言处理需要的处理能力更强,所以要比做图像大10倍。
目前,“鹏城云脑Ⅱ”已在衡量全球高性能平台数据吞吐能力的IO500总榜单上连续9次取得冠军,同时在国际人工智能算力性能AIPerf500排行榜上连续4届排名第一。基于“鹏城云脑Ⅱ”,鹏城实验室搭建了一个AI训练平台,能够同时处理包含上千亿参数的超大规模AI模型。“鹏城·脑海”就是鹏城实验室在“鹏城云脑Ⅱ”上训练和运行的一个超大规模自然语言处理模型。
记者:为什么脑海没跑出来,DeepSeek跑出来了?
高文:倒不是说我们脑海不行,其实这个就是DeepSeek很聪明的地方,脑海和ChatGPT完全是同样的技术,它里面有一个模型叫注意力机制,像以前比如一篇文章,进到计算机里面,你让它处理,等处理到最后,前面的已经忘了。但是GPT就是Transformer,发明了一种方式,叫注意力机制,或者叫注意力模型,就是我只注意相关的,其他东西我就不管了,抓大放小。
原来的GPT是一个大包,所有的功能都在里面,所以用的时候就很累。DeepSeek就做了这样一件事,他把特定领域用特定的表述去训练它,这样训练的时候,开销就没那么大。它一共有256个专家,使用的时候不需要256个都装,最多装8个就够了,这样用的时候,需要的成本很低,训练的时间可以节省。DeepSeek我认为它不是理论上的创新,它更多是工程上。
目前,“鹏城·脑海”大模型的两个版本已向社会开源。高文和团队希望通过模型训练全流程开源开放的方式,将“鹏城·脑海”培育为中国算力网上的一个种子应用。
记者:你是最底层的这个源代码开源还是参数开源?
高文:其实两层都有,我们是把所有参数,我们叫切片,就是它在训练过程中,我每隔多长时间,我就开一个切片,研究者可以通过这个切片,去研究它在训练的过程中,它是怎么受训练的,中间有什么变化。另外我们源代码也开源,源代码开源以后,基本上用户其实拿着这个源代码,用他自己的数据就可以重新再去训练。
记者:那你付出所有的人、精力、资金,等于是你做了别人得益,可以这样理解吗?
高文:但是开源不仅仅是别人得益的问题。我开源了以后,别人在我这开源的东西,他也要开源,他开源以后,会使原来我的系统做得更好,然后我们会在所有开源的东西之上,再往上迭代,众人拾柴火焰高,所有参与的人都在添柴,都在加火。
培育出“鹏城·脑海”的算力平台“鹏城云脑Ⅱ”同样秉持开放理念。“鹏城云脑Ⅱ”算力的50%是鹏城实验室自研使用,40%开放提供给国内的合作伙伴、科研机构和高校,10%则释放给深圳市工业和信息化局,供社会开发者申请使用。在人工智能浪潮中,开源与开放精神正在成为业界共识。
记者:开源就意味着共享,对吧?共享和竞争矛盾不矛盾?
高文:其实从开源的角度,技术是不是自己的没关系,因为你就在那上面迭代。为什么现在OpenAI比较难受,因为它是闭源的,闭源就是别人只能求他,要和他签协议,他同意才行,他不同意就不行。
高文:这是整个生态的两条技术路线,这个生态早期都是闭源的,因为有版权,实际上是保护你这个软件的权利的。但是后来Linux(操作系统)是第一个把软件开源的,他的理念是这个东西是人类的资产,我把它放出来,但是我要求所有用这个软件的人,在上面做开发的人,你要给我一个承诺,就是我开源了,你要新做的东西你也要开源。
我个人理解就是开源可能更符合人类社会发展的方向,这和知识是一样的,以前那些手艺人、工匠,很多东西是代代相传的,万一哪一辈没传好就失传了,那后来为什么我们现在学的知识,每个人都可以学,因为这个东西开源了,知识就是开源的。
其实软件也一样,如果软件也变成知识,那你就应该开源,开源以后才能迭代。
“鹏城云脑Ⅱ”平稳运行的同时,高文已经开始着眼新的问题。目前,他正带领团队联合相关企业研发下一代超级智能计算机“鹏城云脑Ⅲ”,智能算力规模目标为每秒完成1600亿亿次计算,能力比“鹏城云脑Ⅱ”提升16倍。
记者:这个云脑Ⅲ未来可以做什么事?
高文:可以做多模态大模型的训练和使用,现在大语言模型的智能只是语言智能,其他智能还比较弱一点。所谓多模态模型,就是除了语言之外,我要把声音、视觉和语言都掺杂在一起,然后去训练,这样整个智能的水平,就和人慢慢比较接近了。我们也希望通过我们这台机器的建设,对国内的生态有所帮助。
整个机器还没出来,但是我们的原型机已经出来了。我们整个机器是157个机柜,但是我们现在已经做了3个机柜了,这些模型已经在这3个机柜上的原型机上面做训练,国家给我们的使命,是要去攻一个山头,就是要爬一个高峰,这个高峰肯定是别人都没有上去过的,所以你要先上去。