首页

中国工程院院士高文：要给AI算力建国家高速公路将让算力像用电一样方便

2025-03-17

记者：在网络上保障安全，一些商业化的公司，甚至都可以去做，那为什么你要去做？

高文：遇到很难的问题，需要团队实力非常强，有一些商业公司，它不见得解决得了。

记者：它的难点是在哪儿？

高文：常规的那些公司用的一般方法，比如上一个工具程序，从头到尾把数据扫一遍，看看里面有没有异常。但是通常高手不会让你找到，所以可能就需要技术更专业一点，我们这个团队有很多工具，看响应是什么，根据这个再来分析，可能会有蛛丝马迹，最后把东西挖出来。

2022年，“中国算力网”一期工程“智算网络”正式上线。它连接并管理了20多个不同地域、不同类型的算力中心，汇聚算力规模逐步增加到5E Flops，相当于每秒完成5万亿亿次计算。其算力枢纽节点之一，就是鹏程实验室的人工智能算力平台“鹏城云脑Ⅱ”。

高文：你从这看过去，这是八行，八行其实就相当于是四台机器，每两行是一台机器。

记者：你那它的耗电量大不大？

高文：不小，每个月可能都要一两百万的电费。

“鹏城云脑Ⅱ”是鹏城实验室与相关企业联合研发的超级智能计算机，峰值算力达到每秒完成100亿亿次计算，于2020年启动运行。它比每秒能完成100千万亿次计算的“鹏城云脑Ⅰ”，计算能力强了10倍，而完成这次升级，仅用了一年时间。

记者：只用了一年提高了10倍？发生了什么？

高文：我们做“鹏城云脑I”的时候，那时候还是做判别式人工智能，通常它需要的算力没有那么大，100P其实已经可以满足需要了。通常我们会预判，对语言模型需要的计算和存储的能力，会比图像的应该要求更高一些，因为语言的语料更容易获得，可能语言处理需要的处理能力更强，所以要比做图像大10倍。

目前，“鹏城云脑Ⅱ”已在衡量全球高性能平台数据吞吐能力的IO500总榜单上连续9次取得冠军，同时在国际人工智能算力性能AIPerf500排行榜上连续4届排名第一。基于“鹏城云脑Ⅱ”，鹏城实验室搭建了一个AI训练平台，能够同时处理包含上千亿参数的超大规模AI模型。“鹏城·脑海”就是鹏城实验室在“鹏城云脑Ⅱ”上训练和运行的一个超大规模自然语言处理模型。

记者：为什么脑海没跑出来，DeepSeek跑出来了？

高文：倒不是说我们脑海不行，其实这个就是DeepSeek很聪明的地方，脑海和ChatGPT完全是同样的技术，它里面有一个模型叫注意力机制，像以前比如一篇文章，进到计算机里面，你让它处理，等处理到最后，前面的已经忘了。但是GPT就是Transformer，发明了一种方式，叫注意力机制，或者叫注意力模型，就是我只注意相关的，其他东西我就不管了，抓大放小。

原来的GPT是一个大包，所有的功能都在里面，所以用的时候就很累。DeepSeek就做了这样一件事，他把特定领域用特定的表述去训练它，这样训练的时候，开销就没那么大。它一共有256个专家，使用的时候不需要256个都装，最多装8个就够了，这样用的时候，需要的成本很低，训练的时间可以节省。DeepSeek我认为它不是理论上的创新，它更多是工程上。

目前，“鹏城·脑海”大模型的两个版本已向社会开源。高文和团队希望通过模型训练全流程开源开放的方式，将“鹏城·脑海”培育为中国算力网上的一个种子应用。

记者：你是最底层的这个源代码开源还是参数开源？

高文：其实两层都有，我们是把所有参数，我们叫切片，就是它在训练过程中，我每隔多长时间，我就开一个切片，研究者可以通过这个切片，去研究它在训练的过程中，它是怎么受训练的，中间有什么变化。另外我们源代码也开源，源代码开源以后，基本上用户其实拿着这个源代码，用他自己的数据就可以重新再去训练。

记者：那你付出所有的人、精力、资金，等于是你做了别人得益，可以这样理解吗？

高文：但是开源不仅仅是别人得益的问题。我开源了以后，别人在我这开源的东西，他也要开源，他开源以后，会使原来我的系统做得更好，然后我们会在所有开源的东西之上，再往上迭代，众人拾柴火焰高，所有参与的人都在添柴，都在加火。

培育出“鹏城·脑海”的算力平台“鹏城云脑Ⅱ”同样秉持开放理念。“鹏城云脑Ⅱ”算力的50%是鹏城实验室自研使用，40%开放提供给国内的合作伙伴、科研机构和高校，10%则释放给深圳市工业和信息化局，供社会开发者申请使用。在人工智能浪潮中，开源与开放精神正在成为业界共识。

记者：开源就意味着共享，对吧？共享和竞争矛盾不矛盾？

高文：其实从开源的角度，技术是不是自己的没关系，因为你就在那上面迭代。为什么现在OpenAI比较难受，因为它是闭源的，闭源就是别人只能求他，要和他签协议，他同意才行，他不同意就不行。

高文：这是整个生态的两条技术路线，这个生态早期都是闭源的，因为有版权，实际上是保护你这个软件的权利的。但是后来Linux（操作系统）是第一个把软件开源的，他的理念是这个东西是人类的资产，我把它放出来，但是我要求所有用这个软件的人，在上面做开发的人，你要给我一个承诺，就是我开源了，你要新做的东西你也要开源。

我个人理解就是开源可能更符合人类社会发展的方向，这和知识是一样的，以前那些手艺人、工匠，很多东西是代代相传的，万一哪一辈没传好就失传了，那后来为什么我们现在学的知识，每个人都可以学，因为这个东西开源了，知识就是开源的。

其实软件也一样，如果软件也变成知识，那你就应该开源，开源以后才能迭代。

“鹏城云脑Ⅱ”平稳运行的同时，高文已经开始着眼新的问题。目前，他正带领团队联合相关企业研发下一代超级智能计算机“鹏城云脑Ⅲ”，智能算力规模目标为每秒完成1600亿亿次计算，能力比“鹏城云脑Ⅱ”提升16倍。

记者：这个云脑Ⅲ未来可以做什么事？

高文：可以做多模态大模型的训练和使用，现在大语言模型的智能只是语言智能，其他智能还比较弱一点。所谓多模态模型，就是除了语言之外，我要把声音、视觉和语言都掺杂在一起，然后去训练，这样整个智能的水平，就和人慢慢比较接近了。我们也希望通过我们这台机器的建设，对国内的生态有所帮助。

整个机器还没出来，但是我们的原型机已经出来了。我们整个机器是157个机柜，但是我们现在已经做了3个机柜了，这些模型已经在这3个机柜上的原型机上面做训练，国家给我们的使命，是要去攻一个山头，就是要爬一个高峰，这个高峰肯定是别人都没有上去过的，所以你要先上去。

上一篇：【浙江：省级各单位开展房产土地存量情况及使用情况摸底制定房产土地】下一篇：李彦宏：2025年或成AI智能体爆发元年

推荐文章

热门文章

中国工程院院士高文：要给AI算力建国家高速公路 将让算力像用电一样方便

2025-03-17

中国工程院院士高文：要给AI算力建国家高速公路将让算力像用电一样方便