刘烈宏谈国家数据局下一步工作:将大力推进数据资源的整合共享和开发利用发表时间:2024-03-04 13:55 图1.国家数据局局长刘烈宏发表讲话 2月29日,2024中关村论坛系列活动——第二届北京人工智能产业创新发展大会举办。会上,国家发展改革委党组成员,国家数据局党组书记、局长刘烈宏受邀发言,北京市首个自主创新人工智能算力集群签约落地。北京市国际大数据交易所数据资产中心同期揭牌成立。 刘烈宏分享了他基于数据和算力等角度对人工智能高质量发展的一些思考,并表示下一步,国家数据局将把握数字化、网络化、智能化发展的趋势,大力推进数据资源的整合共享和开发利用。 01 让数据成为人工智能发展的催化剂 刘烈宏指出,2023年,以ChatGPT为代表的生成式人工智能在语言对话领域率先取得巨大突破,并陆续在计算机、生物、化学等领域取得显著进展。国内诸多企业相继推出大模型及相关的产品,并在互联网服务和行业数据化场景中加速落地,展现出巨大的应用前景。2024年2月,视频生成大模型取得突破性进展,引起全球广泛关注和讨论。大模型技术具有规模扩展性强、多任务适应性、能力可塑性强的特点,并仍在快速迭代、持续研究,有望成为通用人工智能的可行路径之一。 刘烈宏指出:“我们要充分发挥数据的基础资源作用和创新引擎作用,构建满足人工智能发展需要的数据开放、共享、流通、交易的模式,全面提高数据资源开发利用水平,让数据‘供得出、流得动、用得好’,真正成为人工智能发展的催化剂,推动做强、做优、做大数字经济。” 刘烈宏表示,将数据作为生产要素,是我国首次提出的重大理论创新,这也为我们抢抓人工智能战略机遇奠定了坚实的基础。大模型驱动的人工智能发展对于高质量数据供给提出了更高要求,数据要素的市场化配置和开发利用显得尤为重要。我们要充分发挥数据的基础资源作用和创新引擎作用。 02 刘烈宏首谈人工智能高质量发展 大会现场,刘烈宏分享了他基于数据和算力等角度对人工智能高质量发展的一些思考。在他看来: 第一,高质量数据是人工智能发展的根基。 人工智能技术的历次突破都离不开高质量数据集的支撑。回顾历史,由七万张手写数字图片组成的数据集,促进了图像识别领域的发展,快速推动了数据自动分类和聚类技术的发展;由1400万张各类互联网图片组成的数据集开启了深度学习的时代,极大地提升了人工智能感知技术的能力;由自然语言、编程语言、网络数据等组成的万亿级多模态高质量数据级开启了大模型时代,人工智能开始具备一定的认知交付能力,使得机器认知,甚至通用智能成为可能。 今天数据的“质”和“量”是推动大模型不断进步的关键。例如,在前提条件不变的前提下,使用更高质量的数据集来做训练,能使20亿参数量级的模型超过100亿参数量级的模型。 第二,高性能算力是人工智能发展的基础。 面对生成式人工智能服务和大模型的迅速兴起带来的旺盛的算力需求,需要从算力供给和算力网络调度等方面来做好统筹协调。从算力供给来看,需要加大低成本、高质量、易使用的算力供给;从算力网络的调度来看,需要做好人工智能、模型训练推理、离线分析等高时延业务等资源匹配,切实提升计算资源的整体使用率。 2023年12月,国家数据局联合有关部门共同印发了《深度实施东数西算工程加快构建全国一体化算力网的实施意见》,从“通用算力、智能算力、超级算力的一体化布局”“东中西部算力一体化协同”“算力数据算法一体化应用”“算力与绿色电力一体化融合”“算力发展与安全保障一体化推进”等五个统筹出发,推动建设联网调度、普惠易用、绿色安全的全国一体化算力网。 第三,行业应用是人工智能落地的关键。 我国超大规模市场为人工智能行业应用提供了丰富的土壤,这是我国推动人工智能应用迈向更高水平的重要优势。 例如在交通物流行业,人工智能技术应用可以助力企业提升运输效率,降低全社会物流的成本;在文化旅游行业开发文化大模型,能够贯通各类文化机构的数据中心,充分挖掘文化数据的价值;在科技创新领域以科学数据支撑大模型的开发,可以更深入地挖掘各类科学数据和科技的文献。 国家数据局与16个部门共同印发《数据要素层三年行动计划》,提升数据利用水平,推动人工智能行业应用落地,推动社会各界共同挖掘市场的需求。这为人工智能技术的行业应用奠定了基础。 第四,安全治理是人工智能发展的保障。 人工智能在对经济社会发展带来深远影响的同时也蕴含着隐私保护、算法安全、设施安全和技术耐用等潜在的风险隐患。 目前,国内多家企业已经设立了数据伦理安全委员会,积极落实行业自律,并取得了初步的成效。“在此基础上,我们还应该多维布局,汇聚政府、行业、企业等各主体,从科技伦理、立法、技术实践等维度推动人工智能安全治理,坚持创新发展和安全治理统筹原则,持续优化完善人工治理安全风险的防范。”刘烈宏说道。 第五,保障体系是人工智能发展的支撑。 人工智能高质量发展离不开人才的建设、标准规范和国际合作等保障体系。其中复合型人才是发展的强效动力,需要以社会需求和产业发展为导向,培养兼具理论和实践,掌握数据、算法、分布式计算等技能的跨专业人才队伍。 “统一的标准规范体系是发展的重要基础,需要构建关于人工智能数据、算力和算法的标准体系,有效提升高质量数据和高质量算力的供给。”刘烈宏表示,“开放的国际合作是发展的必经之路,需要积极开展人工智能国际合作,打造互联互通、互利共赢的人工智能的命运共同体。” 刘烈宏指出,下一步,国家数据局将把握数字化、网络化、智能化发展的趋势,大力推进数据资源的整合共享和开发利用,让数据赋能人工智能的发展,数据真正实现“供得出、流得动、用得好”,同时打造全国一体化的算力调度体系,加速算力的高质量发展。 03 北京市首个自主创新人工智能算力集群签约落地 在大会现场,北京市首个自主创新人工智能算力集群正式签约,“京西智谷”人工智能计算中心将与4家企业共同打造自主创新人工智能算力集群,标志着“一廊四极”首都地区算力供给体系中的“京西一极”将通过提供更多更优质的算力,推动新质生产力创造。 图2. 北京市首个自主创新人工智能算力集群签约 据悉,集群将面向北京市乃至全国人工智能中小企业及科研单位服务,提供全面自主可控、开源开放、安全高效的算力,围绕技术创新和产业发展需求,以算力集群赋能创新集群和产业创新。 04 北京国际大数据交易所数据资产服务中心揭牌 北京国际大数据交易所数据资产服务中心正式揭牌,将依托北京市人工智能算法交易服务中心的运营经验,围绕数据资产服务,开展数据资产登记、评估、入表、融资服务等创新业务,探索并拓展“产业+数据”“数据+场景”“数据+应用”的创新发展模式和数据资产价值实现路径,延展数字产业生态,沉淀并汇聚更多的高价值数据资源落地,探索建立数字经济全方位赋能经济社会发展的新格局。 图3.北京国际大数据交易所数据资产服务中心揭牌 ————来源:由数据要素社综合整理自中国信息化周报、北京门头沟,转载请注明来源 |