无障碍
x

全部频道

中国> 正文

超140万亿词元调用量的背后代表哪些行业发展趋势?专家解读

2026-03-26 07:58 央视网

来源标题:新闻1+1丨超140万亿词元调用量的背后代表哪些行业发展趋势?专家解读

到今年3月,我国日均Token即词元调用量超过140万亿,相比2024年初的1000亿增长了1000多倍。日均词元调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化。今年是“十五五”开局之年,也是数据要素价值释放年。日均词元调用量超140万亿,说明什么?

如何理解词元?哪个比喻更像真正的词元?

国家数据专家咨询委员会委员、北京交通大学教授 张向宏:词元是一个特别新的概念。人工智能大模型在全球出现仅5年时间,而词元在世界范围内出现也不到1年,中文名字半年时间不到。对词元的理解,以后词元会发展成什么样子,都是在探索阶段。

目前,我们认为词元分两个阶段来看。词元上游是高质量数据集,高质量数据集再往前是数据资源。下端是智能体和大模型,智能体和大模型是在各行各业,在个人、企业当中应用的。从这个角度上来说,词元是构成智能体和人工智能大模型的最小单元,就像一块块积木,搭成了智能体的应用。

从再长的时间来看,3到5年,词元应该发展成就像电和自来水一样,随取随用,用多少买多少,用多少付多少钱。随着经济社会的发展,智能经济不断提升,词元的概念会越来越丰富,内涵会越来越丰富。

如何为AI创造更多应用场景?

张向宏:人工智能的最终生命力体现在应用。如果说,人工智能不能在社会经济中深度应用,不能跟个人日常生活、政府日常管理,特别是企业日常生产经营活动深度绑定、深度融合的话,其实是没有生命力的。在这方面国家出台了很多政策。

目前来看,从个人、政府、企业在办公、在场景方面用得比较浅层。下一步,就应该在各行各业,特别是制造业企业,比如金融、商贸流通等各方面跟生产流程、市场营销、供应链深度绑定。假以时日,人工智能在生产经营活动中会越来越深入,越来越广泛。

建设更多高质量数据集,面对的问题、挑战是什么?

张向宏:有三方面挑战。第一,数据挑战。可以看到,目前数据高质量开发利用给我们生活带来很多便利,提升效率。如果数据安全性没有得到保障,也会带来很多隐私泄露等,所以,数据安全流通是摆在我们面前非常重要的话题。

第二,算力。算力有两个瓶颈,其一,GPU。目前虽然取得了重大突破,但是仍然有比较大的提升空间。其二,电力。如果个人、企业和政府大规模用人工智能,电力耗费相当大。当然,在算力协同,特别是绿电支持算力发展方面,已经做了重大布局,但是也要未雨绸缪。

第三,技术迭代,就是模型技术迭代。这几年国家大模型企业的技术发展特别快,但是下一步离企业、政府、个人的应用还要进一步深化。

责任编辑:张思宇(QX0007)

北京千龙新闻网络传播有限责任公司版权所有 未经千龙新闻网书面特别授权,请勿转载或建立镜像,违者依法必究新出网证(京)字013号 增值电信业务经营许可证 2-2-1-2004139 跨地区增值电信业务许可证

信息网络传播视听节目许可证0104056号 互联网新闻信息服务许可证11120180003号 京公网安备 11000002000007号

分享到:
QQ空间 新浪微博 微信 腾讯微博 QQ好友 百度首页 腾讯朋友 有道云笔记