各位稍安勿躁,这事官方终于拍板定音了!这个Token的中文名,昨天国家数据局发文说了。你看啊,现在咱们每天用它处理语言,调用量都冲到140万亿这个天文数字了。 140万亿这个数据确实很吓人,不过这次发布会最大的看点,还是给Token取的中文名字叫“词元”。新加坡国立大学的尤洋教授听说了也挺感慨,他说这怎么看都像是把“智元”那个名字的概念往前挪了挪。 其实这名字吵得挺凶的。起因是腾讯研究院的杨斌教授提出了一个叫“模元”的翻译方案。这下可好了,AI界的大佬们全炸了锅,在各个平台上各抒己见。百川智能的创始人王小川就特别喜欢“智元”这个说法。原来清华大学科学史系的胡翌霖老师也挺认同这叫法,觉得把Token比作人类智识的计算单元特别贴切。 中国政府网转发了人民日报的消息,确认这次叫“词元”。人民日报的解释是,“词元”就是AI用来理解我们说话的最小单位。因为有时候切分出来的是字,有时候是词,“词”这个词能覆盖的范围更大。这也意味着“智元”这场争论算是彻底告一段落了。 还有位叫陈绪的资深开源人士也挺认同这叫法。他觉得最近大家想出来的各种“x元”里,“智元”是最符合信达雅要求的那个。当然中间也有些调皮的网友发了些整活儿段子来活跃气氛。 不过大家都很开心这次的结果。高山旗手作为《各地最新时事在线》的总编辑和《关注环球》的特约主编也表示认可。毕竟这是官方机构给出的标准答案嘛。现在万事大吉了!