中国首个藏语大语言模型落地拉萨

2018年，觉罗数字产业管理有限公司就立下了“藏汉双语+人工智能”的发展目标。经过四年努力，他们终于建起了近7000万条高质量的藏汉平行语料库，还收集到了规模庞大的三大方言区语音数据：卫藏10500小时、康巴10000小时，以及安多10000小时，这就形成了中国最大也最精准的藏语语音数据库。 3月15日，在拉萨市经信局和数据管理局的牵头下，这场活动由西藏自治区经信厅和数据管理局指导完成。中新社在拉萨报道了这个消息。DeepZang创始人旦增罗布在发布会上透露，这是中国首个完成国家备案的藏语大语言模型，填补了全球技术空白。这家公司自主研发的DeepZang不光能实现“听、说、译、看、思”，还是面向多语种、多模态的民族语言AI开放平台，支持80余种语言服务。当天同步推出的DeepZang App很快就要应用到多个行业里去了。旦增罗布提到，目前已经形成了“智慧+”解决方案矩阵。WRCA给他们颁发了“世界首个藏语大语言模型”的认证证书。觉罗数字让中国拥有了自己的大模型平台。这次发布仪式是“深溯藏源·智启未来”的主题活动。