数据量蹭蹭往上涨,企业这块尤其明显

大家听我说,IDC说了,到了2028年,咱们全世界新产生的数据量,那就是393.9ZB了。这事儿5月17日在广州有个大会,李凌霄也说了,这AI一出来,数据量蹭蹭往上涨,企业这块尤其明显。你看那数字孪生技术,在造汽车、做医疗啥的都用着呢,加上物联网再配上AI,准确率也高多了。 当天还有个OceanBase的开发者大会,《IDC数据库前沿趋势白皮书》也指出了,数据仓库的容量现在早就不是当年的量级了,“突破PB级迈向EB级”现在就是个大趋势。可是问题也来了,传统的存储方式碰到这么大的量,读写性能肯定不行,成本也高,管理起来更是难上加难。 大家都知道GenAI能让干活更有效率,所以很多公司都开始把它当成战略重点来部署。IDC的调查还显示,有37%的受访公司在2025年预算里,把投在AI相关的钱排在最前面,和搞IT运维优化是并驾齐驱的。 蚂蚁集团的CTO何征宇也在会上讲了,现在的大模型其实是靠海量数据喂出来的。不过呢,大模型有时候会“说梦话”,这毛病根子还是在数据上。说白了就是数据太少或者不够严谨。要想解决这事儿,还得让大模型多喝点好东西。 所以OceanBase就琢磨着怎么变一变。他们想从单纯的数据库变成一体化的数据底座,一套引擎就把TP(事务处理)、AP(分析处理)还有AI这几种活儿全给干了。连向量数据库都支持上了,让SQL和AI能混着检索用。 中国联通软件研究院OceanBase那边的邱永刚也说了,以后的知识越来越多,向量的数量会越来越大。咱们得一边好好优化算法,一边用硬件把这海量需求扛下来。这样才能给大家提供更快更准的向量检索服务。