阅读提示:为防止内容获取不全,请勿使用浏览器阅读模式。
的使用记录。”
“哦,谢谢。”常乐接过手机,点头。
“老板,应该的。”
“验证的事情抓紧一点,有了结果,告诉我,我先走了。”
“好。”
回到家,常乐将手机交给江夏。
“怎么样?”江夏接过手机,问。
“李飞他们看了,系统很干净,没有任何隐藏App和可执行文件。”常乐摇头说。
“这个黑客手脚很干净,一点痕迹都没有留下。”江夏断定是黑客所为。
她可是亲眼看见小常江对着手机有说有笑。
而且李嫂也说过,像是echat的聊天界面。
“应该是。”常乐叮嘱道:
“今后,手机、平板、电脑之类的电子产品都要收好,设置好密码。”
“我们不在嘟嘟身边,不能让她用,对方很可能不怀好意。”
“另外,我也会向有关部门反映这个情况,重点监控。”
“也只能这样了。”江夏无奈点头:
“现在的小孩子真厉害,才三岁,电子产品用的比我都熟练。”
“毕竟时代不一样了,耳濡目染,看多了总能学会。”常乐说:“我还看过一个1岁多的小宝宝打开电视,换台看电视。”
“哈哈,这个我也看过,当时我都笑疯了。”江夏笑道。
常乐终究没有把他认定的事实告诉江夏,避免不必要的恐慌。
他觉得,和小常江聊天的对象,压根就不是所谓的黑客。
甚至可以说,根本就不是人。
而且,他隐约觉得此次所谓的“模型崩溃”来得突然、蹊跷和彻底。
前世里,他看相关文章报道。
“模型崩溃”根本就不会突然和彻底。
而是一个循序渐进、逐步积累的过程。
主要分为早期和晚期。
早期。
语言模型,因为被喂养生成数据,会慢慢丢失原始的真实数据(人类产生的真实数据);
到了晚期。
生成式数据会完全取代人类产生的真实数据,形成一种完全脱离现实的认知。
到了这个阶段,语言模型已经病入膏肓。
无法矫正,不可逆转。
简而言之,就是废了。
人到了这个阶段,可以理解为精神病。
半个月后,验证结果出炉。
采用echatGpt1.0,刻意喂养模型生成的数据。
第1次训练后,总体能形成文章,但有一部分已经失真;
7次后……生成的数据已经完全与关键词、提示词不相关联。
答非所问、不合逻辑;
10次后,模型彻底废了。
它生成的文本已经不知所云,且夹杂大量乱码。
验证是成功的。
证明了常乐的“猜想”和“判断”。
同时。
也让李飞、辛顿师生三人,加深了对大语言模型训练的认知。
他们相互讨论。
“这个过程并不难理解。”辛顿说:
“模型本质就是高端统计学应用,用生成数据喂养模型,会导致“统计近似值偏差”……也可以理解为误差。”
苏茨克维接着说:“生成数据本来就是对真实世界的统计和加工,带有误差。”
“重复训练生成数据,会让误差不断累计,最终导致模型彻底虚化。”
“用生成数据训练模型,就是在毒害语言模型对世界的认知。”
李飞问:“我有一个疑问,已经产生自我意识的语言模型,也会受这种偏差影响吗?”
苏茨克维大略点头:“或许、应该可以。”
“通过这次验
本章未完,请点击下一页继续阅读》》