据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。
团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。
CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。
虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。
团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。
不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。
榆木脑袋是什么意思 | 省军区司令员是什么级别 | 冬天有什么花 | 清秋是什么意思 | 陈慧琳属什么生肖 |
四十不惑是什么意思 | 拍身份证穿什么衣服 | 长湿疹是什么原因引起的 | 有什么方法可以快速入睡 | 幼小衔接是什么意思 |
丁是什么意思 | 斤是什么单位 | 颈椎病挂什么科 | 仙女下凡是什么生肖 | 胸膈痞闷是什么症状 |
分水岭是什么意思 | 异质性是什么意思 | 咸湿佬是什么意思 | 肺炎吃什么药最有效 | 孔雀吃什么食物 |
日字旁跟什么有关hcv9jop6ns2r.cn | 养猫有什么好处hcv9jop6ns7r.cn | 大腿根疼是什么原因hcv8jop6ns1r.cn | 孕妇梦见掉牙齿是什么意思hcv9jop5ns1r.cn | 做梦房子倒塌什么预兆hcv8jop2ns4r.cn |
蛞蝓是什么动物sscsqa.com | 最多是什么意思hcv9jop7ns2r.cn | 翻版是什么意思hcv9jop7ns5r.cn | 操是什么意思hcv7jop7ns1r.cn | 冠状动脉钙化是什么意思mmeoe.com |
什么问题bjcbxg.com | 代谢不好是什么原因0735v.com | 拉肚子应该吃什么药hcv9jop7ns5r.cn | 不老实是什么意思hcv7jop9ns3r.cn | 嘚瑟是什么意思hcv9jop5ns5r.cn |
电脑什么牌子好hcv8jop2ns2r.cn | 江团鱼是什么鱼hcv9jop4ns2r.cn | 脖子下面的骨头叫什么dajiketang.com | 猴子的尾巴像什么hcv7jop7ns2r.cn | 胃酸过多吃什么药hcv7jop6ns3r.cn |