又一开源替代品!Guanaco性能达ChatGPT级别 在单个GPU上训练一天就能搞定_世界滚动
编程客栈()5月26日消息:有一种名为QLoRA的新方法可以在单个GPU上微调大型语言模型。目前已经有研究人员用
编程客栈()5月26日 消息:有一种名为 QLoRA 的新方法可以在单个 GPU 上微调大型语言模型。目前已经有研究人员用它来训练 Guanaco,这是一个性能效果99% 接近ChatGPT的聊天机器人。
华盛顿大学的研究人员提出了微调大型语言模型的方法 QLoRA。该团队利用 QLoRA 发布了 Guanaco,这是一个基于Meta 的 LLaMA模型的聊天机器人系列。最大的 Guanaco 变体具有650亿个参数,在与GPT-4的基准测试中实现了ChatGPandroidT ( GPT-3.5-turbo )99% 以上的性能。
微调大型语言模型是提高其性能和训练的最重要技术之一。然而,这个过程对于大型模型来说计算量非常大,例如 LLaMA65B ,在这种情况下需要超过780GB 的 GPU RAM。虽然开源社区使用各种量化方法将16位模型简化为4位模型,从而大大减少了推理所需的内存,但类似的方法还没有用于微调。
(相关资料图)
QLoRA 允许在单个 GPU 上微调650亿个参数 LLM
通过 QLoRA,该团队展示了一种方法,允许将 LLaMA 等模型量化为4位,并添加LORA模型,然后通过反向传播进行训练。通过这种方式,该方法可以实现4位模型的微调,并将650亿参数模型的内存需求从超过780GB 降低到不到48GB 的 GPU 内存,其结果与微调16位模型相同。
“这标志着LLM微调的可访问性发生了重大转变:现在是迄今为止在单个GPU上微调的最大公开可用模型,”该团队说。
为了测试 QLoRA 和不同微调数据集的影响,该团队在八个不同的数据集上训练了1,000多个模型。一个关键发现:数据的质量比任务的数量更重要。例如,在OpenAssistant 的9,000个人类样本上训练的模型比在 FLANv2的100万个样本上训练的模型更适合聊天机器人。因此,对于 Guanaco,该团队依赖于 OpenAssistant 数据。
开源模型 Guanaco 达到 ChatGPT 级别
该团队使用 QLoRA 训练了 GuanatNxQHsco 系列模型,表现第二好的模型在基准测试中以330亿个参数实现了 ChatGPT 性能的97.8%,同时在不到12小时的时间内在单个普通的 GPU 上对其进行了训练。在专业 GPU 上,该团队仅用24小时就训练了具有650亿个参数的最大模型,并达到了ChatGPT 性能的99.3% 。
最小的 Guanaco 模型具有70亿个参数,仅需要5GB 的 GPU 内存,并且在 Vicuna 基准测试中比26GB 的羊驼模型高出20个百分点以上。
除了 QLoRA 和 Guanaco,该团队还发布了 OpenAssistant 基准测试,该基准测试在953个提示示例中让模型相互竞争。然后可以由人类或 GPT-4对结果进行评分。
Guanaco数学不好,QLoRA可用于移动微调
不过,该团队引用数学能力和4位推理目前非常慢。接下来,该团队希望提高推理能力,预计速度提升8至16倍。
由于微调是将大型语言模型转变为类似 ChatGPT 的聊天机器人的重要工具,该团队相信 QLoRA 方法将使微调更容易获得——尤python其是对于资源较少的研究人员而言。他们认为,这对于自然语言处理领域尖端技术的可访问性来说是一个巨大的胜利。
论文指出:“QLORA 可以被视为一个平衡因素,有助于缩小大型企业与拥有消费类 GPU 的小型团队之间的资源差距。这也意味着,小企业可以通过像 Colab 这样的云服务进行微调大模型。
除了微调当今最大的语言模型外,该团队还看到php了私有模型在移动硬件上的应用。“QLoRA 还将在您的手机上启用隐私保护微调。我们估计您每晚可以使用 iPhone12Plus 微调300万个单词。这意味着,很快我们将在手机上拥有专门针对每个应用程序的LLM。”第一作者 Tim Dettmers 在 Twitter 上说。
关于Guanaco-33B python更多信息和代码可到 github 查看。
参考网址:
https://github.com/artidoro/qlora
相关产品可访问《有哪些类似chatgpt产品? 17 个ChatGPT/GPT4 开源替代品推荐(附网址)》一文了解。
关键词:
[ 相关文章 ]
编程客栈()5月26日消息:有一种名为QLoRA的新方法可以在单个GPU上微调大型语言模型。目前已经有研究人员用
自今年7月1之日起,浙江省全面推行轻型汽车“国六”相关排放标准。对国五标准及以下在用小汽车没有影响。小
荣盛发展拟筹划发行股份购买资产事项,股票于2023年5月26日开市起临时停牌。
北京外国语大学国际课程中心设有北外校区和中关村校区,这两个校区均在北京海淀区。近日,北外ICC2023年秋
【国际快讯】福特CEO:中国车企是主要竞争对手;特斯拉与福特达成充电桩合作;Stellantis投资Lyten开发锂硫
很多考生都想知道四川公办专科最低录取分数线是多少,想了解四川省公办专科学校排名及分数线,本期老师将为
新华社北京5月25日电记者25日从工信部获悉,工信部等九部门近日联合印发《质量标准品牌赋值中小企业专项行
今天来聊聊关于小叶黄杨,木质,小叶黄杨木鉴别方法的文章,现在就为大家来简单介绍下小叶黄杨,木质,小叶
5月25日北向资金增持9 17万股锦江酒店。近5个交易日中,获北向资金减持的有3天,累计净减持313 79万股。近2
5月25日北向资金减持19 55万股永太科技。近5个交易日中,获北向资金增持的有3天,累计净增持30 28万股。近2
1、推导过程:方便起见,假设导体为一个长方体,长度分别为a、b、d,磁场垂直ab平面。2、电流经过ad,电流I=nq
无路可退的伯伯西卡在第四局放手一搏,他10比8拿到局点,张本智和连得四分以12比10胜出,总比分4比0大胜对
1、桂花糕 桂花糕已有三百多年历史。2、相传,在明朝末年,新都县城有个叫刘吉祥的小贩,从状元杨升庵桂
北京时间5月1日商丘市疫情最新消息-商丘市截至5月1日15时31分疫情数据1、现存确诊:1较昨日新增+02、累计确诊:
近日,元江县开展“党建+河长制”河长清河清漂行动,党员领导干部和志愿者们以实际行动清理河道,持续巩固
5月25日,“中欧思创会”高质量管理论坛在佛山举行,以“数字时代的中国品牌战略”为主题,多位专家学者与
1、《唐宫·美人天下》的故事取材自唐朝李治皇帝时期,描写了唐朝宫廷中的人际纷争。2、《唐宫·美人天下》
《人民日报海外版》(2023年05月25日第11版)近年来,通过科技创新,缩减地区“数字鸿沟”,推动实现可持续
与起火商铺相邻的一位店铺屈姓店长告诉大皖新闻记者,火灾发生在昨天晚上11点钟,他在家休息,接到当地消防
国内期货夜盘开盘涨跌不一,沪镍涨超2%,沪锡、菜油、棕榈油、豆油涨超1%;焦炭、甲醇、焦煤跌超2%,沪锌、
[ 相关新闻 ]
Copyright 2015-2022 中公医院网 版权所有 备案号:沪ICP备2022005074号-18 联系邮箱:5855973@qq.com