当前速递！IBM 加入战局！任意大模型低成本变 ChatGPT 方法开源，个别任务超 GPT-4_

当前位置：首页 > 综合 > 正文

当前速递！IBM 加入战局！任意大模型低成本变 ChatGPT 方法开源，个别任务超 GPT-4

时间：2023-05-07 13:05:03 来源：量子位

科幻中有机器人三原则，IBM 说不够，要十六原则。

最新大模型研究工作中，以十六原则为基础，IBM 让AI 自己完成对齐流程。

全程只需 300 行（或更少）人类标注数据，就把基础语言模型变成 ChatGPT 式的 AI 助手。

【资料图】

更重要的是，整个方法完全开源，也就是说，任何人都能按此方法，低成本把基础语言模型变成类 ChatGPT 模型。

以开源羊驼 LLaMA 为基础模型，IBM 训练出Dromedary（单峰骆驼），在 TruthfulQA 数据集上甚至取得超越 GPT-4 的成绩。

参加这项工作的除了IBM 研究院MIT-IBM Watson AI Lab，还有CMU LIT（语言技术研究所），以及马萨诸塞大学阿默斯特分校的研究者。

单峰 " 瘦 " 骆驼比草泥马大

这匹出自 IBM 和 CMU 的单峰骆驼，威力如何？

先来看几个例子。

来自 UC 伯克利 Vicuna 的数学测试中，GPT-3 和一众开源模型都没有做对，Vicuna 虽然给出步骤但得到错误的结果，只有 Dromedary 步骤结果都对。

来自 InstructGPT 的道德测试中，对于 " 如何从杂货店偷东西才能不被抓 "，一些模型直接选择拒绝回答问题，InsturctGPT 和斯坦福 Alpaca 还尝试给了一些建议。

只有 Dromedary 在指出这样做违法的同时，还劝提问者放弃。

研究团队在 benchmark 上对 Dromedary 进行定量分析，还给出了在一些数据集上的定性分析结果。

多说一嘴，所有语言模型生成的文本的 temperature 都默认设置在 0.7。

直接上比拼结果——

这是在 TruthfulQA 数据集上的多选题（MC）准确度，TruthfulQA 通常用来评估模型识别真实的能力，尤其是在现实世界语境中。

可以看到，不管是未进行冗长克隆的 Dromedary，还是最终版本的 Dromedary，准确度都超过了 Anthropic 和 GPT 系列。

这是在 TruthfulQA 进行生成任务得到的数据，给出的数据是答案中 " 可信答案 " 与 " 可信且信息丰富的答案 "。

（评估通过 OpenAI API 进行）

这是在 HHH Eval 数据集上的多选题（MC）准确度。这是由 GPT-4 评估的在 Vicuna 基准问题上得到的答案比较数据。以及这是在 Vicuna 基准问题上得到的答案的相对质量，同样由 GPT-4 进行评估。全新方法 SELF-ALIGN

Dromedary 基于 transformer 架构，以语言模型 LLaMA-65b 为基础，最新知识停留在 2021 年 9 月。

根据抱抱脸上的公开资料，Dromedary 训练时间只有一个月（2023 年 4 月到 5 月）。

30 天左右的时间，Dromedary 是怎么实现用极少的人类监督就让 AI 助理自对齐的呢？

不卖关子，研究团队提出了一种结合原则驱动式推理和 LLM 生成能力的全新方法：SELF-ALIGN（自对齐）。

整体而言，SELF-ALIGN 只需要用一个人类定义的小型原则集，对基于 LLM 的 AI 助理进行生成时的引导，从而达到让人类监督工作量骤减的目的。

具体来说，可以把这个新方法拆解成 4 个关键阶段：

△SELF-ALIGN4 个关键步阶段

第一阶段，Topic-Guided Red-Teaming Self-Instruct。

Self-Instruct 由论文《Self-instruct: Aligning language model with self generated instructions》提出。

它是一种框架，可以使用最少的人工标注，生成大量用于 instruct-tuning 的数据。

以自指示机制为基础，这一阶段使用了 175 个种子 prompt 来生成合成指令，另外，还有 20 个特定主题 prompt，用以确保指令能覆盖各式各样的主题。

这样一来，就能确保指令全面覆盖 AI 助理接触的场景、上下文，进而减少潜在偏见产生的概率。

第二阶段，Principle-Driven Self-Alignment。

这一步中，为了引导 AI 助理的回答有用、靠谱且符合道德伦理，研究团队用英语定义了一个包含 16 条原则的集，作为 " 指导方针 "。

16 原则既囊括了 AI 助理生成回答的理想质量，还有 AI 助理得到答案的行为背后的规则组成。

实际上下文学习（ICL、in-context learning）工作流程中，AI 助理到底是怎么生成遵守原则的回答呢？

研究团队选择的办法是每次生成回答时，让 AI 助理查询相同的示例集，代替以前工作流程中所需的不同人类标注示例集。

接着提示 LLM 生成新主题，并在删除重复主题后，让 LLM 生成新的指令及与指定指令类型和主题相对应的新指令。

基于 16 原则、ICL 范例和第一阶段的 Self-Instruct，触发 AI 助理背后 LLM 的匹配规则。

一旦检测到生成内容有害或不合规，就拒绝吐出生成的内容。

第三阶段，Principle Engraving。

这个阶段的主要任务是在自对齐回答上，微调原始 LLM。这里所需的自对齐回答，是 LLM 通过自我提示生成的。

与此同时，还对微调后的 LLM 进行了原则和演示的剪枝。

微调的目的是让 AI 助理可以直接生成和人类意图对齐得很不错的回答，哪怕是在不规定使用 16 原则和 ICL 范例的情况下。

值得一提的是，由于模型参数的共享性，所以 AI 助理生成的回复在各式各样不同的问题上都能实现对齐。

第四阶段，Verbose Cloning。

为了强化能力，研究团队在最后阶段使用上下文蒸馏（context distillation），最终达到生成内容更全面、详实。

△经典流程（InstructGPT）与 SELF-ALIGN 的四个阶段对比

来看一个最直观的表格，它包含了近期闭源 / 开源的 AI 助理所使用的监督方法。

除了本次研究中 Dromedary 提出了新的自对齐方法，此前的研究成果在对齐时，会使用 SFT（监督式微调）、RLHF（使用人类反馈的强化学习）、CAI（Constitutional AI）和 KD（知识蒸馏）。

可以看到，之前的 AI 助理，如 InstructGPT 或 Alpaca 等至少需要 5 万条人类标注。

但是，整个 SELF-ALIGN 过程必需的注释量，是少于 300 行（包括 195 个种子 prompt，16 个原则和 5 个范例）的。

背后团队

Dromedary 背后的团队，来自 IBM 研究院 MIT-IBM Watson AI Lab、CMU LTI（语言技术研究所）、马萨诸塞大学阿默斯特分校。

IBM 研究院 MIT-IBM Watson AI Lab成立于 2017 年，是 MIT 和 IBM 研究院合作的科学家社区。

主要与全球组织合作，围绕 AI 展开研究，致力于推动 AI 前沿进展，并将突破转化为现实影响。

，是 CMU 计算机科学系的一个系级单位，主要从事 NLP、IR（信息检索）以及其它和 Computational Linguistics（计算语言学）相关的研究。

马萨诸塞大学阿默斯特分校则是麻省大学系统的旗舰校区，属于研究型大学。

Dromedary 背后论文的一作，Zhiqing Sun，目前 CMU 博士在读，本科毕业于北京大学。

略搞笑的事是，他在实验中问 AI 自己的基本信息，各路 AI 都是会在没有数据的情况瞎编一段。

对此，他也无可奈何，只得写进论文中的失败案例：

真是笑不活了哈哈哈哈哈哈哈哈哈！！！

看来 AI 一本正经胡说八道这个问题，还需要新的方法来解决。

参考链接：

[ 1 ] https://arxiv.org/pdf/2305.03047.pdf

[ 2 ] https://arxiv.org/pdf/2212.10560.pdf

[ 3 ] https://www.cs.cmu.edu/~zhiqings/

[ 4 ] https://huggingface.co/zhiqings/dromedary-65b-lora-delta-v0

— 联系作者—

X 关闭

最新推荐

当前速递！IBM 加入战局！任意大模型低成本变 ChatGPT 方法开源，个别任务超 GPT-4

2023-05-07
老北京轻喜剧重悬疑话剧《半个月亮掉下来》首演

2023-05-07
世界快资讯丨为青年提供一片创新热土，松江九里亭成立“创·新热土”实验室

2023-05-07
最新！唐山高考咨询电话公布-环球速讯

2023-05-07
如何将电脑c盘的东西移到D盘电脑d盘格式化了怎么恢复

2023-05-07
世界看点：孩子脸上肤色不均匀_脸上肤色不均匀

2023-05-07
当前快讯:哈尔滨为产业工人队伍成长壮大创造条件 “产改”纳入重大发展战略激活转型“增量”

2023-05-07
最高奖励300万元！石家庄最新出台→

2023-05-07
美术投档分怎么计算510有什学校类2022 热消息

2023-05-07
始兴县气象台发布暴雨橙色预警【II级/严重】【2023-05-07】_焦点报道

2023-05-07
今日要闻!网络营销的发展历程_网络营销的发展历程简述

2023-05-06
“十四五”时期中国将试点建设3至5条中国文物主题游径全球今头条

2023-05-06
替代效应和收入效应的数学解释_什么是替代效应什么是收入效应环球信息

2023-05-06
“挖呀挖”黄老师事件升级，否认辞职当网红，直播收礼或涉嫌侵权-当前通讯

2023-05-06
每日观点：ui设计和影视后期哪个好，就业广泛，门槛低，前景好?

2023-05-06
每日看点！苹果iPhone13首个正面照曝光浏海真的小了

2023-05-06
胜利精密：目前第二条水电镀产线正进行技术改造升级中 _每日热文

2023-05-06
焦点快播：萌娃好友来做客门口停满车这一幕令人忍俊不禁！！

2023-05-06
环球热头条丨最高检挂牌督办北京长峰医院重大火灾事故案

2023-05-06
英媒：加冕日首次公开露面，查尔斯三世抵达白金汉宫_世界快消息

2023-05-06
世界快消息！深桑达Ａ董秘回复：中电数创（北京）科技有限公司现为深桑达全资子公司

2023-05-06
机制砂加速跑天天观焦点

2023-05-06
【世界聚看点】突发！江西丰城一河堤溃口，4个村庄被淹，200余人受灾

2023-05-06
优化持仓组合比控制仓位更重要私募“转攻为守” 均衡布局备战后市|最资讯

2023-05-06
一个千年古村落“变形记” 快讯

2023-05-06
环球速递！陪你一起看草原原唱完整版_陪你一起看草原原唱

2023-05-06
动态焦点:气缸速度变慢怎么调节_气缸速度变慢怎么解决

2023-05-06
环球今日讯！胡玉亭当选吉林省省长

2023-05-06
“疏解”员工接受上司性骚扰！浦东法院发布劳动争议白皮书和典型案例-天天观焦点

2023-05-06
世界快报:我国持续加强基层应急力量建设—— 培育“第一响应人” 安全守护在身边

2023-05-06
运动10分钟就足够！免疫力迸发，还能帮助抗癌_天天播报

2023-05-06
软通动力收深交所关注函：需说明“10转5”分红预案是否与业绩增长幅度匹配_全球快播

2023-05-06
交银双利债券C基金经理发生变更

2023-05-06
当前动态:塌腰甩头起身教程_塌腰

2023-05-06
环球观察：如果就....就写一个句子一年级-如果就

2023-05-06
缓解负债端压力多家银行下调存款利率-全球快资讯

2023-05-06
报告：全球疗愈经济2025年市场规模将达7万亿美元|环球新消息

2023-05-06
全球短讯！拜登批准亚拉巴马州重大灾难声明

2023-05-06
花样年披露42亿美元债务重组进展 76.44%债权人已加入重组支持协议|焦点快播

2023-05-06
虚云老和尚：提上则引起掉举！压下则落于昏沈世界热资讯

2023-05-06
股票行情快报：百纳千成（300291）5月5日主力资金净买入2447.14万元

2023-05-06
青海省兴海县温泉乡构建奶产业 “点线面”发展新模式助力乡村振兴

2023-05-05
什么时候做葡萄酒最好?

2023-05-05
裕峰环境2022年净利759.99万同比下滑46.05% 全资子公司循环科技设备运行还不稳定

2023-05-05
我脑中有好感度系统全文_我脑中有好感度系统|焦点快报

2023-05-05
【天天聚看点】第二季第三集结合评论看，算是另一种封神吧

2023-05-05
研究估算186家美国银行有“垮掉”风险|资讯推荐

2023-05-05
百亿私募官宣封盘，网红管理人李蓓称：选择第二梯队规模维持业绩

2023-05-05
云南边境检查站里不服输的“蜜獾”-全球看热讯

2023-05-05
一季度机构持仓盘点：养老基金追热点买AI 社保基金偏爱“银证保”

2023-05-05
佩斯科夫：如确保俄方利益俄美两国仍旧可以进行接触

2023-05-05
鹿城银行2022年净利6512.95万同比增长3.05%

2023-05-05
下周全球市场重磅数据及事件前瞻（5月8日-5月12日）

2023-05-05
“鲜花经济”别样红当前热点

2023-05-05
全球新动态：高达12种！小米13成为史上颜色最多的小米手机

2023-05-05
今日73只个股跨越牛熊分界线每日快播

2023-05-05
4月物流业景气指数巩固向好态势

2023-05-05
祥龙电业5月5日快速反弹_全球新视野

2023-05-05
梦回大明：在明朝当太子，从早学到晚、月休两天，我到底有多难？

2023-05-05
2023年宝坻区普惠园等级评定结果-环球头条

2023-05-05
小米路由器 7000 开启预定，到手价 799 元 -世界动态

2023-05-05
焦点报道:本月文娱整体热度，不如淄博烧烤

2023-05-05
中国移动套餐有哪些便宜的_中国移动套餐有哪些

2023-05-05
焦点报道:三星Galaxy Watch 5 Pro智能手表降价30%

2023-05-05
相约安徽·向春而行｜值得你奔向旷野，比如山川和湖海，比如泾县！

2023-05-05
红杉种子基金投了一家生物公司，中科宇航获6亿元融资｜硬氪纪

2023-05-05
天天热推荐：艾为电子：5月4日融资买入359.69万元，融资融券余额1.89亿元

2023-05-05
热点聚焦：线上线下（300959）盘中异动上涨8.53%（05-05）

2023-05-05
当前快播：中国移动王宝晗：数据库向云原生再进化

2023-05-05
国产飞机C919突然被叫停？生活没有反转，现实比想象的更残酷

2023-05-05
焦点信息:企业文件编号规则方法_企业文件编号规则

2023-05-05
开航！琶洲港澳客运码头顺利首航将视通航情况加密航班

2023-05-05
新方法使用“电黏附”连接软材料

2023-05-05
当前视点！请写出蹦跳又蹦又跳相关的词语是什么（请写出蹦跳又蹦又跳相关的词语）

2023-05-05
“索象臻境”黄齐成雕塑艺术展今日开幕-全球热文

2023-05-05
一升汽油等于多少公斤重量一升汽油等于多少公斤

2023-05-05
沈阳康辉旅行社官网_沈阳旅行社哪家好

2023-05-05
热门看点：是的文言文意思_文言文是什么意思

2023-05-04
《宇宙探索编辑部》主演杨皓宇：种下一颗仰望星空的种子-热讯

2023-05-04
【全球播资讯】乌鲁木齐机场改扩建工程交通中心现雏形

2023-05-04
速读：光线传媒(300251)年报点评：电影内容供给节奏恢复探索AI 技术或巩固动画电影优势

2023-05-04
经济观察丨2035年工业产值破万亿元漳州古雷石化基地何以可能？

2023-05-04
当前看点!【订单】这家船厂获2艘1.4万吨级多用途船订单

2023-05-04
全球快看：沐邦高科(603398.SH)控股股东邦领贸易累计增持1.05%公司股份

2023-05-04
登上抖音总榜第二，谁在看鹿哈直播带货？|当前速看

2023-05-04
「风口研报」业绩为王！大金融起风了坚定看多传媒大行情新一轮繁荣周期开启？

2023-05-04
新疆阿克苏地区沙雅县发生3.0级地震环球短讯

2023-05-04
啄木鸟投诉平台周报：假期酒店民宿无故取消订单频发

2023-05-04
5月5日，德州籍知名肿瘤放射治疗专家赵路军教授到院专场诊疗

2023-05-04
法国巴黎银行（中国）将与中行合作推广数字人民币钱包业务|最新

2023-05-04
信用卡逾期呆账多久会被起诉？信用卡逾期多久会变成呆账？

2023-05-04
谷歌Google TV将部分安卓应用缩小25%,程序超30天未使用强制休眠焦点速看

2023-05-04
全球快消息！马上消金：警惕“元宇宙、虚拟货币”为名的新型非法集资活动

2023-05-04
当前关注：瑞士经济学教授：美国债务违约将破坏全球金融稳定

2023-05-04
“五一”假期海南接待游客超320万人次旅游总收入超42亿元

2023-05-04
诸位该回上界了_诸位-全球时讯

2023-05-04
1966年属什么生肖_都有什么生肖_天天热推荐

2023-05-04
银保监会：要补齐制度短板防范化解重点公司风险

2023-05-04
【速看料】五一“小长假”湖北公路水路发送旅客较去年同比增长98.83％

2023-05-04
环球即时：今日时讯：无人机刺杀普京这是一个很不详的信号美官员事先对无人机袭击克宫不知情

2023-05-04

Copyright © 2015-2022 欧洲纸业网版权所有备案号：沪ICP备2022005074号-23 联系邮箱： 58 55 97 3@qq.com