搞科研新姿势：让 GPT-3 给你打下手

发布时间：2023-03-09 15:07:38 来源：量子位

搞科研的最新姿势，被一位华人小哥解锁了——

(资料图片)

告诉 AI 你的研究目标，再把数据集 " 投喂 " 进去，完事。

这就是来自伯克利的博士生 Zhong Ruiqi 等人的最新研究，把从海量数据集中繁琐的 " 取证 " 过程，统统交给GPT-3来解决：他们还发现，这种用 AI 搞科研的方法不仅效率高，而且还能得出人类没有想到的 " 意外惊喜 "。让 GPT-3 帮你搞科研

那么小哥他们为什么突发奇想地要用这种方式搞科研呢？

这是因为他们发现，对大型语料库做深入的挖掘确实能得到一些有用的结果，但这个过程要是让人类来搞，那简直就太费时费力了。

因此，他们便决定把这个繁琐的过程交给 GPT-3 来处理，并把这个任务命名为"D5"：

Goal Driven Discovery of Distributional Differences via Language Descriptions.

通过语言描述，实现目标驱动的分布式差异的发现。

"D5" 任务的过程，简单来说就是两个动作：

输入研究目标

输入两个语料库

例如在上面这个案例中，小哥先是给 AI 输进去了两个语料库：

语料库 A：服用药物 A 后患者的反应报告

语料库 B：服用药物 B 后患者的反应报告

然后再向 AI 确定自己的研究目标，即 " 我想了解一下药物 A 的副作用 "。

在 AI 收到任务后，立刻开始执行分析工作，最后得出了它的结论：

语料库 A 中的样本，有更多的患者会提到 " 妄想症 "（paranoia）。

不过试想一下，若让人类科研人员做这项工作，光是了解语料库 A 和 B 就需要花费大量的时间，更别提还得进一步做对比分析等工作了。

而 D5 任务之所以能够做得如此丝滑，是因为小哥他们在此背后还做了不少工作。

例如构建 OpenD5 元数据集，它包含符合 D5 任务的 675 个开放式问题，所涉及领域涵盖商业、社会科学、人文科学、健康和机器学习等。

并且每个开放式问题都会对应一个语料库对儿（语料库 A 和语料库 B），平均有 17000 个样本。

小哥还把每个语料库中的 50% 作为研究部分，另外 50% 则是拿来做验证。

基于此，小哥他们再构建了一个 "D5 系统 "，它的工作原理和人类从数据库中获取发现类似，分为两个阶段，即创造性地提出一个假设，再在数据集上严格验证这个假设。

按照这种思路，研究人员接下来用 GPT-3 做了次实验。

他们先是向 GPT3 展示研究目标和每个语料库中的一些样本，然后让它提出一个假设列表。

最终实验发现，GPT-3 可以使用目标描述来提出更相关、更新颖、更有意义的假设。

也正因为 OpenD5 数据集所涵盖的领域众多，因此小哥表示他们的 D5 系统具备应用范围广的特点。

也存在一些缺陷

但对于这套 D5 系统，小哥也直言不讳地道出了它的缺陷。

例如，若是语料库中含有较多的俚语、俗语或者带有情绪的词汇，那么 AI 所给出的 " 发现 " 就会存在偏差。

简而言之，就是 AI 对于特定情况的词汇或描述产生了错误的理解和分析。

除此之外，小哥也表示更灵活的语料库、更具扩展性的系统，也是他们在未来重点研究的方向。

不过似乎这项研究让小哥也是兴奋不已，毕竟离他 " 构建一个用 AI 稿科研 " 的梦想更近了一步。

参考链接：

[ 1 ] https://arxiv.org/abs/2302.14233

[ 2 ] https://twitter.com/ZhongRuiqi/status/1631109680859865089?s=20

— 完—

CCF 移动机器人抓取和导航挑战赛

开启注册报名

由中国计算机学会（CCF）主办、CCF 智能机器人专委会承办的首届"CCF 移动机器人抓取和导航挑战赛 "已开启注册报名。比赛将评估智能机器人在家居场景下的场景理解、导航和抓取能力，最高奖金 1 万美元！

报名截止到 6 月 20 日，欢迎各高校、机构的研究者报名参赛。

点这里关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

标签：

搞科研新姿势：让 GPT-3 给你打下手

解读《新时代的中国绿色发展》白皮书：坚定不移走绿色低碳发展之路

国务院新闻办公室近日发布了《新时代的中国绿色发展》白皮书。白皮书向国内外讲述新时代推动绿色发展的...

新兴食品现身市场 “植物肉”产品能否“俘获”消费者的胃？

最近一段时间，部分超市和电商平台售卖的植物肉纷纷推出促销优惠活动，销量看涨。不过也有消费者表示，...

绍兴招才引智云对话活动举行 诚邀天下英才“会盟”绍兴

懂人才是大学问，聚人才是大本事，用人才是大智慧。近年来，绍兴市大力实施人才强市战略，持续深化人才...

江苏省自然资源厅出台指导意见 推进老旧小区改造工作

省自然资源厅近日出台《关于大力推进城镇老旧小区改造工作的指导意见》，针对城镇老旧小区改造中规划和...

2021年中国心血管健康指数排名：江苏位列前五

进行了排名，江苏位列前五。北京、上海、江苏等地居民心血管更健康这项发表在《中国疾病预防控制中心周...

科研人员揭示5种豆科植物的核型数据及亲缘关系

近日，四川农业大学林学院副教授罗小梅团队在遗传学领域期刊《基因》(Genes)，在线发表了题为《基于5S ...

“烟火气”十足的“江苏味道” 河西CBD顶流商圈开街迎客

开街啦!5月18日上午，在河西CBD金融城融媒路上，2022江苏省新能源汽车&信息消费创新产品推广系列活动启...

首个锌金属的伴侣蛋白诞生 有助于解决缺锌公共卫生问题

据17日发表在《细胞》与《细胞报告》杂志上的两篇论文，美国研究人员发现了第一个锌金属的伴侣蛋白，并...

科学家首次揭示糖尿病卵母细胞起源 有助于减少生育缺陷

5月19日，记者从浙江大学获悉，浙大医学院附属妇产科医院黄荷凤院士团队与中国科学院徐国良院士团队合作...

前4月河北省电信网络诈骗案件发案数连续4个月同比下降

记者从省政府新闻办5月18日举行的河北省打击治理电信网络诈骗犯罪工作新闻发布会上获悉，今年1至4月，全...

重庆：到2025年25个重点领域企业能效全部达到基准水平

3月18日，重庆日报记者从市发展改革委获悉，日前，市发展改革委、市经济信息委、市生态环境局、市市场监...

重磅！2021“发现重庆之美”获奖名单揭晓

3月19日，2021发现重庆之美颁奖典礼在线上举行，最美城市管理人、最美坡坎崖、最美街头绿地、垃圾分类时...

去年重庆回收废弃农膜1.4万吨 农膜回收率达89.31%

3月16日，市五届人大常委会第六十九次主任会议听取了市政府关于《重庆市人大常委会对市人民政府农业面源...

申报分两批！今年国家级博士后科研工作站新设站工作启动

3月19日，重庆日报记者从市人力社保局获悉，为推动产学研深度融合，加强博士后工作平台建设，我市将开展...

浙江鄞州：“水、电、气、数”通办专窗实现城乡公共服务均等化

近日，在宁波市鄞州区邱隘镇公共事务服务中心，66岁的邱隘镇沈家新村居民邱秀月在一个窗口相继办理了不...

打开“浙里办” 浙江1000家农贸市场农产品可线上比价

今天哪个菜场的五花肉最便宜?食品安全抽检结果怎么样?这些问题，浙江居民只需打开浙里办APP上的浙里市场...

浙江鉴湖国家湿地公园规划发布 打造乡村数字旅游

19日上午，鉴湖国家湿地公园规划发布暨东鉴湖农旅观光体验启动仪式在绍兴市越城区陶堰街道举行。当天，...

总投资超10亿元！6个石化装备运维项目在岱山签约

日前，总投资超10亿元的6个石化装备运维项目在岱山经济开发区集中签约。此次签约的项目占地106亩，规划...

如何避免成为“买而不做”的“装备党”祝 杰

自恋是人的天性，人们总是希望自己是更好的，那么自己拥有的事物，也就相应地被自我赋予了更高的价值，...

山西临汾：率先在全省建起农村集体经济开发区

3月17日，临汾市农村集体经济发展(集团)有限公司在临汾经济开发区揭牌。以此为标志，临汾率先在全省建起...

一线工作近22年的缉毒警：我知道坏的是毒品不是人性

“影子”般的缉毒警：一线工作22年，我知道坏的是毒品不是人性 如果我不继续干，别人也要干，缉...

广东肇庆“毒驾连撞5车致1死”肇事司机被批捕

1月5日14时30分许，广东肇庆市端州区一男子赵某毒驾连撞5车，致一人死亡。 1月10日，澎湃新闻(ww...

江西最大文物倒卖案宣判：倒卖国家二级文物 9人获刑

中新网南昌1月10日电 (冷峥嵘 张一怡)江西省共青城市人民法院10日发布消息称，近日，该院依法审结...

青海保障门源地震后生活必需品应急物资

中新网西宁1月10日电 (记者 孙睿)记者10日从青海省商务厅获悉，青海海北州门源县6 9级地震灾害发...

广西东兴口岸恢复通关 入境需网上预约

中新社防城港1月10日电 (翟李强)自2022年1月10日零时起，广西东兴口岸和边民互市贸易区恢复人员、...

呼和浩特：寒假期间有条件的学校要开展校内托管服务

“中国最后一个原始部落”翁丁老寨火灾原因公布

北京市十五届人大五次会议胜利闭幕

天津市委市政府致全市父老乡亲的慰问信：我们一定能够打赢

天津米面油存量由20天提高至30天 超市菜市场进货量翻倍

兰州名师话“美育”：“尚乐立人”分层培优 以“美”润教

子夜直击，天津寒天战“疫”

重庆姐弟被生父扔下坠亡案上诉期结束 一审法院暂未收到两被告人上诉状

天津：划定封控区 全市开展全员核酸检测

江歌母亲江秋莲：尊重法院判决，法律认定在我意料之中

中国边疆“北方第一所”：9名民警守护“生命禁区”

辟谣！网传“封控区管控区相继解封”通知并非西安

河南安阳9日12时至24时新增11例本土确诊病例

老人5折环卫工8折生活困难免费 这家面馆背后有个暖心事

铁路公安以110幅优秀书画作品庆祝人民警察节

本周中东部冷空气频繁 东北等地有降雪

河南新增本土确诊病例60例

“打拐”民警眼里的百态人生：见证一份份不愿放弃的爱

迎腊八北京晴天上线 阵风6至7级体感冻人

多省份倡议春节“非必要不离开”，这地补贴1000元

伪造国家机关证件典型案例发布 有力打击制假贩假行为

15年照顾170多个新生儿 金牌月嫂“漂”到海外去看娃

江歌母亲江秋莲诉刘鑫案一审将于今日宣判

河南省安阳市两地划为高风险地区 一地划为中风险地区

员工迟到一次罚一千引争议 单位惩戒员工法律边界何在？

以体育人 秀出“青年范儿”

保安、厨师曾被竞业限制 企业滥用竞业限制让员工很苦恼

反诈老陈破圈：人民群众在哪 就把反诈宣传开展到哪

一所中职学校的育人实践

绍兴招才引智云对话活动举行诚邀天下英才“会盟”绍兴

江苏省自然资源厅出台指导意见推进老旧小区改造工作

首个锌金属的伴侣蛋白诞生有助于解决缺锌公共卫生问题

科学家首次揭示糖尿病卵母细胞起源有助于减少生育缺陷

去年重庆回收废弃农膜1.4万吨农膜回收率达89.31%

浙江鉴湖国家湿地公园规划发布打造乡村数字旅游

如何避免成为“买而不做”的“装备党”祝杰

　　“影子”般的缉毒警：一线工作22年，我知道坏的是毒品不是人性　　如果我不继续干，别人也要干，缉...

　　1月5日14时30分许，广东肇庆市端州区一男子赵某毒驾连撞5车，致一人死亡。　　1月10日，澎湃新闻(ww...

　　中新网南昌1月10日电 (冷峥嵘张一怡)江西省共青城市人民法院10日发布消息称，近日，该院依法审结...

　　中新网西宁1月10日电 (记者孙睿)记者10日从青海省商务厅获悉，青海海北州门源县6 9级地震灾害发...

广西东兴口岸恢复通关入境需网上预约

　　中新社防城港1月10日电 (翟李强)自2022年1月10日零时起，广西东兴口岸和边民互市贸易区恢复人员、...

天津米面油存量由20天提高至30天超市菜市场进货量翻倍

兰州名师话“美育”：“尚乐立人”分层培优以“美”润教

重庆姐弟被生父扔下坠亡案上诉期结束一审法院暂未收到两被告人上诉状

天津：划定封控区全市开展全员核酸检测

老人5折环卫工8折生活困难免费这家面馆背后有个暖心事

本周中东部冷空气频繁东北等地有降雪

迎腊八北京晴天上线阵风6至7级体感冻人

伪造国家机关证件典型案例发布有力打击制假贩假行为

15年照顾170多个新生儿金牌月嫂“漂”到海外去看娃

河南省安阳市两地划为高风险地区一地划为中风险地区

员工迟到一次罚一千引争议单位惩戒员工法律边界何在？

以体育人秀出“青年范儿”

保安、厨师曾被竞业限制企业滥用竞业限制让员工很苦恼

反诈老陈破圈：人民群众在哪就把反诈宣传开展到哪

各地严惩恶意欠薪保障农民工及时拿到工资

中学生成剧本杀行业潜在消费人群多方助推行业“净化”

琉璃河遗址两段铭文共证北京三千年建城史

琉璃河遗址两段铭文共证北京三千年建城史

河南郑州调整五地为中风险区域公路入郑需核酸检测阴性证明

《传奇2》网游著作权纠纷案峰回路转最高法五份裁决四份改判一份发回重审

“团圆”行动刑侦专家吕游每一个案例都有单独的技术方案

开考古书店日均两三个顾客流量时代她决心仍是只卖书

“520”南京消费券又来了用真金白银为推动消费市场加油