天天信息:大语言模型中的涌现现象是不是伪科学？

来源：程序员客栈时间：2023-04-25 15:51:21

Datawhale干货

作者：平凡@知乎，诺桑比亚大学，在读博士

(资料图片仅供参考)

今天晚上，花了一点儿时间看了两篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

这两篇讲的都是emergent behavior，即涌现现象。

大规模神经网络下的涌现现象

在机器学习中使用大规模神经网络时，由于增加了参数数量、训练数据或训练步骤等因素，出现了定性上的新能力和性质，这些能力和性质在小规模神经网络中往往是不存在的。

第一篇文章举了这个例子，每个图都可以理解为一个任务，横轴是神经网络的规模，而纵轴是准确率，可以理解为模型的性能。

我们拿图一来看，在10的22次方前，这些模型基本上的性能基本上都很稳定在0附近，而在10的22以后，突然在10的24次方上获得了很大的性能提升，在其他的几个任务上都表现出类似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的评论引用在这里：

作者发现，当我们训练用网络计算同余加法 a+b = ? (mod c) 时，网络在某个时间突然获得了 100% 准确率。分析发现，神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法！这个算法可以证明是正确的，反人类直觉的。

从这俩例子里面我的感受是，只要数据量足够且真实，且模型没有硬错误的前提下，不断的训练说不定真的能够产生一些意想不到的效果。

还有就是我觉得人类现在积累的知识并不少，但是系统的少，零星的多，如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话，我觉得有很大概率会让它涌现出意想不到的能力。

甚至可能把人类的生产力解放提前很多。

参考

1.https://arxiv.org/pdf/2206.07682.pdf

2.https://arxiv.org/pdf/2301.05217.pdf

上一篇：里昂：重申友邦保险买入评级目标价100港元

下一篇：最后一页

X 关闭

导航

天天信息:大语言模型中的涌现现象是不是伪科学？

推荐

天天信息:大语言模型中的涌现现象是不是伪科学？

里昂：重申友邦保险买入评级 目标价100港元

世界快播：啧啧啧是什么梗_啧啧啧

中国儿童阅读发展研究报告发布

快讯2023-04-25 12:27:31 天天新视野

孝昌：推进制度创新 项目落地提速 天天快讯

动态：南阳市12315指挥中心发布五一消费警示 文明旅游 理性消费

人民银行今日开展1700亿元逆回购操作 公开市场实现净投放1320亿元

云南鼓励和规范互联网租赁自行车发展 共享单车企业原则上不收押金

*ST未来：因涉嫌信息披露违法违规，遭证监会立案-环球观速讯

原神：3.7宵宫复刻确定，但还有必要抽她吗？丢箭，命座提升难|环球热闻

培养勇气的方法（孟子列举了哪些人培养勇气的方法）

内外革新，指导价16.78万，搭配四驱系统，详解三菱奕歌

【快播报】大阪松种子 大阪松

如何科学组合培训内容？_环球热推荐

睾丸萎缩是什么原因_睾丸萎缩

全新华为Watch Ultimate是经典智能手表设计的巅峰之作-今日看点

第四范式四次递表港交所主板 去年收入超30亿元

古梨园百岁梨树开花了！

俄罗斯今年石油产量或符合减产后的预期

芙蓉国评论：左手拢“烟火” 右手盈“书香”-最新快讯

万里扬最新公告：2022年净利3亿元 同比扭亏-天天新要闻

出行注意！今起这两条公交线路恢复行经黄村立交桥

摇曳菡萏txt_摇曳菡萏

预计5月入市,虹桥公馆3期建面约92-105㎡低密纯3房加推在即|环球热推荐

视讯！到亚明美术馆感受技术再现古代名迹的独特美感

昌红科技(300151.SZ)发布2022年度业绩，净利润1.28亿元，增长14.34%，拟10派2元-每日热门

【世界报资讯】央行：截至今年3月末全国共有小额贷款公司5801家

每日视点！信用卡存多的钱可以取出吗 情况是这样的

当前热文：Cell子刊：哈佛大学研究证实，压力导致的衰老，可以在休养后恢复

主力复盘：25亿抢筹游戏 10亿净买入比亚迪_环球看热讯

周生生对用户订单一“砍”了之合理吗 环球即时看

包粽子裹上糖的寓意是 包粽子放糖方法|视点

天天微资讯！打造老百姓家门口贴心“小银行”

一次性新增12台全智能化龙门吊 厦门港智能化迭代升级再提速

江油市桂花村连续四年为村民分红 累计分红252万元惠及群众5000余人

弘信电子：南充生产基地一期刚建成投产，客户正在进行导入阶段 新动态

网传郭亮挂壁公路塌方 景区回应：正常排险

焦点！B站千万粉丝UP主回应停更传言！称接不到广告、创作激励不够付房租，网友：这粉丝量级都接不到广告，离谱

全球微动态丨“新课程阅读”乡村振兴读书活动举办，打造乡村阅读示范点 环球看热讯

每日观察!自主神经功能紊乱的症状_神经功能紊乱的症状

199管理类联考综合能力网课推荐（199管理类联考综合能力）_世界微头条

难怪我对外国明星脸盲，他们根本不在乎颜值，只在乎角色

环球关注：宝马ix2022款m60驾驶体验

长沙发布23条稳经济措施 4000万元数字人民币消费券促消费

马斯克回复称赞中国高铁的推文详细内容

田野即景作文范文6篇（田野即景作文） 全球速递

世界观点：学信网学历证明怎么打印出来（学信网学历证明怎么打印）

​央行召开2023年会计财务工作电视会议

世界快看：家庭教育的心得体会怎么写_家庭教育的心得体会

【世界快播报】暖宝宝贴可以带上飞机托运吗_暖宝宝贴能不能带上飞机托运

全球快资讯丨生物医药园区走出独立行情

重磅!首套房贷利率或上调!央行发声了

环球快看：比周一更痛苦的，是周日上班

天天即时：《漫威蜘蛛侠》开发商Insomniac Games员工数量已超520人

“图说”一周国际热点：德俄两国再次相互大规模驱逐外交官-天天新消息

vivo手机死机开不了机_vivo手机死机怎么办

全球今日报丨电脑录音软件哪个好用没有杂音

环球观焦点：跟老板谈工资说话需要哪些技巧？

销售自己使用过的固定资产怎么开票 销售自己使用过的固定资产账务处理|当前热议

七年级语文教学小论文（七年级语文教学计划） 微头条

【战锤40K】松林道场066：不限制距离的天使道标

王楚钦、王曼昱分获WTT冠军赛澳门站男、女单打冠军 天天快看

马龙0-4惨败被质疑打假球具体详细内容是什么

天天播报:浙江师范大学钱江学院是公办还是民办_浙江师范大学钱江学院

每日时讯!4月24日中国航天日 文昌航天科普中心免费对外开放

西安女子本想买块表 进店后贷了款还拿到多个非“苹果”配件|全球热推荐

右眼皮老跳是什么原因_右眼皮一直跳是什么原因

CDPR首席设计师：现在的3A游戏开发经常碰壁

长沙市初创企业经营场所租金补贴申请表下载 每日看点

外资看不看好中国？杭州一季报：实际利用外资猛增57%，都有谁？

人民的名义郑胜利是谁_人民的名义郑胜利介绍

usa是哪个国家的简称_usa是哪个国家|全球今热点

天天百事通！晻映_对于晻映简单介绍

全球热资讯！农发行云浮市分行团委深入开展爱国卫生志愿服务活动

中央气象台4月23日18时继续发布强对流天气蓝色预警

沙坡头区气象台发布霜冻蓝色预警【IV级/一般】【2023-04-23】

里昂：重申友邦保险买入评级目标价100港元

孝昌：推进制度创新项目落地提速天天快讯

动态：南阳市12315指挥中心发布五一消费警示文明旅游理性消费

人民银行今日开展1700亿元逆回购操作公开市场实现净投放1320亿元

云南鼓励和规范互联网租赁自行车发展共享单车企业原则上不收押金

【快播报】大阪松种子大阪松

第四范式四次递表港交所主板去年收入超30亿元

万里扬最新公告：2022年净利3亿元同比扭亏-天天新要闻

每日视点！信用卡存多的钱可以取出吗情况是这样的

周生生对用户订单一“砍”了之合理吗环球即时看

包粽子裹上糖的寓意是包粽子放糖方法|视点

一次性新增12台全智能化龙门吊厦门港智能化迭代升级再提速

江油市桂花村连续四年为村民分红累计分红252万元惠及群众5000余人

弘信电子：南充生产基地一期刚建成投产，客户正在进行导入阶段新动态

网传郭亮挂壁公路塌方景区回应：正常排险

全球微动态丨“新课程阅读”乡村振兴读书活动举办，打造乡村阅读示范点环球看热讯

田野即景作文范文6篇（田野即景作文）全球速递

央行召开2023年会计财务工作电视会议

销售自己使用过的固定资产怎么开票销售自己使用过的固定资产账务处理|当前热议

七年级语文教学小论文（七年级语文教学计划）微头条

王楚钦、王曼昱分获WTT冠军赛澳门站男、女单打冠军天天快看

每日时讯!4月24日中国航天日文昌航天科普中心免费对外开放

西安女子本想买块表进店后贷了款还拿到多个非“苹果”配件|全球热推荐

长沙市初创企业经营场所租金补贴申请表下载每日看点

中老铁路国际旅客列车朝发夕至全程旅行时间10小时30分-天天快资讯

深蓝汽车首次亮相上海车展以硬核产品及技术加速电动时代

华擎上架A620M主板支持 AMD锐龙7000处理器_环球精选

世界首台兆瓦级高温超导感应加热装置投用能效转化率提升一倍

视点！海外经济衰退预期再起预计铜价承压下行