第二种方法是通过论文中的文字种类来判断
作者:谷小金 栏目:热点 来源:IT之家 发布时间:2023-01-08 17:01 阅读量:8955
内容摘要:颠覆性研究在下降,人类重大科技进步在放缓。 以上观点来自本周《自然》封面文章,主标题:净亏损,颇为醒目。 他们进一步指出,这一现象可能预示着科学技术本质的根本变化。 目前,这一观点和内容已被《经济学人》,《福布斯》等主流媒体引入,...颠覆性研究在下降,人类重大科技进步在放缓。
以上观点来自本周《自然》封面文章,主标题:净亏损,颇为醒目。
他们进一步指出,这一现象可能预示着科学技术本质的根本变化。
目前,这一观点和内容已被《经济学人》,《福布斯》等主流媒体引入,在Twitter,Reddit和Hacker News上也有大量关注。
那么,这个结论是怎么得出的呢。
答案必须在研究本身中找到。
如何判断论文的开创性。
衡量创新程度有两种方法。
第一种方法是根据论文的引用情况来判断。
这种方法将把新的研究分成两类。
一种是在已有理论的基础上实现突破,本质上是巩固已有的研究理论,另一种是颠覆现有理论,本质上是开拓性的新作。
比如栗子,DNA双螺旋结构,密度泛函理论都获得了诺贝尔奖。
如果按照上述方式分类,DNA的双螺旋结构显然是一个颠覆性的研究,因为它否定了生物学权威鲍林对三螺旋结构的研究。
但密度泛函理论是在前人研究的基础上提出的,与DNA双螺旋结构的开创性程度不同。
如何判断一篇论文更具开创性。
如下图,黑色代表目前要判断的研究,白色代表之前的研究,灰色代表之后的新研究,CD指数范围在1之间。
如果一篇论文是在已有研究的基础上改进的,新的研究在引用这篇论文时肯定会引用以前的研究,CD指数为负:
相反,这篇论文颠覆了以前的研究,所以新的研究将以这篇论文为基础,而不是引用以前的研究,CD指数为正:
所以DNA双螺旋结构和密度泛函理论的论文虽然被大量引用,但其CD指数分别为0.62和—0.22。下图是论文和专利的CD指数分布情况:
第二种方法是通过论文中的文字种类来判断。
一方面观察论文中新词的出现。
注意,这里的造词并不是旧词造出的新词,而是会在后面的论文内容和标题中重复使用的新词。
另一方面,统计与创造相关的动词数量。
例如,与创造和发现有关的动词通常包括产生,形成,准备和制作,类似的动词还包括确定,报告和测量。
相反,倾向于改善,优化甚至应用的动词有改善,增强,增加,使用和包含等等。
还是有新的突破。
具体来说,研究的结论如下。
我们先来看创新伴随着岁月的变化如下图所示,从1945年到2010年,左数年的论文平均CD5指数下降明显不同领域下降幅度略有不同,社会科学占91.9%,物理占100%
专利的创新也呈下降趋势国民经济研究所的数据显示,从1980年到2010年,计算机和通信领域的CD5减少了93.5%,医药和医疗领域的CD5减少了96.4%
从语言措辞的变化也可以看出相关迹象。
在1945—2010年的论文中,论文内容中使用的独特词汇和新造词汇均呈下降趋势。
有趣的是,50年前后的论文中创新相关动词的出现频率也更占优势。出现频率最高的动词包括:输出,报告,决定,测量...
相应地,在2010年的论文中,出现频率最高的动词是:基于,改进,连接,增强...
以上动词与已有的科学发现有更强的联系意义。
同样的情况也出现在专利内容的统计上。
1950年和2010年论文中每百个动词的高频词统计
但很显然,虽然论文中创新的比重在下降,但创新成果的产出在绝对数量上趋于稳定。
如下图,左边是1950—2010年的论文统计,右边是1980—2010年的专利数量不同颜色的线代表不同的CD5指数区间
可以看出,虽然蓝线随年份上升较快,但这部分代表的是创新性较弱的论文和专利数量。相对而言,高度创新的论文和专利的绝对数量趋于稳定:
他们指出,创新的整体下降不能让我们忽视许多高度创新的研究成果和发明。
那么,是什么导致了整体创新的下滑呢。
研究人员推测,这种趋势与各个研究领域的知识增长有关。
为此,他们统计了几十年来论文和专利的被引作品的引用多样性,自引平均值和平均年份。
结果显示,无论论文还是专利,引文多样性下降,平均自引增加,引文平均发表年份也增加。
通过上述统计结果,研究人员得出结论,科学家和发明家更依赖于熟悉的现有知识和技术,并且这些知识具有高度的同源性。
这可能导致缺乏创新成果。
目前,这项研究已经引起了众多相关从业者和技术爱好者的关注。
一位生物医学家认为这并不奇怪,并称研究内容相当有趣。
有网友认为,资本也是导致上述现象的一大因素。
他补充说,在过去的50年里,更多的资金从产出颠覆性变化的基础研究转向了具有直接可见效益的应用研究。
对此你怎么看。
论文地址:
参考链接:
。郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。