近代物理文献分析

基于谷歌学术的爬虫数据分析

Posted by CLQ on August 17, 2021

简述动机

本文的想法在很早之前就已经产生了,但是一直碍于时间与精力,没能动手.这个想法在这学期正好作为了课程论文的内容.

分析的局限性

本文总数据样本有17000份,核心数据样本仅有4407份,且主要来源为英语文献,对德文等的统计较少,统计范围主要为1900-2010年的文献,对于早期文献,谷歌学术本身收录并不全面,一定程度上会影响结论的可靠性,准确性.

数据分析的几个简单结论

通过对文献的引文关系聚类(社区图),可得到以下文献分类

文献图结构

而在这张引文关系图中,每个类别的大小如下,根据这些类别的大小,可以将近代物理分类为22个方向.

数据1

在这22个类别中,简答罗列出以下几个主要类别,这些类别中被标出的文献是通过文献本身,与类内其他文献的依赖关系,总的被引数量综合判断得出的.

分数量子霍尔效应

超导理论

对量子力学的质疑

文献中最高引用的几篇

更进一步的分析计划

主要还是时间和精力的限制,本来打算根据此次文献分析的结果,阅读相关文献,以此对这个近代物理进行一个把握,不过只阅读了一部分,这里就不放出来了.

当然除了文献本身的阅读,这些爬虫数据也有待进一步分析,应当能挖掘出更多有意思的东西,关于数据集本身,我应该会进行整理,之后放在github上.