【每周一读】如何选择更合适的文献数据库
DOI:10.1007/s11192-022-04289-7
如果我有一个具体的搜索目标,我应该去哪找到最为相关的结果?
文献作为主要的知识传承形式,仍然是学者获取知识的主要来源,而在现
期刊:Scientometrics DOI:10.1007/s11192-022-04289-7 如果我有一个具体的搜索目标,我应该去哪找到最为相关的结果? 文献作为主要的知识传承形式,仍然是学者获取知识的主要来源,而在现在的互联网时代MySQL 选择数据库,学者查阅文献也主要依赖文献数据库,如以Google Scholar 为首的综合文献数据库,和以学科专业性标榜的学科文献数据库。 作者将学者在文献数据库中检索的行为分为了两个目的:得到更多的结果(高召回率)、得到更准确的结果(高准确率)。为了对此展开研究,作者将这两个目的通过学科覆盖率这一指标来定量表示。 1 研究假设 假设1:基于关键词的查询在文献数据库中普遍可用,是迄今为止访问学术记录的最常见方式。只有少数文献数据库不提供此类的搜索选项; 假设2:基于查询命中计数的信息(使用基于特定关键词的查询返回的记录数量)通常是可用的,而且大多数情况下是准确的; 假设3:使用特定关键词搜索将得到一组文献记录,这些记录在指定的文本中包含该关键词。这使得确定覆盖范围成为可能,即使不下载个别的记录,仅知道命中的次数就可以评估数据库的内容; 假设4:基于关键词的查询是访问文献数据库中所有可用记录的最有效方法。没有必要提取文献记录的样本 2 数据 作者在本研究中共选取了56个文献数据库进行比较,这些数据库满足以下两个要求: 活跃的、可访问的、至少有100万条记录的数据库,(可能是)大部分是英语记录,并且在研究人员中相当受欢迎的数据库【可以是免费的、部分付费的或完全付费的】 包含完善的搜索功能 3 研究方法 作者在本研究中选取了两种研究方法,分别是basket of keywords (BOK)和Query hit counts (QHC): basket of keywords (BOK) : Query hit counts (QHC): 因为需要计算学科覆盖率,因此需要一个学科分类体系,同时为了给Query hit counts (QHC)寻找基准,因此需要一个可信度较高的文献数据库。数据库需要满足以下几个要求: 根据上述标准,可以筛选出Scopus All Science Journal Classification (ASJC)和Web of Science(WOS),由于ASJC的机构覆盖无差别,即不同机构的学者可以访问到相同的数据且分类体系更稳定,作者选取ASJC作为分类体系参考和QHC基准,WOS则作为验证集 4 实验结果 1.不同学科文献的绝对数量(召回率) 2.不同学科文献的相对覆盖程度(准确率) 6 总结 本研究提出一种评估文献数据库主题覆盖的新方法。BOK方法和QHC方法的结合能够根据56个数据库的相对和绝对覆盖范围对它们进行排名。由此得到的结果很有帮助,因为它们既量化了覆盖率的文本描述,也促进了主题覆盖率的比较。 同时该方法亦可以检测覆盖率描述中没有描述的主题。作者额外指出,ERIC中超过13%为心理学内容,而这是一个专注于教育的数据库,虽然在其内容中列出了以心理学为导向的期刊,但并没有明确提到它的心理学内容。 撰稿:顾伟业 (编辑:成都站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |