研究,状况和疾病分类(RCDC)系统

 

RCDC-流程如何进行

基于RCDC的计算机程序将NIH资助的项目分类为研究领域,疾病或状况。 RCDC分类过程中的四个主要步骤概述如下。

第一步:选择类别

类别可以是研究领域,例如神经科学,疾病(例如糖尿病)或疾病(例如慢性疼痛)。 RCDC程序将继续报告NIH历史上向国会和公众报告的280多个类别。

这些类别在以下位置列出: 分类支出页面.

第二步:创建类别定义

来自NIH研究所和中心的科学专家共同努力,确定了每个类别。他们遵循了这四个步骤来创建定义。

 

1.选择术语和概念
类别定义是与类别最相关的一系列概念。这些选自RCDC词库,该词库由180,000多种生物医学概念和同义词组成。 RCDC同义词库结合了多种来源的术语和概念: 

  • 国家医学图书馆的MeSH(医学主题词)词库
  • CRISP词库
  • 美国国家癌症研究所词库
  • 词库
  • Jablonsky的字典
  • 美国国立卫生研究院和中心的其他特定类型的概念
  • NIH 科学专家添加的其他单词或短语,以确保捕获特定区域

2.增加重量
科学专家可以为每个术语或概念增加权重(使用数学公式)。权重有助于显示该术语或概念对整体类别定义的相对重要性。权重还有助于RCDC将项目分类为最合适的类别。 

3.设置阈值
科学专家还为每个类别设置了阈值。阈值是类别和受资助项目之间匹配的术语和概念的最小数量。如果项目达到或超过某个类别的阈值,则RCDC会将其包括在该类别中。阈值减少了将资助的赠款或合同列入不相关类别的机会。 

4.验证定义
最后一步是验证类别定义。验证是分类过程的重要组成部分。 NIH 科学专家希望确保RCDC过程尽可能敏感和具体。要验证定义:

  • 整个数据库中的所有项目均根据类别定义进行测试。
  • 专家检查分配给该类别的项目的结果列表。
  • 然后,他们提出了一些方法来完善类别的术语,概念,权重和阈值,以帮助制定最有效的分类赠款和合同清单。

一旦科学专家选择了术语和概念,增加的权重,设置了阈值并通过了验证测试,便会定义RCDC类别。科学专家将定期审查和更新类别定义,以说明新科学或其他变化。

第三步:创建项目摘要

项目摘要是带分数的术语和概念的列表,RCDC流程使用这些术语和概念来描述NIH资助的项目。 RCDC流程为NIH数据库中列出的每个资助拨款和合同创建项目摘要。 RCDC包括以下类型的资助赠款和合同:

  • 美国国立卫生研究院校园外授予科学家的补助金(外部补助金)
  • 研发合同
  • 国立卫生研究院员工科学家在国立卫生研究院校园内开展的研究项目(内部拨款)

要创建项目摘要,RCDC:

  1. 搜索项目的标题,摘要,特定目标和与公共卫生相关的部分,以查找与RCDC同义词库匹配的术语和概念或其同义词。
  2. 根据匹配的术语和概念在项目的搜索部分中出现的频率对它们进行排名。术语或概念出现的次数越多,则术语或概念的得分越高。标题中出现的术语和概念无论其出现的频率如何,总是具有最高的重要性。

带分数的术语和概念的结果列表是该NIH资助项目的RCDC项目摘要。

第四步:将项目与类别匹配

RCDC系统将项目摘要与类别定义进行比较,以确定它们的匹配程度。如果RCDC项目摘要符合NIH科学专家设置的阈值分数,则RCDC将该赠款或合同分配给该类别。 

RCDC汇总了所有适合特定类别的资助和合同清单。每个类别下的赠款和合同清单,或项目清单,还包括诸如融资金额之类的详细信息。 

RCDC流程使NIH能够应用最新技术来持续报告如何将美国的税金用于支持医学研究。 NIH 的计算机技术(知识管理应用程序)可以在所有NIH中对资助的研究进行一致的分类。通过RCDC程序,NIH可以在网站上提供直接的公共访问权,以获取详细而完整的项目清单。