中美两国国家自然科学基金项目相关数据

数据的链接方式请查看Acemap数据库信息的文章,主要用到的数据库是NSF_CN和NSF_US

  • NSF_CN
    • nsf_approval 申请资助成功的项目
    • nsf_conclusion 已经结题的项目
  • NSF_US
    • nsf 全部美国国家自然科学基金项目
    • nsf_mapping 基于nsf补充映射入Acemap数据库的作者id

表格内的字段大家可以自行理解其名字。

中美合作者关系获取

此处的合作数据不做严格的要求,下面提供两个思路: 方法一相对来说简单一些,但是数据量不会很大,方法二数据量庞大,但是获取的时间相对较长。

  • 方法一:
    • 联系助教获得中国国家自然科学基金合作者数据
    • 再通过其中已经结题的“国际合作”项目获得中美间合作的数据网络。
  • 方法二:
    • 通过Acemap总数据库的论文信息获得学者合作网络
    • 再通过中美国家自然科学基金项目持有人,进行筛选,构建网络

课程结束可提交回你们构建此数据对应关系的数据集,提供自己的贡献(可以联系助教加鸡腿)。

中国国家自然科学基金合作者数据

由于数据格式奇葩,实验室图数据库维护,且不希望采用共享文本的方式进行分享。目前采取一个项目一行数据的存储方式,依旧在NSF_CN数据库中,cn_co进行维护,目前仍在实时导入,预计于4.30 晚上7点前后导入完全已经导入完全。

访问方式可以为

py , python import json def load_json(str): load_dict = json.load(str) projectAdmin = load_dict["projectAdminID"] ratifyNo = load_dict["ratifyNo"] participatantsList = load_dict["participants"]

数据格式

此外不建议按照字符串查询,as a network可以直接,dump下来进行json解析和相关的操作。

关于提交贡献

解决方案:

  • 提交一个tar.gz文件包如data.tar.gz,里面包含三个文件,数据文件(可以是文件夹),导入数据库的代码(目前只支持py),并且还有建表信息以及一个README.md,这个文件夹很重要,里面需要说明三个问题:

  • 代码的哪个位置用于修改数据库目的地
  • 数据的量级
  • 数据集的描述(如果能说明构建方式就更好了)

如果贡献有效且有意义,可以联系助教加鸡腿