中美国家自然科学基金数据说明
中美两国国家自然科学基金项目相关数据
数据的链接方式请查看Acemap数据库信息的文章,主要用到的数据库是NSF_CN和NSF_US
- NSF_CN
- nsf_approval 申请资助成功的项目
- nsf_conclusion 已经结题的项目
- NSF_US
- nsf 全部美国国家自然科学基金项目
- nsf_mapping 基于nsf补充映射入Acemap数据库的作者id
表格内的字段大家可以自行理解其名字。
中美合作者关系获取
此处的合作数据不做严格的要求,下面提供两个思路: 方法一相对来说简单一些,但是数据量不会很大,方法二数据量庞大,但是获取的时间相对较长。
- 方法一:
- 联系助教获得中国国家自然科学基金合作者数据
- 再通过其中已经结题的“国际合作”项目获得中美间合作的数据网络。
- 方法二:
- 通过Acemap总数据库的论文信息获得学者合作网络
- 再通过中美国家自然科学基金项目持有人,进行筛选,构建网络
课程结束可提交回你们构建此数据对应关系的数据集,提供自己的贡献(可以联系助教加鸡腿)。
中国国家自然科学基金合作者数据
由于数据格式奇葩,实验室图数据库维护,且不希望采用共享文本的方式进行分享。目前采取一个项目一行数据的存储方式,依旧在NSF_CN数据库中,cn_co进行维护,目前仍在实时导入,预计于4.30 晚上7点前后导入完全已经导入完全。
访问方式可以为
py , python
import json
def load_json(str):
load_dict = json.load(str)
projectAdmin = load_dict["projectAdminID"]
ratifyNo = load_dict["ratifyNo"]
participatantsList = load_dict["participants"]

此外不建议按照字符串查询,as a network可以直接,dump下来进行json解析和相关的操作。
关于提交贡献
解决方案:
-
提交一个tar.gz文件包如data.tar.gz,里面包含三个文件,数据文件(可以是文件夹),导入数据库的代码(目前只支持py),并且还有建表信息以及一个README.md,这个文件夹很重要,里面需要说明三个问题:
- 代码的哪个位置用于修改数据库目的地
- 数据的量级
- 数据集的描述(如果能说明构建方式就更好了)
如果贡献有效且有意义,可以联系助教加鸡腿。