中美国家自然科学基金数据说明

中美两国国家自然科学基金项目相关数据

数据的链接方式请查看Acemap数据库信息的文章，主要用到的数据库是NSF_CN和NSF_US

NSF_CN
- nsf_approval 申请资助成功的项目
- nsf_conclusion 已经结题的项目
NSF_US
- nsf 全部美国国家自然科学基金项目
- nsf_mapping 基于nsf补充映射入Acemap数据库的作者id

表格内的字段大家可以自行理解其名字。

中美合作者关系获取

此处的合作数据不做严格的要求，下面提供两个思路：方法一相对来说简单一些，但是数据量不会很大，方法二数据量庞大，但是获取的时间相对较长。

方法一：
- 联系助教获得中国国家自然科学基金合作者数据
- 再通过其中已经结题的“国际合作”项目获得中美间合作的数据网络。
方法二：
- 通过Acemap总数据库的论文信息获得学者合作网络
- 再通过中美国家自然科学基金项目持有人，进行筛选，构建网络

课程结束可提交回你们构建此数据对应关系的数据集，提供自己的贡献（可以联系助教加鸡腿）。

中国国家自然科学基金合作者数据

由于数据格式奇葩，实验室图数据库维护，且不希望采用共享文本的方式进行分享。目前采取一个项目一行数据的存储方式，依旧在NSF_CN数据库中，cn_co进行维护，目前仍在实时导入，预计于4.30 晚上7点前后导入完全已经导入完全。

访问方式可以为

py , python import json def load_json(str): load_dict = json.load(str) projectAdmin = load_dict["projectAdminID"] ratifyNo = load_dict["ratifyNo"] participatantsList = load_dict["participants"]

数据格式

此外不建议按照字符串查询，as a network可以直接，dump下来进行json解析和相关的操作。

关于提交贡献

解决方案：

提交一个tar.gz文件包如data.tar.gz，里面包含三个文件，数据文件（可以是文件夹），导入数据库的代码（目前只支持py），并且还有建表信息以及一个README.md，这个文件夹很重要，里面需要说明三个问题：
代码的哪个位置用于修改数据库目的地
数据的量级
数据集的描述（如果能说明构建方式就更好了）

如果贡献有效且有意义，可以联系助教加鸡腿。