卓尔文档网 - www.qiying88.com 2024年05月16日 09:00 星期四
  • 热门搜索:
  • 当前位置 首页 >范文大全 > 公文范文 >

    国家自然科学基金大气科学学科二级申请代码下设研究方向与关键词解读:D0510,大气数据与信息技术

    来源:网友投稿 发布时间:2024-01-25 18:00:06

    黄小猛 郑飞 杨犇 穆斌 周勇 罗京佳

    1 清华大学地球系统科学系, 北京 100084

    2 中国科学院大气物理研究所, 北京 100029

    3 南京大学大气科学学院, 南京 210023

    4 同济大学软件学院, 上海 200092

    5 中国气象局气象发展与规划院, 北京 100081

    6 南京信息工程大学大气科学学院, 南京 210044

    2021 年以来,作为国家自然科学基金委员会(简称自然科学基金委)的改革试点,根据“源于知识体系逻辑结构、促进知识与应用融通、突出学科交叉融合”的原则,对接地球科学部倡议的“宜居地球”顶层战略,坚持“问题导向”,大气科学学科(简称大气学科)进行了资助布局改革。大气数据与信息技术研究是发展大气科学的重要“支撑技术”,为了促进科技创新、落实改革要求、优化学科布局,自然科学基金委对“D0510 大气数据与信息技术”(简称D0510)的研究方向及关键词进行了优化调整,重点提高了申请代码的包容性和覆盖面,强调“卡脖子”关键技术和潜在“颠覆性”引领技术的创新(刘哲等, 2020)。

    本文对新编D0510 研究方向及关键词进行解读,旨在帮助相关领域科研人员选报项目、开展合作,共同致力于大气数据与信息技术学科方向新技术新方法的研究,激励原始创新,拓展科学前沿,促进交叉融合,对接国家需求。

    近些年来,在卫星/雷达观测、超级计算、云计算和物联网等信息技术的推动下,大气数据呈现爆炸式增长,数据资源的内涵不断丰富、外延不断拓展,数据向精细化、体系化、集约化、智能化发展的趋势日益明显。2022 年4 月,国务院印发的《气象高质量发展纲要(2022~2035 年)》中提出“加强人工智能、大数据、量子计算与气象深度融合应用”,为大气学科未来发展指明了方向(国务院, 2022)。

    数据、算法和算力是大气数据与信息技术研究的三条主线。当前,数据研究的重点是如何提高数据资源的共享访问和服务能力,如欧洲中期天气预报中心(ECMWF)正在推动“数字孪生地球”建设,开发高精度地球数字模型,为用户提供高质量数据服务;
    美国国家海洋和大气管理局(NOAA)启动大数据项目(Big Data Project),与Amazon、Microsoft 和Google 等云服务提供商合作将关键数据存储在云中,无需进一步分发即可直接在数据上进行计算。算法的研究重点是如何开展人工智能技术在天气预报、气候预测、仿真研究和图像识别与处理等领域的应用,如NOAA 出台人工智能战略、ECMWF 加快开展“全工作流”人工智能应用等。算力的研究重点是如何提高各种类型计算设备和器件运行气象软件的效能。当前,国家大力推进高速泛在、天地一体、集成互联、安全高效的信息基础设施建设(新华社, 2021),缓解我国科学研究面临的数据和算力瓶颈,必将推动大气数据与信息技术迈向新高峰。

    大气数据与信息技术研究呈现五大趋势。一是学科交叉融合更加紧密。大气科学与信息技术、自然科学与社会科学为学科发展开创了新空间, 在科技创新和产业升级中的提效增能作用广受学术界和企业界认同(Faghmous and Kumar, 2014; Guo et al.,2016; Baumann et al., 2016; Ford et al., 2016; Bracco et al., 2018; Reichstein M et al., 2019; Ham et al.,2019)。二是知识与应用融通更加广泛。大数据、云计算和人工智能等技术,使大气数据在“生命安全、生产发展、生活富裕、生态良好”各领域应用不断推陈出新。三是支撑学科发展的资源更加丰富。国家“基建”将促进数据中心、超算中心等国家信息基础设施的建设,为大气学科发展提供更加丰富的计算、存储和数据资源。四是科技焦点更加清晰。人工智能已明显成为跨学科、跨领域的研究焦点,而且在今后若干年内还会保持这一态势(Hsu et al.,2014; Apte et al., 2017; Jiang et al., 2018)。五是潜在颠覆技术涌现。虽然还处于探索性研究阶段,但量子计算技术无疑会对大气科学带来巨大影响,需要积极开展前瞻性研究(Gourianov et al., 2022)。在当前日益复杂的国际背景下,提升大气数据与信息技术自主创新能力尤为重要,自然科学基金委对此给予了充分重视(国家自然科学基金委员会,2019a, 2019b; 刘哲等, 2021)。

    新型信息技术可对大气科学大数据进行更加集中和智能化地处理分析,通过这一过程发掘大气数据中的潜在信息,使得大气数据的处理更加科学化。一方面新型信息技术需要大量数据作为基础,另一方面大数据也需要新型信息技术和颠覆性技术进行数据价值化操作,两者相辅相成。而我国大气数据存在质量参差不齐、时空一致性较差、数据标签滞后、数据实时性不足等问题,利用大气数据和信息技术创新大气科学研究在数据、算法和算力方面依然面临严峻挑战。

    依据现阶段大气学科申请代码设置的“支撑技术”板块,D0510 作为其中的“数据技术”鼓励先进技术与方法的创新,服务于大气学科基础理论与技术的发展。该方向不仅包括传统的大气数据分析技术,更强调在大气数据处理分析中利用大数据和人工智能等新兴技术(郭华东等, 2014)。因此,如表1 所示,D0510 目前下设四个研究方向:多源数据融合与再分析、大气数据分析、人工智能与大气科学大数据、新型信息技术发展与应用。

    表1 大气数据与信息技术(申请代码D0510)研究方向及关键词Table 1 Research directions and keywords for D0510 atmospheric data and information technology

    3.1 研究方向结构框架

    在D0510 的四个研究方向中,多源数据融合与再分析研究方向主要侧重发展大气再分析资料和数据产品的核心技术与方法,支撑国产数据研制。大气数据分析研究方向包容传统方向,侧重基于现代统计学的手段和方法,用于对于不同时空尺度和多变量数据的分析。人工智能与大气科学大数据研究方向覆盖深度学习、因果推断等新兴技术,实现对大气科学大数据的深度挖掘。新型信息技术发展与应用研究方向侧重于突破关键技术,特别是具有“超前”意义的未来技术,在大气科学数据分析和预报中实现落地应用。D0510 主要引导广大科研人员开展学科交叉融合和原创性研究,形成具有中国自主知识产权的新型支撑技术和方法。

    3.2 研究方向1——多源数据融合与再分析

    D0510 下设的第一个研究方向“多源数据融合与再分析”主要是针对大气多源数据的有效整合和实际应用开展研究。依照来源和整合方法,该研究方向主要包括了大气多源数据、多源数据融合与反演、数据同化、和数据误差分析四方面的关键词。大气多源数据包含的关键词有基准气象数据、遥感数据产品和再分析资料三类,囊括针对这三类大气主要数据开展的研究;
    多源数据融合与反演包含的关键词有资料融合、数据反演、多维时空数据建模、降尺度和遥感反演,侧重于多源大气数据的融合方法和遥感等数据的反演方法;
    数据同化包含的关键词有最优插值、变分同化、卡尔曼滤波和集合同化,包含了目前大气数据同化领域主流的一些同化方法及其应用研究;
    数据误差分析则是针对以上三方面的研究内容,从质量控制、误差溯源和偏差订正角度来保证大气多源数据质量并开展相应的研究,同时针对大气数据的长期一致性和不确定性等开展均一化、不确定性分析以及相关的评估分析。多源数据融合与再分析将大气基础数据、融合与同化方法和误差分析等研究内容有机结合,各研究内容之间相辅相成,为D0510 其它三个研究方向提供基础的国产数据支撑。

    3.3 研究方向2——大气数据分析

    D0510 下设的第二个研究方向“大气数据分析”主要是基于现代统计学的手段和方法,对多圈层、多时空尺度和多变量大气科学数据进行分析,提高对天气—气候过程与机理的认知。依照分析对象和分析方法,该研究方向主要包括了大气科学的研究对象、关键科学问题、研究手段和方法三个方面。其中,研究对象包含气象灾害、气候变化、空气污染、强对流等关键词;
    关键科学问题包含多圈层相互作用、机理认知、可预报性、不确定性、时空异质性、能量收支等关键词;
    研究手段和方法包含统计建模、时间序列分析、相关性分析、贝叶斯网络、归因分析、参数优化等关键词。该方向鼓励利用传统统计学方法,譬如采用经验正交、奇异值分解等分析空间特征的统计方法,采用傅里叶变换、小波分析、功率谱分析等分析时间序列特征的手段,以及多元线性回归建模方法等,开展动力方法和统计方法的融合研究,促进对大气现象的机理、因果关系及其可预报性的分析研究。以上三个方面形成了大气数据分析的有机整体,既为第一个研究方向中的国产大气数据资料研制提供技术支撑,也为第三个研究方向中的人工智能方法创新提供基础平台和参考基线。

    3.4 研究方向3——人工智能与大气科学大数据

    D0510 下设的第三个研究方向“人工智能与大气科学大数据”主要依托先进技术与方法提升气象预报预测技巧。该研究方向主要包括了研究对象、手段和方法、关键科学问题三个方面。研究对象包含灾害天气、极端气候、台风、降水、短临预报、延伸期预报等关键词,力图完善集智能识别、智能同化、智能模式和智能预测于一体的智慧气象体系。手段与方法包含深度学习、机器学习、数据挖掘等关键词。智能模型依赖的深度神经网络目前的“黑箱”特性被广泛诟病,提升智能模型的可解释性与适用性成为亟需解决的关键科学问题。该方向鼓励从大数据之间的相关关系和因果推断出发,融合动力方程、守恒性、对称性、时空不变性等增强智能模型的可解释性和适用性。该方向以大气数据为支撑,服务于国产高分辨率数据资料的重建,拓展大气数据分析方法,促进新型信息技术的应用与发展。

    3.5 研究方向4——新型信息技术发展与应用

    D0510 下设的第四个研究方向“新型信息技术发展与应用”主要是引导新型支撑技术与大气学科的交叉融合,从一定程度上扩展大气学科的内涵。依照技术内涵和应用领域,该研究方向主要包括了计算方法、数据管理、颠覆性技术三个方面。计算方法包含云计算、边缘计算、边云协同等关键词,鼓励在模式发展中融通新型计算形态,提升模式计算性能;
    数据管理包含无人机遥感、区块链、物联网、5G 传输等关键词,倡导在数据采集、管理、应用、服务过程中运用新设备和新方法,丰富和完善大气实况数据及分析产品的展现形式,促进对大气科学数据的理解和价值发现;
    颠覆性技术包含量子计算、量子模拟等新型量子信息技术,这已经成为全球发达国家在科技领域关注的战略方向,规划布局和投资力度正在迅速加大。新型信息技术发展与应用研究方向涵盖了大气数据的采集、管理、计算、呈现的全过程,所取得的突破与创新将为其它三个研究方向提供新的研究方法与手段。该方向需要结合分支学科的基本理论和经验规律,吸收大数据和人工智能的科技进步红利,探索未来大气数据与信息技术在应用领域创新的各种可能。

    上文介绍了各研究方向并梳理了关键词的逻辑关系,为增进申请人对D0510 发展趋势和研究方向的理解,以下进一步地对近两年D0510 各方向关键词的基金申请和文献使用情况进行统计分析。

    自2021 年D0510 申请代码使用新的研究方向分类以来,每年面上项目、青年科学基金项目(简称青年基金)和地区科学基金项目(简称地区基金)的申请项目总数为60 余项(图略),其中面上项目与青年基金的申请项目数量相当,各为30 项左右,而每年地区基金申请数量仅为两项。四类科学问题属性申请项目中C 类(需求类)项目数量最多,所占比例接近所有项目总数的50%,高于D05 的平均占比40.3%(何建军等, 2021),D 类(交叉类)申请项目的所占比例仅次于C 类,达到了25%,远高于D05 申请代码7.4%的平均占比;
    B 类(前沿类)申请项目占比低于20%,与D05的平均占比47.9%有较大落差。A 类(原创类)申请项目占比最低,与D05 其它申请代码的整体申请情况类似。以上数据说明相比于D05 其它申请代码,D0510 申请代码申请项目更侧重于不同学科间的交叉。

    D0510 申请代码不同研究方向的申请项目数量之间有较大差别,近两年平均有59%的项目选择了“人工智能与大气科学大数据”研究方向,23%的项目选择了“多源数据融合与再分析”研究方向,15%的项目选择了“大气数据分析”研究方向,而选择“新型信息技术发展与应用”研究方向的项目占比仅为3%。

    图1 列出了2021~2022 年D0510 出现频次最高的十个关键词,排名第一的是深度学习,出现频次达到了48 次,即所有申请项目中有约40%选择了这一关键词。其次是机器学习、人工智能与资料融合,分别达到了28 次、21 次和21 次。十个高频关键词中八个与研究方法或数据相关,而降水和灾害天气是近年来的两个热点研究对象。

    图1 2021~2022 年D0510 申请代码十个热门关键词的出现频次Fig.1 Occurrence frequency of ten popular keywords under D0510 application code from 2021 to 2022

    进一步利用Web of Science 等文献计量学分析工具,对大气科学领域(Meteorology & Atmospheric Sciences)涉及D0510 申请代码关键词论文的发表情况进行了统计和分析(图2)。从图2a 可知,2021 年度“多源数据融合与再分析”研究方向中,数据误差分析方面的关键词质量控制、不确定性和评估的出现频次较高,均超过4000 次,其次是再分析资料和数据同化,均超过1000 次。降尺度、数据反演和偏差订正的出现频次也超过了500 次。

    “大气数据分析”研究方向中(图2b),不同关键词的出现频次存在明显差异。其中,属于研究对象的气候变化和空气污染这两个关键词出现频次均超过10000 次。方法类关键词中,排名前三的统计建模、相关性分析和时间序列分析出现频次均超过2000 次,而参数优化、归因分析和贝叶斯网络的出现频次为100 至300 多次不等。

    “人工智能与大气科学大数据”研究方向中(图2c)属于研究对象的降水、空气质量、极端气候等关键词的出现频次较高,例如降水的出现频次超过了15000 次。除此之外,多个方法类关键词的出现频次也超过300 次。其中,机器学习的出现频次最高,为1832 次,排名第二和第三的分别是人工智能的808 次和数据重建的801 次,而适用性和深度学习的出现频次也超过了600 次。相比较而言,智能预测、智能识别和智能同化这些研究目的较明确的关键词出现频次普遍不高。

    图2 2021 年度D0510 申请代码不同研究方向关键词大气科学领域论文在Web of Science 中的收录情况Fig.2 The collection situation of the papers of research directions and keywords under D0510 application codes of the atmospheric sciences in 2021

    “新型信息技术发展与应用”研究方向中(图2d),数据管理的出现频次远高于其它关键词。虽然很多关键词涉及到新型信息技术,但云计算、可视化、可视化建模和无人机遥感这些关键词的出现频次也达到了100 次以上。

    图3 总结了2001 年以来D0510 申请代码申请项目中十个高频关键词(图1)相关论文的逐3 年变化情况。可以看到(图3a),除了降水和质量控制,其余关键词在2010 年以前出现频次均较低,近几年才得到了快速增长,尤其是机器学习、人工智能和深度学习这三个关键词。其中,深度学习在近3 年的增长速度最快,展现了很好的发展趋势。

    在这20 年期间,中国学者论文的所占比例也发生了明显变化(图3b)。在2007 年以前,除了灾害天气和大数据,其余关键词中国学者论文占比大多维持在20%以下,而在2015 年之后,中国学者论文占比已基本超过20%。与其它关键词不同,中国学者灾害天气和大数据相关论文的占比从2001 年开始出现了先上升后下降的趋势,占比峰值出现在2011 年前后。此外,可以发现,自深度学习2016 年在全球范围内流行以来(图3a),中国学者在这一方面的论文占比就超过了20%(图3b),说明中国学者在一些新兴技术领域不存在起步晚的劣势。

    图3 2001~2021 年D0510 申请项目中十个高频关键词相关论文Web of Science 收录情况的逐3 年变化:(a)收录数量(单位:a-1;
    2010 年后与关键词降水相关的论文数量超过6000 篇/年);
    (b)中国学者论文所占比例Fig.3 Three-year variations of the collection situation of papers related to ten popular keywords under D0510 application code in “Web of Science”database from 2001 to 2021: (a) Number of collections (units: a-1; number of papers related to the keyword “precipitation” exceeds 6000 a-1);(b) proportion of Chinese scholars’ papers

    从2021~2022 年D0510 的研究方向和关键词申请情况统计结果来看,目前针对D0510 学科的申请存在总量偏少、原创类申请项目占比较低、关键词使用集中于热门方向、少数关键词使用率偏低、前沿类申请稀缺等问题。在D0510 中选择合适的研究方向和关键词,需要先厘清所申请的研究方向是属于“分支学科”“支撑技术”还是“发展领域”,并且深入理解大气学科“支撑技术”板块中设置D0510 申请代码的初衷。特别需要明确的是,纯技术应用类研究并不适合填报D0510 申请代码,而应从“分支学科”或“发展领域”中选择对应的申请代码(刘哲等, 2020)。

    在研究方向的选择上,根据近两年项目申请情况来看,申请人容易混淆“支撑技术”中的D0510 大气数据与信息技术和“发展领域”中的D0515 应用气象学这两类申请代码,同时在方法上与D0509 大气观测、遥感和探测技术与方法上有所重叠,造成难于选择。D0510 鼓励大气科学家和具有数据与信息背景的技术人才深度合作,突破大气科学基础研究中的“卡脖子”问题和“颠覆性”技术,实现大气学科基础理论和研究手段的创新。D0510 侧重于数据与信息与大气科学的交叉,而D0509 侧重观测、遥感和探测,D0515 侧重应用研究与基础研究的融合,申请人应结合研究主题进行针对性的选择。

    在关键词的选择上,申请人应当特别注意粗粒度与细粒度关键词结合使用,选择过粗会造成评审专家匹配范围太广,而选择过细会造成满足条件的评审专家太少,需要保证关键词粗细适度以提升智能辅助匹配系统的效率。当前,D0510 中关键词使用集中于深度学习、机器学习、人工智能等热门方向以及降水、灾害天气等焦点领域,意味着这些领域竞争激烈,建议申请人避开红海,积极探索新的交叉融合问题。

    综上,合适的研究方向和关键词选择将有利于对项目进行精准评估,使得人工智能系统能够精确匹配到相应的评审专家,确保科学基金申请书函评和会评的公平公正性,辅助学科整体情况的分析决策,从而对项目进行更加合理的定位与分类,提高项目的评审效率,强化资助的合理性与导向性(郑钧正, 2013)。

    在大气学科申请代码调整的大背景下,“申请代码和关键词”战略研究工作组对D0510 申请代码不断进行梳理和调整。自2019 年11 月以来,依托各类学术年会和战略研讨会,通过“自上而下”与“自下而上”开展论证,形成了D0510 从“二级学科申请代码”到“研究方向”再到“关键词”的完整链条,对于传统方向的包容性和新兴技术的覆盖性均得以提高,对于“卡脖子”和“颠覆性”技术的重视程度也得到加强。

    近3 年申报D0510 的项目质量稳步上升,D0510 在引导支撑技术服务大气学科方面激励了技术人才与大气科学家开展深度合作,培养了更多高质量的复合型创新人才。但D0510 也仍然存在一些问题亟待改进,如:少数关键词重叠、使用频率不高、各研究方向关键词分布不均,以及对申请代码调整改革的目的和趋势宣传介绍不够,导致部分申请人对研究方向和关键词认识不足。今后,还需持续跟踪国际前沿动态,广泛听取大气科学和相关交叉学科专家意见,不断修订完善并加强宣教,扩大D0510 影响力,以充分发挥科学基金对大气科学技术创新的引领作用。

    致谢衷心感谢国家自然科学基金委员会“申请代码和关键词”战略研究工作组D0510 小组的朱江、龚威、杨广文、邓科峰、付遵涛、耿冠楠、李庆祥、刘青山、王亚强、武炳义、徐喆、张宁参加研讨,特别感谢清华大学的向妍霏和李佳皓,本文的研究成果离不开他们大量细致的调研和数据统计分析工作。本次申请代码调整工作自始至终都得到了国家自然科学基金委员会分管委领导、地球科学部领导一如既往的关心和悉心指导,作者在此一并表示诚挚的感谢!

    猜你喜欢代码大气方向2022年组稿方向计算机应用(2022年2期)2022-03-01宏伟大气,气势与细腻兼备 Vivid Audio Giya G3 S2家庭影院技术(2021年8期)2021-11-022021年组稿方向计算机应用(2021年4期)2021-04-202021年组稿方向计算机应用(2021年1期)2021-01-21创世代码动漫星空(2018年11期)2018-10-26创世代码动漫星空(2018年2期)2018-10-26创世代码动漫星空(2018年9期)2018-10-26创世代码动漫星空(2018年5期)2018-10-26大气古朴挥洒自如河北书画研究(2016年2期)2016-08-24大气、水之后,土十条来了新农业(2016年18期)2016-08-16

    推荐访问:大气 信息技术 下设

    Top