基于站点实测风速的中国台风大风重现期估计-期刊天空网手机端

　　摘要: 首先基于 1951 - 2014 年中国地面气象站点历史风速观测数据和 CMA - STI 热带气旋最佳路径数据集，提取了站点历史台风过程影响风速; 其次，利用极大似然法估计 Gumbel 分布、Frechet 分布以及 Weibull 3 种分布模型参数，优选出最适模型进行站点极值风速年最大值风速拟合，计算不同重现期风速值并利用 bootstrap 方法对各重现期计算结果的不确定性进行量化，得到典型重现期下中国台风大风风速的 90% 置信区间; 最后，根据包括克里金法、反距离权重法、自然邻域法、最近邻法在内的 4 种空间插值方法对于台风大风的插值效果得到中国东部沿海 1km 网格不同重现期台风风速分布及其 90% 置信区间。结果表明: 东南沿海地区是台风极值大风影响最严重的区域，典型重现期台风风速估计的不确定性较大，不确定性的高值区域也主要分布在东南沿海地区。

基于站点实测风速的中国台风大风重现期估计

　　关键词: 台风大风; 极值分布; 危险性评估; 不确定性量化; 空间插值

　　中国是遭受台风灾害最严重的国家之一，常因台风造成严重的人员伤亡和巨大的经济损失。例如，2006 年第 8 号台风“桑美”在浙江省苍南县登陆，引起了狂风巨浪，共造成 483 人死亡，千余条船沉没，直接经济损失达 196. 5 亿元人民币[1]， 2014 年 10 号台风“威马逊”登陆风速达到 17 级，造成海南省 216 个乡镇( 街道) 受灾，受灾人口 325. 8 万人，直接经济损失 108. 28 亿元[2]。近年来我国沿海台风易发区经济快速发展，对于台风致灾因子的暴露程度不断增加; 而沿海桥梁、铁路、石油石化以及核电站等重大工程的选址及设计需要对局地风速进行评估。因此，面向台风灾害风险管理及工程设计需求，采取有效手段对中国台风大风危险性进行评估具有重要意义。

　　目前学界对于台风大风危险性评估方法主要有三类，其中第一类一般通过极值分布模型对历史台风风速序列进行模拟从而计算单点的风速重现期; 第二类通常针对某个区域，通过统计该区域历史台风参数概率分布，并结合风场模型和极值分布模型计算该小区域的风速重现期[3]; 第三类一般采用全路径模拟的方法生成大样本台风随机事件，然后结合风场模型和极值分布模型计算台风影响区域的风速重现期[3]。与第二类和第三类方法相比，第一类方法在历史风速观测时间序列较长时，可充分利用历史样本信息得到较为准确的风速重现期计算结果，其缺点在于当历史数据不足时，重现期计算结果存在一定不确定性。国外利用第一种方法即历史观测数据进行台风大风危险性评估采用的数据类型主要包括台风近中心历史风速观测数据及气象站点历史风速观测数据两类。一些学者利用台风近中心历史风速观测数据采用韦伯分布( Weibull Distribution) 、广义帕累托分布( General Pareto Distribution，GPD) 等极值分布函数对美国区域最大风速进行拟合，并计算了一定空间尺度的年发生超越概率[4，5]，此类方法可以满足台风综合危险性评估需要，但其不足之处在于台风近中心历史风速数据无法反映整个区域的空间差异性，因此不适宜用于大区域范围台风灾害危险性评估; 另外一些学者采用气象站点历史风速观测数据，同样利用极值模型对强风危险性进行评估[3]，此类方法可以较好地反应风速分布的空间差异性，缺点在于气象站点历史风速观测数据往往存在数据量不足的问题。

　　中国大风危险性研究多是针对小区域或台站进行的不同分布模型对比研究或大风重现期推算实证研究[6 - 9]，如综合岛屿站观测、台风记录、船舶报告以及数值模式计算风速，组成大风年最大值序列，利用矩估计法拟合大风序列，通过检验选定最适风速序列及分布模型，绘制中国近海 50 年一遇和 100 年一遇大风极值等值线[10]，此类研究的缺点在于面向区域较小，且缺少对评估结果不确定性的讨论。利用气象站点历史风速观测数据计算重现期，数据不足、数据一致性问题、测量误差是结果不确定性的 3 个最主要来源。为了提高结果可靠性，需要对不确定性进行量化，目前国内已有研究采用广义极值分布模型，利用极大似然法及渐进分布理论推导出不同年遇水平设计风速和一定置信度下的置信区间，并通过气象站点年最大风速资料进行实证研究[11]，该研究对单个站点重现期计算结果的不确定性进行了刻画，对于工程的选址设计具有一定意义，而为了反映整个中国东部沿海台风大风危险性分布特征及不确定性大小，还需对站点计算结果进行插值，从而得到整个空间连续的重现期评估结果。

　　本文的研究目标为利用气象站点历史风速观测资料，评估不同重现期下中国东部台风风速空间分布并给出一定置信度下的风速置信区间。具体过程为，首先，基于中国地面气象站点历史风速观测数据，提取每个站点历史台风过程影响风速的年最大值; 其次，针对每个站点利用极大似然法估计 3 种经典极值分布模型的参数估计值，分别选择最适模型进行站点台风年最大值风速拟合; 然后，利用 bootstrap 重采样方法，得到 90% 置信度下的的风速置信区间; 最后，从 4 种空间插值方法中选择最优者插值得到不同重现期及 90% 置信度下的中国台风大风空间分布并对中国台风大风危险性区域分布及不确定性特征进行分析。

　　1 数据

　　1. 1 地面气象站点观测数据及研究区

　　本文采用的风速资料来自中国 756 个一般气象观测站 1951 - 2014 年日值风速观测值，指标为日极大风速( 3 s 瞬时风速的日最大值) 。由于中国东部沿海地区是受台风影响的主要地区，因此选取中国东部、中部、南部 13 个省、直辖市、自治区作为本文的研究区，考虑到研究区边缘插值风速的准确性及连续性，故保留中国东部、中部、南部 21 个省、直辖市、自治区的 359 个一般气象观测站的气象观测数据，359 个一般气象观测站站点空间分布如图 1 所示。

　　1. 2 台风路径数据

　　本文采用中国气象局上海台风研究所( CMA - STI) 整编的西北太平洋热带气旋最佳路径数据[12]，包括 1949 - 2014 年共 2182 场台风，其中登陆中国台风共计 611 场。数据具体指标包括: 国际热带气旋编号、中国热带气旋编号、英文名称、每个台风路径点的年、月、日、时、等级、经度、纬度、近中心最低气压以及最大持续风速等，记录时间间隔为 6 h。

　　2 方法

　　2. 1 风速提取

　　台风大风重现期计算的前提是提取每个气象站点受台风影响风速，其提取方法简述如下: ①基于站点经纬度信息，提取一定空间范围内历史台风的路径点; ②获得历史台风对该站点影响的起止时间，并提取该时间范围对应的站点观测风速，作为历史台风对该站点的影响风速。这种方法的关键在于台风影响范围的界定，由于台风是由比较均匀的热带海洋气团发展起来，因此台风气压场、风场分布具有一定的对称性，可近似将台风看作圆对称的涡旋，其半径变化范围小到上百公里，大到上千公里[13]。可基于台风中心位置，经验地设定台风影响半径从而划定影响范围。若半径设定太小，则无法获取台风外围大风信息，可能导致获取的格点风速样本不足; 若半径设定过大，虽可获得完整的台风大风序列，但可能将其他天气系统引起的局地大风误认为台风大风[14]，在本研究中，经验性地将台风影响范围设定为距台风中心 500 km。

　　利用上述气象站点台风影响风速提取方法，对 359 个气象站点的历史台风影响风速进行提取，对部分历史样本小于 15 个的站点予以剔除，最终得到风速数据提取结果。图 2 为站点历史台风过程影响风速最大值统计图，从图中可以看出，台风风速样本数超过 15 个的站点共有 275 个，且空间分布相对较广泛，其最大值出现在浙江大陈岛站，为 59. 5 m / s，站点台风风速高值区主要分布在东南沿海地区，部分内陆地区也出现了风速高值，如山东泰山站及安徽黄山站，体现了地形对于风速的影响作用。

　　2. 2 风速空间插值空间插值

　　方法主要包括点插值和面插值两种，已知某点数据推求空间区域内任一点数值应采用点插值方法进行插值[15]，点插值方法又包括了克里金法、多项式回归法、最近邻法、反距离权重法等。为确定最适用中国东部台风大风风速插值的方法，以 2. 1 中得到的站点历史台风风速最大值作为检验样本，选用克里金法、反距离权重法、自然邻域法以及最近邻法 4 种点插值方法对站点风速进行空间插值，然后通过交叉验证法确定最适插值方法。各插值模型主要参数设置如下: 最大搜索半径设为 500 km，搜索范围内的最小样本数设为 15，其中反距离权重法采用固定搜索半径，幂参数设为 3，克里金插值法的半变异函数采用指数模型。

　　2. 3 极值大风重现期估计及不确定性量化

　　气候统计学中，通常采用经典极值理论对气象要素极值进行拟合[16]，经典极值理论包括 Gumbel 模型，Frechet 模型以及 Weibull 模型 3 种，其累积概率分布函数分别如式( 3) ～式( 5) 所示，其中 μ 为位置参数，σ 为尺度参数，α 为形状参数，x 为连续型随机变量，超过定值 x 则表示极端事件发生。根据历史样本年最大值分布计算极端事件的重现期( Return Period，RP) 是极值统计最重要的应用之一，由式( 6) 可知每一个重现期对应一个极值分位数，表示极端事件的极值变量的数值大小。同时，对于给定重现期，极值分位数越大说明超越概率越小，则极端事件发生的可能性也就越小。

　　3 结果

　　对 359 个气象站点，利用 2. 3 中的站点大风重现期估计方法，提取台风影响期间站点风速的年最大值作为极值拟合的样本，利用 Gumbel、 Frechet 以及 Weibull 函数进行拟合。计算过程中，为了减小因数据量不足导致的参数估计的不确定性及满足极值分布函数对拟合样本数量的要求，对极值拟合样本数少于 15 个的站点予以剔除，最终得到台风极大风速数据达标站点及其对应的最适极值分布( 如图 4 所示) 。可以看出: ① 359 个站点中共计 133 个站点满足拟合样本数量需求，最适极值分布确定为 Gumbel、Frechet 以及 Weibull 的站点个数分别为 60 个，27 个以及 46 个，即对于不同站点的风速极值，应采用不同极值分布函数进行拟合; ② 359 个站点中位于研究区外符合样本数量要求的站点较少，这是因为这些区域的站点受台风影响频次较少，影响时长较短; ③ 359 个站点中位于研究区内江西省、福建省的站点满足拟合样本数量要求的数量偏少，江西 18 个站点中仅 3 个站点满足要求，福建省 22 个站点中仅 5 个站点满足要求，造成这一结果的主要原因是尽管此区域台风影响频次较多，影响时间较长，但未达标站点历史台风观测数据较少。

　　推荐阅读：影响海南岛台风的时空特征分析

　　利用各达标站点最适极值分布模型，分别计算各站点 20 年一遇及 50 年一遇的台风风速期望值及 90% 置信区间; 然后，利用克里金法插值得到中国 1 km 网格分辨率的 20 年一遇及 50 年一遇重现期风速期望值及 90% 置信区间，计算结果如图 5 所示。从图 5 可以看出: ① 台风极值大风高值区主要分布在我国东部地区，尤其是东南沿海地区，该区域是我国历史上受台风灾害影响最严重的地区，发生台风大风极端事件的可能性也最大; ② 部分内陆地区也出现了风速高值区，主要原因是由于历史台风影响的观测风速样本不足; ③ 典型重现期台风风速估计的不确定性较大，20 年一遇的台风风速 90% 置信区间约 49 m / s，50 年一遇的台风风速 90% 置信区间近 61 m / s，置信区间的高值区主要分布在中国东南沿海，置信区间整体由东南沿海向内陆递减。

　　4 结论与讨论

　　本文基于中国地面气象站点历史风速观测数据，提取了每个站点历史台风过程影响风速，在此基础上优选出最适极值分布以及空间插值模型，计算了不同重现期下，中国东部地区空间上连续分布的台风风速及 90% 置信度下的风速区间，并对其区域分布特征及不确定性进行了分析。主要结论如下:

　　( 1) 采用交叉检验的方法比较了 4 种空间插值方法对于站点极大风速的插值总误差，结果表明，对于站点台风极大风速插值，克里金法插值效果最优。

　　( 2) 由于历史样本数量不足、数据一致性问题及测量误差等原因，基于站点历史风速观测数据的台风大风重现期估计结果不确定性较大，为了保证评估结果的可靠性，需要对其进行不确定性量化。

　　( 3) 结合极值分布模型以及空间插值方法评估中国台风大风危险性，相较于传统小区域或台站尺度的评估有一定改进，但仍存在一些局限性，包括: ① 气象站点历史风速观测样本不足可能影响极值风速评估精度及区域插值效果; ② 本文经验地将台风影响范围确定为 500 公里，主观性较强，今后的研究可通过敏感性分析方法对台风影响最适范围进行评估[14]; ③ 由于台风登陆后下垫面情况比较复杂，局地地形以及地表粗糙度的变化对于近地表风速影响较大，仅依靠空间插值的方法难以精确刻画该影响机制。后续的台风大风危险性研究可基于大样本台风路径事件集，结合台风风场模型得到空间上连续分布并且样本充足的台风风速序列[7 - 9]，在此基础上进行不同重现期极值风速评估将更具可靠性[19]。