小样本下日内风险计量指标的贝叶斯算法

更新时间:2023-03-20 04:04:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

小样本下日内风险计量指标的贝叶斯算法

高全胜

(武汉工业学院数理系,武汉430023)

摘要:目前对大样本下计算各类风险计量指标有各种不同的方法,但在小样本下尤其是超低

小样本下计算各类风险计量指标的研究比较少。文章研究了利用推广的贝叶斯方法来计算基于日内

5分钟分笔数据下的风险价值VaR和条件风险价值CVaR的方法。该方法计算简单,所需要的数据

量少,而且具有一定的稳健性。

关键词:小样本;贝叶斯方法;VaR;CVaR中图分类号:F830.91

文献标识码:A

文章编号:1002-6487(2008)24-0027-02

果要估计日内交易的风险计量指标值,则只需要前几天的样本数据。

假设损失分布的某个参数θ=(μ,σ)的先验分布为f(θ),后验分布为g(θ)。

将某一天(或某一个星期)的损失数据分布

(4)

的参数值分为K段,每段为(θi,θi+△θ),则根据贝叶斯公式有:

对于诸如风险价值(Value-at-Risk,VaR)和条件风险价值(ConditionalValue-at-Risk,CVaR)之类的金融风险计量指标,许多专家学者提供了众多的计算方法,但这些方法大多以基于大样本数据为前提,对于小样本下各种风险计量指标的计算问题则研究得比较少。本文将研究小样本下股票交易的日内风险的计算问题,采用的方法是一种推广贝叶斯方法,该方法的主要优点是所使用的数据量少,只需要少量的日内交易数据;同时计算原理与方法简单,并且可以给出相关风险计量指标的置信区间。

g(θi)△θ=KP(E/θ)f(θ)△θ

i

i

j=1

ΣP(E|θ)f(θ)△θ

其中P(E|θi)=P(E/θi<θ≤θi+△θ)是参数落在区间(θI,θI+△θ)上的概率,E表示该时间内的损失值。直接利用上述表达式很难得到具体的解析表达式,一般要假设损失分布的先验分布与后验分布一致,于是参数后验分布的均值与标准差可以近似由下面的表达式进行计算:

軈軈軈軈軈軈軈軈軈軈軈軈軈軈軈軈軈軈軈

11.1

计算方法与原理

两个风险计量指标

假设某资产或投资组合的损失用随机变量X表示,其累

积分布函数为F(x),则给定置信水平α,风险价值VaR的定义为:

μθ=ΣθIg(θi)△θ=j

j=1

K

軈△θΣP(E/θ)f(θ)θ

i

i

i

K

i

VaRα(X)=inf{x:F(x)≥α}

如果是连续分布,则VaRα(X)是收益率分布的分位数,即有VaRα(X)=F-1(α)。条件风险价值CVaR为:

(2)CVaRα(X)=E[X:X≥VaRα(X)]

设Φ(x),φ(x)分别是标准正态分布的概率分布函数和概率密度函数,如果假设投资组合或资产的损失X的分布为正态分布N(μ,σ2),其中μ和σ分别为损失的均值和标准差,则

通过计算有:

(1)

j=1

K2θ

ΣP(E/θ)f(θ)△θ

i

i

=1K

i

(5)

σ=Σ(θi-μθ)2f(θi)△θ

j=1

其中i(θi,θi+△θ)上参数的中值。

22.1

实证分析与检验

计算估计参数的先验分布

假设我们仅知道上证指数一周五天的收益率数据,现在

VaRα(X)=-xασ+μ(其中xα=Φ-1(1-α))

α

CVaRα(X)=φ(x)σ+μ

用推广贝叶斯方法估计分布参数

(3)

要根据这五个数据来估计市场指数的风险价值量。

在计算时,首先需要计算均值与方差的先验分布的参数,假设均值与方差都服从正态分布(也可以采用其他分布,但使用正态分布可以很容易对两个风险计量指标给出其区间估计)。计算先验分布的参数的数据是上证指数从2006年

1.2

在小样本下,我们用推广的贝叶斯方法来估计上述风险计量指标。推广的贝叶斯方法是根据贝叶斯统计理论经过简化和引申得到的,是一个利用已知的先验信息对现有参数的估计值进行再调整的方法,计算简单,使用样本少,一旦先验信息已知,可以多次重复使用。进行估计时,需要知道过去一段时间的损失数据或这些损失数据的一些样本数字特征。如

11月30日到2007年11月9日的每5分钟高频价格涨跌

幅度数据(即投资的收益或损失数据),经过计算,其中均值指标μ的均值与方差为-0.0018、0.058,方差指标σ的均值与方差为0.2891、0.0958,即均值与方差的先验密度函数为:

基金项目:湖北省教育厅人文社会科学研究规划资助项目(2007q030)

统计与决策2008年第24期(总第276期)

27

φ(μ)=

10.058姨exp{-(μ+0.0018)2

2

}φ(σ)=10.0958姨exp{-(σ-0.2891)2

}

2.2计算估计参数的后验分布

现在采用2007年11月12到2007年11月16日共5

天的上证指数的涨跌幅度数据来估计参数的后验分布参数,进而估计风险计量指标值。其中的收益率数据均值为-

0.0423、-0.0225、0.1015、-0.0171、0.0226,方差为0.5545、

0.3560、0.3620、0.2789、0.3192。由于数据量比较少,所以采用

上述推广的贝叶斯方法来估计均值与方差的后验分布的参数。在估计时,首先需要对数据进行分组,分组的基本原则是分段数一般不超过数据数,这样可以减少分段误差,同时每个分段区间都有数据并且要让数据居于分段区间的中间。计算结果与过程如表1和表2所示。

表1后验分布的均值估计

区号

数据分段实际数据

AB1(-0.0522,-0.0324)-0.04230.0187-0.00082(-0.0324,-0.0198)-0.02250.0151-0.00033(-0.0198,0.0027)-0.01710.0296-0.00054(0.0027,0.0621)0.02260.08130.00185

(0.0621,0.1410)

0.10150.0592

0.0010结果均值

0.0305

方差

0.0026

注:表中A=P(E/θi)f(θi)△θi,B=P(E/θi)f(θi)iθi表2后验分布的方差估计

区号

数据分段实际数据

AB1(0.2587,0.2990)0.27890.03190.00892(0.2990,0.3376)0.31920.03190.01023(0.3376,0.3590)0.35600.01570.00564(0.3590,0.4582)0.36200.06330.02295

(0.4582,0.6507)

0.55450.0337

0.0187注:表中A=P(E/θi)f(θi)△θi,B=P(E/θi)f(θi)iθi

于是均值与方差的后验密度函数为:

φ'(μ)=10.0026姨exp{-(μ+0.0305)2

}

φ'(σ)=1exp{-(σ-0.3755)2

0.0006姨2}

2.3

计算风险计量指标的点估计与区间估计

当收益率的均值与方差知道后就可以根据前面的风险计量指标公式来计算这些指标,由于已经知道后验密度,因此还可以给出估计值的置信区间,计算结果如表3所示,括号中的数据是水平为95%的置信区间。

作为对比,还给出了直接利用历史模拟法给出的结果。假设股票的收益率序列为x1,x2,…,xn,该收益率序列从小到大按升序排列为x(1),x(2)…,x(n),于是VaR就是该系列的α分位数。同时,利用C.Acerbi和D.Tasche的结果[6],下面的等式以概率1成立:

[np]

(i)

CVaRα(X)=-lim

jΣx

=1

n→∞

(6)

其中[x]表示不超过x的最大整数,当n很大时可以用等式右边部分近似计算CVaR。从两种计算结果可以看出,对VaR的估计两者差异并不大,历史模拟法给出的结果要小一

28

统计与决策2008年第24期(总第276期)

些,但这种细小差异可以忽略。两种方法的计算结果的差异主要体现在CVaR的估计上,本文给出小样本方法的结果要小一些,随着置信水平的提高差异越大,其原因可能在于我们假设日内损失数据是正态分布的,其尾部要比实际带有极端值的数据要细,从而低估实际风险值。

表3

风险计量指标的估计与检验结果

置信水平

90%95%99%VaR

-0.4507-0.5871-0.8430上限(-0.445,(-0.5829,-(-0.837,下限

-0.455)0.591)-0.847)CVaR

-0.6285-0.7440-0.9703上限(-0.624,(-0.7398,(-0.966,下限

-0.633)-0.748)-0.975)HV-0.41-0.57-0.81HC-0.6433-0.8133-1.1325检验LR

2.67

2.44

2.55

注:HV、HC分别表示历史模拟法计算的VaR和CVaR。

2.4

对计算结果的检验

利用Kupiec给出的一种二项检验方法进行检验VaR

估计的效果[7]。该方法把投资的实际损失率超过测定VaR值的例外情形视为从一个二项分布中出现的独立事件,假定实际考察天数为T,失败天数为N,则失败频率为p=N/T,设失败的期望概率为q。这样对VaR模型准确性的评估就转化为检验失败频率p是否显著不同于q,其似然比率检验为:LR=-2[(T-N)ln(1-p)+Nlnp+2[(T-N)ln(1-q)+Nlnq]

(7)在零假设条件下,统计量LR服从自由度为1的卡方分布(它的95%置信区间临界值为3.84)。对不同水平的检验结果见表3最后一行。从检验结果可以知道都没有解决零假设,即本文提出的小样本下的贝叶斯方法是有效的。

3结论

从上述分析可以看出,推广的贝叶斯方法来计算小样本

下的风险计量指标,操作简单,计算原理也不复杂,不需要开

发那些复杂的数学模型,即使在模型的设定有一定差异的情况下,估计结果也比较良好,具有一定的稳健性。

参考文献:

[1]贺思辉,王茂.小样本下的金融风险测度的技术研究[J].数理统计与管理,2006,(3).

[2]王春峰,李汶华.小样本数据信用风险评估研究[J].管理科学学报,2001,(2).

[3]王乃生,茆诗松.Bayes风险值[J].数量经济技术经济研究,2004,(3).

[4]郭卫娟.基于贝叶斯方法的风险价值VaR的计算[J].湖北教育学院学报,2007,(2).

[5]张文广,刘令瑶.确定随机变量概率分布参数的推广Bayes法[J].岩土工程学报,1995,(5).

[6]Acerbi,C.,D.Tasche.OntheCoherenceofExpectedShortfall[J].

JournalofBankingandFinance,2002,27(6).

[7]Kupiec,PaulH.TechniquesforVerifyingtheAccuracyofRiskMeasurementModels[J].JournalofDerivatives,1995,3(2).

(责任编辑/亦民)

本文来源:https://www.bwwdw.com/article/dr81.html

Top