从主观交易到客观交易(5)—统计方法的实践[程序化老手]
统计分析由明确的程序构成,用以收集、分析与解释资料。如果技术分析真具备所相信功能,必须採用科学架构,运用正统的统计分析。用于检定交易策略是否有效的统计方法为「统计推论」。
在统计推理的计算过程,先假设所有技术分析指标不具预测功能(虚无假设),再用实际证据(历史测试的报酬率)否认虚无假设,并接受替代假设,以承认技术分析法具备预测能力。若技术分析法无预测功能,则在抽离趋势的资料中,期望报酬率应为0;但须注意的是,样本必须够大,若样本太小,报酬率也可能显著偏离0。统计学可以透过数学函数计算因机运而获利的机会有多少,若机运小到显著程度(例如5%),则接受为非机运结果。
若某技术分析法则的期望报酬为0或负数,则历史测试绩效应该相当接近0。但历史测试绩效并不显著等于0(甚至显著大于0),则可做出有效结论,「技术分析法则期望报酬率为0或负数的说法非常不可能成立」。
统计学通常以虚无假设成立的机率低于0.05,作为观察的统计显著性指标。但若使用资料探勘方法形成策略,可能产生资料探勘偏颇,则虚无假设的绩效门槛必须高很多,才可避免误判。此外,由于无法假定金融市场的动态结构是平稳的,在此考虑的技术分析法则不能发生在无限的未来期间。
统计推论的要素包括:母体、由母体随机抽样取得的样本、母体参数、样本统计量(样本可衡量的性质)、推论(根据样本统计量推估母体参数的方法)、有关推论的可靠陈述(包含不确定性,但考靠性可以衡量)。
统计推论的方法是对逻辑推论的假设,依据实证结果做出检定。
在方法的运用上,可以使用…
1.「单一母体平均数的统计检定」,用以检定特定交易策略的回测绩效是否显著不小于特定值(例如0或交易成本)
2.「单一母体平均数的比例检定」,用以检定特定交易策略的回测胜率是否显著不小于特定值(例如60%)
3.「单一母体平均数的比例检定」,用以检定特定交易策略的回测变异数(风险指标)是否显著不小于特定值(例如市场风险)
4.「成对母体平均数的统计检定」,用以检定两交易策略的回测绩效是否显著不相同
5.「成对母体平均数的比例检定」,用以检定两交易策略的回测胜率是否显著不相同
6.「成对母体平均数的比例检定」,用以检定两交易策略的回测变异数(风险指标)是否显著不相同
7.「单因子变异数分析母体平均数的比例检定」,用以检定单一变数(例如策略运用在不同类股),对于交易策略的回测结果的影响效果。
8.「双因子变异数分析母体平均数的比例检定」,用以检定两变数(例如策略运用在不同时期、不同期货商品),对于交易策略的回测结果的影响效果。
9.「区间估计」,用交易策略的回测结果(样本),估计该交易策略实际交易策略的可能报酬落点。
以下仅就「单一母体平均数的统计检定」说明运用。
首先,检定须在抽样之前,先对母体参数建立暂时性的假设,经资料收集后做统计分析,以判断是否拒绝该母体参数所做之假设。,母体参数包含平均数、比例、变异数。
对母体参数所做的暂时性假设,称为虚无假设(Null Hypothesis),以H0表之;另须建立一与H0互斥的假设,称为对立假设(Alternative Hypothesis),以H1表之。通常,对立假设才是研究者比较关心且想要得到的结论,假设检定的目的是希望能根据样本数据,推翻虚无假设,接受对立假设。
除非普查,否则透过样本作母体假设的检定,无法完全确认,可能出现两种错误,型1错误是「事实上虚无假设为真,却否决虚无假设」,此错误机率以Alpha表之,进行假设检定时,犯型1错误的最大机率称为显著水准(Level of Significance),通常取0.01、0.05或0.1。型1错误是统计检定所极欲避免的。型2错误是「事实上虚无假设为假,却接受虚无假设」,此错误机率以Beta表之。所谓「接受虚无假设」,比较严谨的说法应该是「目前没有足够证据推翻虚无假设」。
假设检定的型态依据拒绝区域的位置不同,分为单尾检定(One-tailed Test)与双尾检定(Two-tailed Test),单尾检定又可分为左尾检定与右尾检定。
对双尾检定来说,其拒绝区域平均分配在样本抽样分配的两侧(各佔0.5 Alpha)。
对单尾检定之左尾检定,其拒绝区域在样本抽样分配的左侧(佔Alpha)。
对单尾检定之右尾检定,其拒绝区域在样本抽样分配的右侧(佔Alpha)。
假设检定包含以下5步骤:
1.依据研究主题,对母体参数建立虚无假设与对立假设
2.选择检定统计式,针对样本的抽样分配,确定检定统计式
3.考量犯型1误差造成后果大小,与愿意承担风险,设定显著水准,并计算临界值。
4.依据样本数值代入检定统计式,计算检定统计量。
5.依据决策法则,比较检定统计量与临界值,做出检定结论。
所谓「决策法则」,判断方法如下…
1.若样本统计量落在接受区域,则「不拒绝」或「接受」虚无假设。
2.若样本统计量落在拒绝区域,则「拒绝」虚无假设,推论对立假设为真。
用于决定接受与拒绝区域的临界值,与样本平均、标准差(变异程度)、样本数以及显著水准等因素有关,均可直觉推论。
以上统计分析程序可以在Excel上实践。
有思路,想编写各种指标公式,程序化交易模型,选股公式,预警公式的朋友
可联系技术人员 QQ: 511411198 进行 有偿 编写!(不贵!点击查看价格!)
- 上一篇:小心追杀程序化交易策略
- 下一篇:没有了!
相关文章
-
没有相关内容