一 引入
如今,全球大多数股票和衍生品交易所都是订单驱动市场。在这样的市场里,交易者使用市价订单和限价订单进行交易。在限价订单市场中,交易者通过提交限价订单或市场订单来进行证券交易。如果执行限价订单,可以为交易者提供比市场订单更好的价格,但存在失去执行机会的隐含风险。而市场订单立即按照限价订单簿中的最佳报价进行交易。对于大多数市场参与者来说,在限价订单和市场订单之间进行选择是很重要的。例如,高频交易者可以机会主义地通过限价订单提供流动性,或者通过市场订单消费流动性,大量混合策略实际上依赖于两种订单类型形成的需求计划。因此,限价订单执行概率的变化模式起着重要作用。本文基于近几年的文献对限价订单成交概率的估计和影响因素进行总结。
二 影响成交概率的因素
为了更好地估计和研究成交概率,需要研究其影响因素。成交概率的大小和变化是由当时市场的状态空间和未来的订单流所决定的。具体来说,它的影响因素有很多,包括限价单的委托价格、当前订单薄的买卖价差,订单队列长度、订单到达速率、成交时间、最小报价单位、新来指令的积极性等。
2.1 订单成交概率和订单队列长度
ZHANG Qiang(2019)提出了一个可计算的限价订单市场执行概率模型,直观地描述了执行概率的变化规律,探讨了买卖队列长度对执行概率的共同影响。并且引入限价订单的累计概率作为衡量市场深度的一个重要指标,以描述形成过程,从而为订单安排决策的结构带来新的见解。作者用 来表示买入队列中第k个限价单的成交概率,而 则表示卖出队列中第k个限价单的成交概率,其中t是一天中剩下的时间段数量,i和j分别表示买卖队列的长度。假设交易者是耐心的,在每个时间段限价买单到达的概率为 ,限价卖单到达的概率为 ,所以可以得到以下递归方程:
通过这个递归方程可以得到,对于限价买单成交概率,有以下不等式:
首先(i)是本质区别于(iv)的,令(iv)中的k = i,则含义为当买单队列越长,最新提交的限价买单的成交概率越小;而(i)的含义为同一笔限价买单的成交概率会随着买单队列的长度增加而减少。同样的,(iii)本质区别于(v),令(v)中的k = i,则含义为当两方队列都增加同样的量时,新提交的限价买单的成交概率会低于之前的最新限价买单;(iii)则说明在该情况下之前提交的限价买单的成交概率会变低。相应的结论同样适用于限价卖单。(iii)和(viii)表示了两方队列对于成交概率的协同效应。
作者通过固定参数模拟了在队列中不同位置的成交概率,如下方图表所示。表1给出了成交概率关于k的单变量函数,从表中可以得出和是关于k的单调递减函数。交易者在最优策略中通常更关注成交概率减小的速度,所以需要定量分析。图1展现了成交概率关于限价买单递减的速度,成交概率减小的速度最初很慢,后来加速减小,然后又再次缓慢减小。
表1 限价单成交概率关于k的函数值
图1 限价卖单的成交概率关于k的函数
成交概率会根据当前限价订单薄的状态的不同而不同。作者固定了t和k来探索成交概率关于i和j的变化规律。表2展现了成交概率随着j的增加而增大,随着i的增加而减小。图2直观地展示了成交概率的这一变化规律。
表2 限价买单成交概率关于(i,j)的函数值
图2 限价买单成交概率关于(i,j)的函数值
作者还研究了累计成交概率,也就是队列长度确定时每一个在队列中订单的成交概率之和。表3对角线上的值是边际限价卖单成交概率,随着卖方队列的增加最新限价卖单的成交概率从0.48783减小到0.000499。表3的最后一行是累计成交概率的值,累计成交概率的值随着限价卖单队列长度(j)从31增加到34而增大,后来随着j=34到j=36而减小,在j=37时增大,最后在j=37之后减小。这个结果表明这里的累计成交概率函数有一个极值,如果累计成交概率在允许多单位交易的模型中也符合这样的规律,我们就可以得出结论:交易者的回报取决于限价指令簿的状态,而不仅仅取决于提交的交易量。
表3 限价卖单成交概率关于(k,j)的函数值
图3 限价卖单累计成交概率关于卖单队列长度的变化
2.2 订单成交概率和买卖价差
大量的实证研究表明新来的买、卖指令流一般都分别集中在限价指令簿上当前最高买价、最低卖价的附近,而不会偏离太远。因此,刘波(2009)假设新来买卖指令的价格与当前最高买价、最低卖价的距离分别为 和 ,且 , ,于是有:
其中 和 分别表示新来卖、买订单的价格, 和 分别表示当前最低卖价和最高买价。现实交易机制中对最小报价单位的要求,将使得限价指令簿上相邻价格间会相差至少一个 ,一般的会相差 的若干倍(这个倍数通常被称为价格档数,此处分别用 和 表示)。同时, 和 分别表示新来买卖指令与当前指令簿上最低卖价、最高买价在均值意义上的位置偏离或平均偏离度。而 与 则刻画了新来指令落在限价指令簿上位置的不确定性。根据Ranaldo(2004)对指令提交积极性的定义和分类的思想,这里 和 、 和 一起分别刻画了新来卖、买指令提交的积极性。可得t时刻新来限价卖指令主动成交的概率 为:
为了研究特征变量之间的相互关系,这里引入几个新的变量:假设买卖订单以强度为 的泊松过程 随机序贯地到达限价订单簿,其中限价卖单的比例为 ,限价买单的比例为 。则由泊松过程的性质可知,限价卖、买指令分别以强度为 和 的泊松过程到达。是指新来的买单满足 因而使得新来的买单以价格 成交,但由于 处订单深度较大,成交后仍有余量从而最低卖价不会右移的概率,因而 的经济含义在于刻画了限价订单簿上卖方的深度,常数 越大表明订单簿卖方的深度越大。是指新来的卖单满足 因而是的新来的卖单以价格 成交,但由于 处订单深度较大、成交后仍有余量从而最高买价不会左移的概率,因而 的经济含义在于刻画了限价订单簿上买方的深度,常数 越大表明订单簿买方的深度越大。作者对于几个特征变量的动态变化过程以及相互间在趋势上的相关性进行数值仿真分析结果如下,参数取值分别为 , , , , , , , , 。
图4 α(t), β(t), Spread(t)与TP(t)
图5
可以看到,上图二者之间在趋势上存在一定的相关性。总体趋势表明,随着最低卖价减小和最高买价增大,买卖价差减小,使得新来指令的主动成交概率增大,进而限价指令簿上的指令不断被动成交(被新来的流动性需求方消耗掉),这进一步又使得最低卖价增大以及最高买价减小,从而买卖价差增大,新来指令的主动成交概率又随之减小……整个过程不断重复,直到达到竞争均衡为止,正是由于买卖价差与成交概率之间的相互作用,才呈现出图中所示的动态变化趋势。上述成交概率与买卖价差相互作用的关系可表示为:
图6 买卖价差与成交概率变化关系图
此外,当新来限价指令处于次积极阶段时,对新来限价买卖指令的成交概率还可能存在交叉影响效应。对新来卖指令而言,在趋势上,随着,和逐渐减小,新来卖指令的积极性逐渐增加,在此过程中,当新来卖指令处于次积极阶段时,在新来卖指令的主动成交概率逐渐增加(此为直接影响)的同时,会导致买卖价差缩小,这将使得新来买指令的主动成交概率也随之增大(此为间接影响);对新来买指令而言,在趋势上,随着逐渐增加,逐渐减小,新来买指令的积极性逐渐增加,在此过程中,当新来买指令处于次积极阶段时,在新来买指令的主动成交概率逐渐增加(此为直接影响)的同时,也会导致买卖价差缩小,这又将使得新来卖指令的主动成交概率也随之增大(此为间接影响)。
三 成交概率的估计
直接对于限价单成交概率进行估计的研究较少,主要是通过影响成交概率的各个因素出发建模。本文总结了两个较为完整的对限价单成交概率的估计方法。
3.1 基于多维hawkes过程和线性模型
池文涛(2020)利用多维hawkes过程对订单速率进行建模,再通过历史成交时间与成交概率的分布规律,动态地计算成交概率。其中订单速率指的是买卖两个方向上最优价格队列的增加和消耗速度。
中国市场有6大类订单,包括买卖限价单、买卖市价单和买卖单撤单,按照功能区分也可以分为4类,即买卖方向上的队列减少或增加。如果细分的话可以有12种之多,它们之间都在互相影响。但12维带参数核函数的hawkes模型计算,时间复杂度过高,很难估计其参数。所以为了平衡起见,作者使用4维hawkes过程,并加入双变量的核函数来计算订单速率:
m∈{1,2,...,4}和 是点过程 中的时间点;m表示订单类型, 为第n种订单到达订单薄队列后,第m种订单速率的增加值,称作速率跳跃幅度;当订单到达队列后,其对其他种类订单速率的影响随时间减弱,其作用的衰减率记为 ;μ称为基础密度,即订单薄时间的基础发生速率。
对于hawkes过程的参数估计涉及求解非线性多元函数的最小值,作者利用MATLAB中的fmincon函数进行求解。通过参数估计,可以计算每时每刻买卖双方的订单速率,以及基于线性模型计算订单速率不平衡下,即队列减少速率大于队列增加速率至少10%的情况下的成交概率。
订单速率不平衡的含义为:从排队论的角度,只有订单速率不平衡,且当服务速率大于客户到达速率的情况下,队列才能被清空。通过滑动窗口计算的限价单λ和市价单+撤单速率(μ+θ),发现在99%以上的情况下λ<μ+θ。市场中实际的成交概率是非条件概率: ,其中T为限价单实际的成交时间,此概率即为其成交时间落在 区间且中间价没有发生变化的概率。实际计算成交概率的方法分为三步:1)找出在上一个时间片市场买卖价差为一个tick,则在下一个时间片上进行挂单的所有限价单。这样保证了这些限价单都是挂在已有的队列上,而不是插队在最优价格之前自己形成最优的买或卖队列;2)计算实际成交时间:成交时间 = 限价单被成交时间 – 限价单下单时间3)把所有订单按照成交时间由短及长排序,统计成交时间长短每隔一秒所有订单中间价不变的情况下成交的笔数占这个时间段内所有成交的笔数。把成交时间和成交概率建立<key, value>表,key为成交时间,value为概率。模型计算的概率为条件概率,订单薄在时刻t的条件为所求得各种订单到达队列的速率,队列深度。得到该队列消耗完的时间后,以此时间依照实际成交时间与概率的关系,找到对应的成交概率。b代表买方,该公式对于卖方a也同样成立。的定义为限价单成交时间落入的时间段,和在实际成交时间各个时间区间段中的一致。
限价单成交时间的计算方法基于以下方程组:
、 分别为在t时刻买方和卖方队列消耗完的时间,为所求变量, 和 是在下单一刻,有多少个订单排在队列前段, 为买方队列增加量, 为卖方队列增加量。通过<key, value>表即可获得模型的成交概率。作者计算了2019年3月份SZE000001和SZE000002两支股票的实际成交概率和模型成交概率,发现样本内模型计算概率的变化趋势与实际概率的变化趋势一致。
为了检测在样本外的效果,将这两支股票2019年3月所得的多维hawkes参数值的平均值用来计算4月份对应时间段的订单速率,从而获得4月份限价单模型成交概率。股票SZE000001的变化趋势如下图:
图10 买方模型所计算成交概率与实际概率走势图
图11 卖方模型所计算成交概率与实际概率走势图
作者通过比较实际成交概率和在线性模型下和订单不均衡下成交概率的接近程度,来判断准确率与模型优劣。因为在实际交易中,市场环境变化很快,即便通过实时计算概率决定下单后,订单速率已经不是计算时刻的值,订单薄队列深度也发生了变化。所以基于在时刻t的判断,若 实际成交概率-模型成交概率 ,则认为模型所计算的概率是正确的。如果准确率超过55%,则认为在高频交易策略中是可用的。
基于多维hawkes动态模型在时间段[9:30:00, 10:30:00]所得的限价单成交概率的准确率:
表4 样本内2019年3月的准确率
表5 样本外2019年4月的准确率
除多维hawkes模型外,作者还运用了订单薄高频重构计算订单速率的方法计算成交概率,然而基于多维hawkes模型的准确率要高于基于订单薄高频重构算法的准确率,在样本内平均高了6.5%,在样本外平均高了6%。
3.2 基于生存模型
生存模型是对于事件发生种类和发生事件进行建模的统计模型,在经济学研究中,一般也被称为久期模型(duration model)。对于事件发生的时间,一般称为样本的生存时间(survival time)。吴昊(2019)利用包含解释变量的生存模型,即加速失效时间模型(accelerate failure time model)进行成交概率的估计,并基于Kaplan-Meier估计量深入分析限价单指令成交时间对限价单委托价格和委托量的敏感性。假设指令等待成交时间为T,则T的生存概率函数可以表示为:其中X表示了描述限价单挂单时刻市场状态的向量, 表示了限价单的挂单价格距离最优对手价的距离, 表示了限价单的委托数量, 表示了限价单的买卖方向。令 表示限价单指令失效的时间, 表示与之对应的指令失效的原因。对应的U表示了未删失数据,即被成交的限价单;C表示了删失数据,即被撤销的限价单。对好生存函数服从的分布作出假设后,我们就可以利用极大似然估计法估计出对应的分布参数。为了描述限价单成交时间受到限价单自身性质和市场情况的影响,作者构造了下面8个衡量市场微观结构的指标。这些变量衡量了限价单挂单价格相对于最近市场成交价和最新的盘口报价之间的距离,限价单的挂单量,市场报价的深度,还有股票自身的流动性和波动性。
表6 生存模型中变量的含义
对于所有的限价买单,构造市场解释变量为:
对于卖方指令的变量构造与买方相似,此处不再赘述。作者并未直接估计成交概率的值,而是分析了成交概率和各解释变量的相关性。为了能使用极大似然估计法对于模型的参数进行估计,还需要对于基准生存时间的分布进行假设。对于大市值和中等市值的股票,对其卖单和买单使用相同的解释变量进行估计之后发现,对于不同的组别,Log-Logistic分布都有最大的极大似然估计值。所以选择Log-Logistic分布对于限价单成交概率进行回归分析。
表7 限价买入指令回归结果
可以看出,除了对于中等市值的股票,BSID的参数不显著外,其他的解释变量在各个组别都显著地影响限价单的成交概率。对于大市值股票而言,限价买入指令方程中的MQLP的估计结果为0.31,其指数值为1.37,这说明当MQLP增加一个单位时,即限价买单价格更加远离市场报价中点一个单位时,限价单的平均生存时间增加37%。对于中等市值股票的限价卖出指令,MQLP的估计结果为-0.474,其指数数值为0.62,这说明当MQLP增加一个单位时,即限价卖单价格更加靠近市场报价中点一个单位时,限价单的平均生存时间减少38%。作者还对于订单发送策略进行了研究,分为静态订单发送策略和动态订单发送策略。静态订单发送策略将问题设计成一个单一决策过程,在整个过程中交易员只能做一次决定;动态订单发送策略允许交易员在订单成交或过期之前取消或者修改订单。用000002股票2018-01-03的所有限价单数据模拟两种情况下成交概率模型对于流动性交易员收益的增强情况,可以看出在不同的情况下,通过对成交概率的预测,在成交概率较大时选择继续挂出限价单等待成交,在成交概率较小时立刻以当前市价单成交,总是能够相比于原有策略带来更优的成交结果。
表8 静态成交策略下不同发单方式的平均收益(单位:0.01元)
表9 动态成交策略下不同发单方式的平均收益(单位0.01元)
从两个策略的结果都可以看出,在不同的情况下,使用成交概率交易策略都持续性地获得更好的收益。从动态成交策略的结果可以看出,一般而言,允许成交的窗口期越长,平均收益越好。另外,随机动态交易模型的表现不如随机静态交易模型,这说明仅仅增加交易机会并不能提高收益,还需要交易员有对市场的判断。止损动态成交策略的成交成本与随机静态交易策略的成交成本几乎一样,这是因为止损条件选择为一倍标准差,由于收益率分布与正态分布相似,所以导致止损的概率接近50%。
四 总结
限价单成交概率和限价订单簿状态的研究是一个较为复杂的问题,从成交概率的影响因素出发,可以建立计算成交概率的模型,从而动态地估计成交概率并研究其变化规律,进一步地帮助交易员进行复杂的决策。这方面还有很多有待研究和改进的问题,例如成交概率模型的建立还可以从多个角度出发,比如结合交易员对于未来价格的估计,利用成交概率计算出不同交易策略成本的均值和方差,从而进行最优化决策等;算法和算力的进一步改进也可以更及时地捕捉成交概率的变化,从而帮助交易员的决策。
参考文献
[1] ZHANG Qiang, WANG Chao, LIU Shancun, YANG Yaodong(2019), OrderExecution Probability and Order Queue in Limit Order Markets.
[2] 吴昊(2019),限价单成交概率估计及其在挂单策略上的应用.
[3] 池文涛(2020),中国股票市场限价单成交概率与微观结构高频分析.
[4] 刘波(2009),基于连续双向拍卖交易机制的金融市场微观结构研究.
市场有风险,投资需谨慎。以上陈述仅作为对于历史事件的回顾,不代表对未来的观点,同时不作为任何投资建议。