金融高频数据挖掘——揭开永恒的市场波动的神秘面纱
上一篇 / 下一篇 2007-01-28 06:06:49 / 个人分类:研究进展
金融高频数据挖掘
——揭开永恒的市场波动的神秘面纱*
马金龙1,2,马非特2
(1 中国科学院广州地球化学研究所 广州 510640;
2 长沙非线性特别动力工作室 长沙 410013)
摘 要:金融高频数据是金融市场内秉特性的表征。本文基于复杂系统理论和非线性动力学原理,通过对金融交易市场高频数据进行空间重构、数据挖掘和数值分析获得非线性特别动力因子——金融孤子,发现其价格波动规律,建立与市场相适应的前瞻性的演化博弈模型,进而提出金融孤子的(非欧几何)构造新概念。经实盘交易股票G广控和期货燃油实践,实现了在价格波动演化过程中的可重复性实验,达到了验证金融孤子理论及模型正确性的目的,进而揭开永恒的市场波动的神秘面纱。
关键词:金融高频数据;数据挖掘;金融市场;价格波动;金融孤子
1 引言
科学数据是自然界客观事物特性的表征。现代科学领域的数据都开始以越来越精细的时间刻度来收集,在频率上向可微分方向发展,在数量上正以指数级增长。自上世纪90年代以来,随着现代计算机科技手段在金融交易中的广泛使用,交易系统可以实时地提供市场参与者的交易数据,包括股票、汇兑、期货及其金融衍生品等,并且全部交易过程被实时的逐笔交易或逐秒记录(中国证券市场交易系统具备每分钟出10个数据的能力)和储存下来,这样就形成了金融高频数据(financial high frequency data),即达到可微程度,而且金融高频数据具有海量性,如分钟数据,在十年内可以达到1 000 000数量级 [1]。
目前国内外高频数据研究主要是从统计物理学和数理统计学这两个途径展开的。金融物理学家基于非线性动力学(混沌、分形)原理取得了以下认识,在金融时间数据中建立了确定性混沌动力学系统,金融市场价格的多变是多种因素非线性相互作用导致的,具有混沌、分形的特性,提出了分形市场假说、偏离高斯分布的列维分布和渐近幂率以及标度性等,揭示了金融市场现象中的普适性、规律[2]-[4]。数学家和经济家基于线性的、完全理性的均衡范式,建立了如自回归条件异方差(ARCH)类模型、自回归条件持续性(ACD)模型等[5,6],但因假设这个系统是可计系统,相当于热力学第二类永动机[7],在实际上无助于发现运动的机制。尽管这些模型从不同角度和层面考虑了金融高频数据的基本要素和主要特征,揭示了一些异常的市场微观现象,但仍处于描述和分析的基础层面。
投机(投资)者的梦想和追求的目标是,能否有效跟踪和把握金融市场交易价格波动的趋势,特别是如何避免大幅的价格波动(暴涨或暴跌)带来的金融风险,实现“低买高卖”,并能持续稳定地增进自己的福利。实现这个目标的主要问题是金融风险管理,即对非线性金融市场价格大幅波动的定量分析和评估。非线性问题究竟有多难?金融市场的混沌特性注定了市场参与者进行的只是一种纯粹随机的“公平赌博”吗?显然,这个非线性难关是需要金融工程界来回答和解决的现实问题。
本文基于复杂系统理论,应用非线性动力学(混沌、分形、孤子)原理,采用问题导向研究方法(数据→模型→概念→实践),让数据说话,并不事先假设数据的模型,而是通过对金融交易市场高频数据进行空间重构、数据挖掘和数值分析获得非线性特别动力因子——金融孤子[8],发现其价格波动规律,建立与市场相适应的前瞻性的演化博弈模型,进而提出金融孤子的(非欧几何)构造新概念,经实盘交易股票G广控和期货燃油实践,实现价格波动演化过程中的可重复性实验,同时达到验证金融孤子理论及模型正确性的目的。
2 金融高频数据-建模-波动演化过程的重复再现性
在信息社会中,面临浩渺无际的金融高频数据, 如何才能不被信息的汪洋大海所淹没, 并将数据转换成有用的知识,大多数数据挖掘工具目前仍无法提供必备的功能来“有效”支持海量数据的探索,人类期望着有一些能从数据汪洋中提取各种知识的理论和技术。
社会科学经济系统的金融市场交易系统提供的各种高频数据与物理学研究体系在时空结构上具有相当程度的严格对称性,不仅可反应出系统的演化过程和行为特征,包括所有的非线性效应,而且能够有效地描述参与者的行动过程,这些交易活动就是群体的高阶逻辑思考过程(信息)的反映[8]。同时,为应用数学和物理学方法研究金融市场提供了切入途径,为开展金融市场复杂介质结构及其动力学响应奠定了前所未有的技术基础。事实上,金融高频数据为验证或推翻任何相关理论提供了手段和直接证据,并已成为科学发现和新理论创建的源泉。
建模基本思想是:各类市场参与者及其策略结构共同构成了开放的市场生态环境,且在混沌的市场状况下不断调整彼此关系及局部的非线性相互作用,而自发地涌现出的系统总体性状、结构与动力学行为。支配金融市场体系的相互作用力又是相对稳定的——交易体系的供大于求和供不应求产生一个指向该体系均衡价格方向的驱动力。因此,正确地解决金融交易市场是个力学应用问题:金融市场的涨落的物理本质是在某一区域的构成介质(市场参与者和策略结构)发生失稳,并伴随有应变能的加速释放(价格波动、暴涨、暴跌)。从力学角度,金融市场的涨落的孕育过程实质上是市场中参与者和策略结构发生相互作用,导致失稳的演化过程,即发生对称破缺过程,这个过程是一个力学过程。但是,解决金融市场预测有关的力学问题与工程中的力学问题有许多不同之处,通常力学问题的解决需要知道:本构关系、边界条件、初始条件以及某些物理量的变化历史。但是,金融市场的涨落的孕育过程中它们却是未知的或者不完全知道的。我们知道的只是市场中某些物理量的变化。根据这一思路我们提出了一个定量地表征金融市场涨落的孕育过程的动力因子——金融孤子。对现代金融市场交易数据(包括历史的和实时的所有盘面数据),如价格、成交量、时间区间等,进行多种特定的相空间重构和时间序列处理,在重构的高维空间中,构造非线性算子(因其追随价格波动的特性,此处被称为非线性特别动力因子,即金融孤子),并以连续数据不断支持着建模,实际上这是一种演化博弈模型。将无规则可寻的锯齿状价格波动映射成较光滑的函数曲线,运用鞅方法和不动点理论,以动力因子处理连续时间的市场价格波动(即所谓布朗运动),随机逼近股票、期货价格波动的相应低或高点,结合资金头寸管理的动态规划,最优化建仓、出货时机,最终实现在市场博弈中通过学习进化争当少数获胜者。
金融市场是一个演化着的复杂系统,每时每刻都进行信息(data)、能量(多空力量)与物质(信用、资金)的转换的属性。因此,该系统可以看成是由能量流、物质流、信息流所构成,这种结构是动态的,它要靠消化能量、信息和物质来维持,可以说是更高层次的自然现象。而每一个事件的涨落(波动)从孕育到发生,就是能量、信息和物质三要素的相互变化、协调和统一的结果,其演化过程的一种表示形式就是价格波动。作为一个事物,金融市场在运动形式上表现出的波动性是永恒不变的,而波动是可以重复再现的。且波动过程中存在一个守恒量——孤波(孤子),这是复杂系统体系下,相互作用之中的涌现(emergence)。作为非线性动力学三个主体(混沌、分形及孤子)之一,孤子具有宏观的波动-粒子两重性。由于现代金融市场具有典型的非线性动力学属性,显然,对其价格进行描述只能是一个非线性方程组,而非线性科学研究表明,孤波正是非线性方程的解。可积系统的孤波是非线性方程的行波解。又由于孤子有保持能量、动量不变而运动过一个宏观距离的特性,从而使它能把所吸收的能量和信息无损耗地传递下去,因此,金融市场中存在着一种新的物质与能量——孤子。不管金融市场怎么变化,只要找到孤子,并应用鞅方法和不动点理论,就可对价格波动进行有效跟踪。由此,可以应用与自然科学研究同样的方法和标准来研究金融市场价格波动(社会现象),绕开金融市场在时间的演化过程中可重复性实验的困难问题,实现在波动的演化过程中可重复性实验的目的。实际上,就是应用了与自然科学同样的方法和标准,当然这是在弯曲的金融时空层次上来进行认识的。
3 弯曲的金融时空
3.1 丘成桐紧致空间理想
我相信非线性微分方程,几何稳定性和几何结构的交汇是一个很基本的问题,在未来的几十年里将会有深入的互动,更可以想象的是它跟物理学上的renormalization flow会有密切关系。当结构稳定后,我们希望将全部完成一个紧致空间,因此要引进半稳定结构的观念,而这些结构可以看做模空间的边界,也因此一般来说它们有奇异点,这种自然产生的奇异点是微分几何学里重要的奇异点,在这些空间上,研究它们的几何结构,规范场和子流形是很有意思的事情,往往经过singular perturbation后,我们对原来光滑的几何结构会有更深入的了解。[8]
3.2 流形的金融市场
市场参与者的有限理性、羊群效应以及策略结构的改变等因素导致了金融市场价格变化的时滞、过反应现象,实质上是微观部分的交互作用和变化导致了宏观系统的演变。Robert J. Aumann建立了完全经济状态下参与者连续统模型(Continuum Model),证明了价格的瓦尔拉斯竞争均衡(Walrasian Competitive Equilibrium)的存在[9]。作者根据金融交易市场数据记录中的其他变量分析某个连续变量的值,即建立物理问题的数学模型对流形的金融市场系统的演变过程作出定量化的结论。
3.2.1 主纤维丛上的联络
设
主丛
3.2.2发现金融市场的Yang-Mills泛函
设
其中,
同时,如果令
现设
定义
相关阅读:
- 战略性大宗商品交易价格波动的危机研究 (majl, 2007-1-28)
导入论坛 引用链接 收藏 分享给好友 推荐到圈子 管理 举报
TAG: 研究进展

