除了你的才华,其他一切都不重要!

近年来,互联网和人工智能技术的飞速发展,推动传统金融大踏步前进,尤其是量化投资、互联网金融、移动计算等领域,用一日千里来形容也不为过。2015年年初,李克强总理在政府工作报告中提出制定“互联网+”行动计划,推动移动互联网、云计算、大数据等与各行业的融合发展。2015年9月,国务院又印发了《促进大数据发展行动纲要》。可见,大数据金融将会成为未来十年闪亮的领域之一。2012年年初,中国量化投资学会联合中国工信出版集团电子工业出版社,共同策划出版了“量化投资与对冲基金丛书”,深受业内好评。在此基础上,我们再次重磅出击,整合业内顶尖人才,推出“大数据金融丛书”,引领时代前沿,助力行业发展。

本书特点

和卓金武认识是在一次行业会议上,我听他演讲有关数据挖掘的课题,内容很翔实精彩,会后与他交流,发现他在量化投资领域做了很多年的研究,于是就建议他写一本基于数据挖掘的量化投资的教材,他欣然同意。一年后该书出版,受到业内很多好评。这次的改版是对原内容的一个大的升级和优化。

数据挖掘是人工智能领域的一个重要分支,在学术界发展了大概30年,最近在业内改头换面,以“大数据”这个名词大放异彩。过去十年,数据挖掘技术在各行各业都得到了广泛的应用,如语音识别、人脸识别等。在金融投资领域,数据挖掘主要用于各种交易模式的识别、策略优化等,最近几年也得到了越来越多的研究人员的支持。本书以翔实的内容、深入的研讨,将数据挖掘技术用于量化投资的方方面面,可以对读者起到非常重要的借鉴作用。

本书的基础篇阐述了与数据挖掘有关的基础理论,包括数据挖掘原理、数据挖掘过程及数据挖掘的主要工具,特别是通过几个案例帮助读者快速地入门MATLAB,让读者了解MATLAB中与数据挖掘有关的一些函数和工具箱的作用。

技术篇阐述了有关数据挖掘的各种技术,包括数据的准备、数据的探索、关联规则方法、数据回归方法、分类方法、聚类方法、预测方法、诊断方法、时间序列方法和智能优化方法等。其中,关联规则方法、分类方法、聚类方法是数据挖掘的主要内容。关联规则方法可解决不同因素之间的因果关系问题,可从大量的数据中找到看似不相关的因素之间背后有可能隐藏的逻辑关系。分类方法对历史知识进行分类处理,试图找到对未来的预测。例如,可以将股票分为“涨”和“跌”两大类别,学习分类模型后,可将其用于对股票走势的预测。聚类是一种无监督的学习,也就是说,在没有历史样本的情况下,找到背后的大致规律。这特别适用于波动不规律的品种的投资策略。马尔可夫链是一种预测方法,可以用于大盘走势的预测。我们日常看到的K线都属于时间序列。时间序列的研究方法可以用于K线走势的预测,包括ARMA模型、ARIMA模型、ARCH模型、GARCH模型等。

实践篇则介绍了多个基于数据挖掘的策略,包括统计套利策略、配对交易策略,以及有关数据挖掘系统的一些阐述等。统计套利策略用到的模式和分类技术,以及配对交易策略用到的协整关系和配对交易函数,可以用基于数据挖掘的技术来实现。本书第17章和第19章分别阐述了基于Quantrader平台的量化投资和基于数据挖掘技术的量化交易系统,为投资者提供实际交易的辅助。

本书在理论方面进行了很深入的探讨,在实践方面又有多个案例,是一本不可多得的优秀教材,特此推荐。

美好前景

中国经济经过几十年的高速发展,各行各业基本上已经定型,能够让年轻人成长的空间越来越小。未来十年,大数据金融领域是少有的几个有着百倍甚至千倍成长空间的行业,在传统的以人为主的分析逐步被数据和模型替代的过程中,从事数据处理、模型分析、交易实现、资产配置工作的核心人才(我们称之为宽客),将有广阔的舞台可以充分展示自己的才华。在这个领域中,将不再关心你的背景和资历,无论学历高低,无论有无经验,只要你勤奋、努力,脚踏实地地研究数据、研究模型、研究市场,实现财务自由并非遥不可及的梦想。对于宽客来说,除了你的才华,其他一切都不重要!

丁鹏 博士
中国量化投资学会 理事长
《量化投资——策略与技术》作者
“大数据金融丛书”主编