beer什么意思学校代码:10327英文粗话
学号:
**********
学术型硕士学位论文
学
院:经济学院专业:数量经济学研
究方向:计量经济学理论与应用*名:***
***师:***
完成日期:2018年4月rment
答辩日期:
2018年6月时间序列特征编码方法改进及在金融数据中的应用
THE IMPROVEMENT OF TIME SERIES FEATURE CODING AND ITS APPLICATION IN
FINANCIAL DATA
A Disrtation Submitted to
Nanjing University of Finance and Economics
For the Academic Degree of Master of Economics
strings
BY
Dong Xiaokai
Supervid by
optical是什么意思
Associate Professor Li Changfeng
terrain
School of Economics
Nanjing University of Finance and Economics
April,2018
学位论文独创性声明
本论文是我个人在导师指导下进行的研究工作及取得的研究成果。论文中除了特别加以标注和致谢的地方外,不包含其他人或其它机构已经发表或撰写过的研究成果。其他对本研究的启发和所做的贡献均已在论文中作了明确的声明并表示了谢意。
作者签名:日期:
学位论文使用授权声明
本人完全了解南京财经大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,
允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其它复制手段保存论文。保密的论文在解密后遵守此规定。
作者签名:导师签名:日期:
摘要
时间序列分析技术在科学、经济、气象、医学等诸多领域都有十分重要的应用。时间序列分析的主题众多,主要包括系统描述、动态系统预测以及模式匹配。时间序列的特征表示是时间序列分析的重要基础也是研究热点之一,各种场景下的时间序列是随着时间不断变化着的一串数值,这种变化随着时间的积累必然会表现出系统性的趋势,可以反映业务场景背后的规律。而这种规律往往因为太多的干扰或其他偶然因素以致于被隐藏在序列之中难以捕捉。若能将时间序列的特征进行合理的转换,有效的去除噪声,更清晰的表达出序列本身反映的系统变化趋势,那么对后续的分类、预测等分析以及决策将有着重要的指导意义。
夫人英语符号化特征表示是时间序列特征表示方式之一,它能够实现时间序列的维度降低、平滑噪声等,改善了后续分析的计算复杂度和可操作性,受到众多学者的青睐。在时间序列特征转换后,为了与后续分析结合,新序列之间的距离、相似性、以及预测方法将随之改变。本文以时间序列的符号化编码表示为基础,对传统符号化表示的方法作出有效改进,设计了一套表征时间序列系统趋势特征的简易编码,
能够客观、直观的反映时间序列片段的系统变化规律,且这种“数值”编码方式为编码序列趋势预测提供了可能。针对编码参数选择的问题,本文提出了平衡复杂度与拟合度的参数选择策略——HIC准则。同时,在时间序列符号化编码的相似度量方面,提出了期望下界距离,并给出了相关性质的证明,包括非负性、对称性、三角不等式性、期望下界性和期望一致性等等,解决了传统编码距离难以满足距离定义一般性质的缺陷。
最后,文章以金融时间序列为数据源,针对本文算法进行了两个应用,用以验证算法的合理性和适用性。第一,典型模式序列的快速匹配和不等长的时间序列片段的匹配,实验结果验证了时间序列符号化编码及其编码距离有效提高模式匹配的精准度和覆盖度;第二,基于金融时间序列的符号化编码趋势预测,将编码算法与回归模型相结合,结合编码序列所表示的时间序列建立ARIMA模型,对短期后续趋势进行预测,通过对比分析验证了编码序列预测模型的稳定性。
暗示英文
本研究提出的时间序列特征编码表示方法,以及基于该编码表示下的相似度量方法是时间序列大数据应用领域内的一次新的尝试。该算法能降低计算复杂度,与其他后续分析算法结合的能力较强。因此,该算法在生产实践中有广泛的应用,如证券价格走势的相似搜索与预测、气象地质数据的模式发现、保险医疗当中的异常行为分析等。
关键词:时间序列;特征编码;相似度量;HIC准则;期望下界性
ABSTRACT
you to beTime ries analysis technology has a very important application in many fields such as science,economy,meteorology,medicine and so on.There are many topics in time ries analysis,including system description,dynamic system prediction,and pattern matching.The feature reprentation of time ries is one of the important foundations of time ries analysis and one of rearch hotspots.Time ries in various scenarios is a ries of numerical values that change with time.This kind of change will inevitably show the system with the accumulation of time.Sexual trends can reflect the laws behind business scenarios.This rule is often too difficult to capture due to too much interference or other incidental factors that are hidden in the quence.If the characteristics of the time ries can be reasonably converted,the noi can be effectively removed,and the system change trend reflected by the quence itlf can be more clearly expresd,then it will have important guiding significance for subquent classification,prediction,analysis,and decision making.
Symbolized feature reprentation is one of the reprentation methods of time ries features.It can reduce the dimensionality of time ries,smooth noi,etc.,and improve the computational complexity and operability of subquent analysis.It is favored by many scholars.After the transformation of the time ries features,the distances,similarities,and prediction methods between
the new quences will change with the subquent analysis.Bad on the symbolic coding reprentation of time ries,this paper improves the traditional symbolic reprentation method and designs a t of simple codes that characterize the trend features of time ries systems.It can objectively and intuitively reflect the systematic changes of time ries fragments,and this"numerical"coding method provides a possibility for the prediction of the coding quence trend.For the problem of coding parameter lection,this paper propos a parameter lection strategy for balancing complexity and fitness,the HIC criterion.At the same time,in the aspect of similarity measure of symbolic coding of time ries,the expected lower bound distance is propod and the proof of related properties is given,including non-negativity,symmetry,triangular inequality,expected lower boundness and expectation consistency,etc.It solves the defect that the traditional coding distance can hardly satisfy the general definition of the distance.
Finally,the article takes financial time ries as the data source,and applies two
>初一英语教案