辅导编程、辅导机器学习模型
- 首页 >> 其他基于不同的机器学习模型,利用大量的特征变量,对标的资产价格的波动进行预测研究,并对预测效果进行评价。机器学习的模型包括,但不限于XGBoost、GBDT、LSTM等经典学习模型。待研究的资产包括:股票、债券、大宗商品等可配置资产。特征变量包括宏观经济变量、行业变量、标的价格序列等。对于大宗商品中的螺纹钢,我们将提供供给、需求、成本等该品种特定的特征变量。参赛选手需要考虑到数据中时间序列的特性,以及不同频率之间数据的组织,并通过有效的特征提取方法,构建标的价格波动预测模型。我们将给出具体的资产指数和可能的特征变量,参赛选手需要去探索这些资产的预测模型。
评价指标:
我们用归一均方根误差(uniformed root mean squared error, URMSE)度量对单个序列的预测误差:
选手对Y1、Y2、Y3、钢铁的序列进行预测,并计算分别计算出URMSE1、URMSE2、URMSE3、URMSE4,最终总评价指标=(URMSE1+URMSE2+URMSE3+URMSE4)/4,依据总评价指标从低到高进行排序。
数据说明
1、X序列_train.xls、X序列_test.xls、钢铁X_train.xls、钢铁数据_test.xls提供了训练集与测试集的宏观经济变量、行业变量等特征变量,选手自行构建有效的特征。
2、Y_train.xls中包含4个sheet,分别表示训练集中Y1、Y2、Y3、钢铁在不同时间段内的价格波动情况。
3、提交样例:
3.1.采用UTF-8无BOM编码的txt文件提交,一共提交一份txt文件。
3.2.Y1,Y2,Y3,钢铁的价格预测分为四个模块,每个模块的开始分别用一行Y1,Y2,Y3,iron字符串标识。
3.3.必须按照给定的时间点进行预测,date和price之间是\t分割,不能有遗漏的数据或多出的数据。
格式:
Y1
date1 price
date2 price
...
Y2
date1 price
...
Y3
...
iron
...
3.4 具体格式可参考submit_sample.txt(注意:submit_sample.txt只给出了日期,提交时请在每行的日期后面加上\t和对应的预测值)