kaggle新赛:Optiver 美股价格预测赛题解析-LMLPHP

赛题名称:Optiver - Trading at the Close

赛题链接:https://www.kaggle.com/competitions/optiver-trading-at-the-close

赛题背景

证券交易所是快节奏、高风险的环境,每一秒都很重要。随着交易日接近尾声,强度不断升级,在关键的最后十分钟达到顶峰。这些时刻通常以波动加剧和价格快速波动为特征,在塑造当今全球经济叙事方面发挥着关键作用。

纳斯达克证券交易所的每个交易日都以纳斯达克收盘交叉拍卖结束。此过程确定了在交易所上市的证券的官方收盘价。这些收盘价是投资者、分析师和其他市场参与者评估个别证券和整个市场表现的关键指标。

在这个复杂的金融环境中,Optiver是全球领先的电子做市商。在技术创新的推动下,Optiver交易各种金融工具,如衍生品,现金股票,ETF,债券和外币,为全球主要交易所的数千种此类工具提供具有竞争力的双边价格。

在纳斯达克交易所交易时段的最后十分钟,像Optiver这样的做市商将传统的订单簿数据与拍卖簿数据合并。这种整合来自两个来源的信息的能力对于为所有市场参与者提供最优惠的价格至关重要。

赛题任务

在本次比赛中,您面临的挑战是开发一个模型,该模型能够使用订单簿和股票收盘价中的数据预测数百只纳斯达克上市股票的收盘价走势。拍卖信息可用于调整价格、评估供需动态以及识别交易机会。

评价指标

根据预测回报和观测目标之间的平均绝对误差 (MAE) 评估提交。公式由下式给出:

kaggle新赛:Optiver 美股价格预测赛题解析-LMLPHP

数据描述

这个数据集包含了纳斯达克股票交易所历史每日十分钟收盘拍卖的数据。您的挑战是预测个股相对于一个由纳斯达克上市股票构成的合成指数的未来价格变动。

文件

[训练集/测试集].csv 拍卖数据。测试集将通过API提供。

  • stock_id - 股票的唯一标识符。不会在所有时间段都出现所有的股票ID。

  • date_id - 日期的唯一标识符。日期ID是顺序一致的,贯穿所有股票。

  • imbalance_size - 在当前参考价格下无法配对的金额(美元)。

  • imbalance_buy_sell_flag - 反映拍卖不平衡方向的指标。
    • 买方不平衡;1

    • 卖方不平衡;-1

    • 无不平衡;0

  • reference_price - 配对股份最大化,不平衡最小化,且与买卖盘中点距离最小化的价格,依此顺序。可以视为受最佳买入和卖出价格限定的接近价格。

  • matched_size - 在当前参考价格下可以配对的金额(美元)。

  • far_price - 仅基于拍卖利益可以配对最多股份的交叉价格。该计算不包括连续市场订单。

  • near_price - 基于拍卖和连续市场订单可以配对最多股份的交叉价格。

  • [bid/ask]_price - 非拍卖订单簿中最具竞争力的买入/卖出价格。

  • [bid/ask]_size - 非拍卖订单簿最具竞争力的买入/卖出金额。

  • wap - 非拍卖订单簿的加权平均价格。

kaggle新赛:Optiver 美股价格预测赛题解析-LMLPHP

  • seconds_in_bucket - 从当日收盘拍卖开始经过的秒数,总是从0开始。

  • target - 股票wap在未来60秒内的价格变动减去合成指数在未来60秒内的价格变动。只在训练集中提供。
    • 合成指数是奥普蒂沃为本次竞赛构建的纳斯达克上市股票的自定义加权指数。

    • target的单位是基点,这是金融市场中常用的计量单位。1个基点的价格变动相当于0.01%的价格变动。

    • 假设t是当前观测的时间,我们可以将target定义为:

kaggle新赛:Optiver 美股价格预测赛题解析-LMLPHP

时间安排

  • 2023 年 9 月 20 日 - 开始日期

  • 2023 年 12 月 13 日 - 报名截止日期

  • 2023 年 12 月 13 日 - 合并截止日期

  • 2023 年 12 月 20 日 - 提交截止日期

赛题奖金

  • 第一名 - 25,000美元

  • 第二名 - 20,000美元

  • 第三名 - 15,000美元

  • 第四名 - 10,000美元

  • 第五至十名 - 5,000美元

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

09-26 23:28