大数据周报:大盘相对谨慎,重点关注沪深300新闻情绪选股多空组合

发布时间:2023-08-18 19:51:53 来源:网络投稿

重要观点

1

大盘谨慎持仓为宜,现金为王

2017年2月09日发出看空信号,近期谨慎持仓为宜。从2014年1月1日到2017年2月10日,多仓单个信号平均收益2.61%,累计收益182.34%;空仓信号单个平均收益0.28%,累积收益10.49%。

2

新闻情绪因子选股不同板块风格各异

主板方面,情绪指数与股票未来表现为正向指标,且持续天数大概5个交易日;中小板方面,情绪指数与股票未来表现为反向指标,且持续天数大概22个交易日;创业板块方面,情绪指数与股票未来上涨或下跌效果不显著。

3

主板空头负超额收益十分显著

2014年1月1日到2016年11月30日多头组合相对沪深300指数最终值为1.28,多头组合相对沪深300指数年化超额收益9.1%,而空头组合相对沪深300指数最终值为0.35,空头组合相对沪深300指数年化负超额收益达30.9%。

一、大数据体系构建

1.1

数据采集与预处理

大数据的源头质量,直接决定我们指标质量,决定着我们的策略优劣性。目前,国内的相关数据来源主要为第一类上交所,深交所等的公告、财报,监管信息等;第二类财经新闻网站,比如新浪财经,第一财经,东方财富网,中国证券网,金融界,雪球财经,腾讯财经,第一财经等的个股新闻,行业新闻,宏观经济等;第三类社交媒体,比如股吧,贴吧,微博等;第四类为关注数据,比如百度,搜狗等个股每天搜索数量及分析师研报提及个股等。我们目前数据主要爬取新浪财经个股相关新闻,包括200多家媒体在内的所有个股新闻。

大数据采集则是通过网络爬虫或网站公开API等方式从上述相关网站上获取我们所需要的数据信息,将非结构化数据从网页中爬取下来,并解析相关信息,将其存储为统一的本地数据文件,并以结构化的方式存储在我们的数据库中。

阅读全文