百度股市通股如何实现智能选股?
大数据应用在金融行业是老生常谈,最被人们津津乐道的是“海量Twitter信息中的情绪状态指标与道琼斯工业标准指数之间存在联动关系”,这来自于印第安纳大学计算机科学家Johan Bollen的一个报告,尚在学术研究层面。这方面一直缺乏商业化应用,而百度自去年开放大数据引擎,已经在多个领域进行了大数据的应用和尝试,尤其是去年世界杯期间,百度大数据对淘汰赛的比赛结果预测正确率达到94%,领先微软、谷歌和高盛。目前,百度基于大数据应用又发布了一款最新的手机股票软件“百度股市通”,通过其独创的股市知识图谱,可以为股民提供最新股票热点信息帮助用户发现这些信息与股票的关系。
当股市遭遇互联网大数据
百度股市通定位为股民选股的辅助工具,尤其是弥补了市面上股票软件在消息实时性、全面性、关联性和智能性上的不足。它的核心思路是利用大数据, 聚合有价值的新闻信息和用户数据、寻找股票与消息、股票与股票之间的关联,并且整合第三方的专业金融数据,给股民最有价值的信息。
百度搜索每天会接到数亿条政经相关的搜索请求,以及百度新闻每天收录的数百万条资讯,这都是百度天然的大数据优势。还有全球股市的交易行情,这部分各家都有,只要做到及时准确就可以了。从产品试用来看,百度应该有从证券机构获取专业的研报、公告等,比如在某个个股信息里,“百度股市通”有专门的“研报”类别,会显示所有机构对该股票的评级。百度股市通把这些数据挖掘后再聚合的方式进行呈现。
当然,百度的大数据显然不止这点作用,百度股市通还将海量数据与2000多只A股股票关联起来,同时将不同股票关联起来,发掘热点信息与个股的关系,某个热点事件可能会影响哪些股票,这就是其产品的核心功能“智能选股”。
距离预测股价还很遥远,做选股助手同样实用
成功预测股价有着巨大的商业价值,但世界上还没有任何个人、机构、技术或者产品可以百分之百地准确预测股价。股票价格受到诸多因素影响,短期主要是消息,消息引发股民决策进而形成一轮博弈,博弈结果是股价;长期则是企业本身价值与投资者期望值之间的契合度。
而股价是“人为因素决定”,传统的金融学是建立在随机行走和有效市场假说的基础之上,在有效市场假说理论中股价的变动很大程度取决于消息(新闻),市场上新信息的出现不可预测。这与天气这类有规律可循的自然现象不同,但在分析原理上也有类似可参考的部分。早期的天气预测主要依靠经验来判断,准确率很低,随着科技发展,人们发明了越来越多的气象仪器,现在的天气预测会根据气象卫星发回的云图和气象站测得温度、气压、风向、风速等数据来列出相应的方程组进行分析判断,这里同样也是大数据的应用,而由于方程组是非线性的,一点点的误差就有可能造成结果的巨大区别。因此理论上来说,任何预测都不可能是100%准确的。 百度股市通聪明的地方就是并不预测股票的涨跌(这也是证监会禁止的),只是预测热点事件的发展走势,并将热点事件相关联的股票提供给用户,至于最终的投资决策还是由用户自己决定。
市面上已有大智慧等炒股工具,但它主要是交易和数据系统,顺带提供了少许资讯,没有大数据应用,在实时性、关联性上存在短板。另外雪球财经这类App在个股信息和讨论上做得很好,在热点事件、股票关联上也没有对应的大数据产品。百度股市通是市面上唯一基于大数据提供智能选股服务的股票软件。
股市知识图谱是百度股市通基础,进入门槛高
在百度股市通之前,已经有基于大数据的选股协助工具,不过只停留在“指数”层面,腾讯曾在2013年联合专业金融机构推出“腾安价值100指数”,去年百度也联合中证指数公司和广发基金发布“百发100”互联网金融指数。全球知名指数都是媒体发布的,随着互联网金融发展,互联网媒体在资讯聚合能力和信息发布渠道上的优势都在得到体现。百度是“媒体之上的媒体”,做指数也不足为奇。
但是百度股市通与指数有非常大的不同。指数只是把股票市场整体趋势量化,百度股市通更多体现在“个性化”上,比如根据热点事件命中“事件影响股”,再根据用户订阅推送关联消息。另外百度股市通可以直接呈现热点消息和第三方专业数据,帮助用户在纵横交错的海量信息中找到与股票相关的最新信息。
指数和百度股市通都是基于大数据,但百度股市通还多了一层,即知识图谱。知识图谱的要义就是找到不同信息的关联性,形成一个网状的知识结构,所谓图谱。而股市知识图谱就是建立起各类数据、信息与股票的关系,以及股票与股票之间的关系,所以可以第一时间通过各种信息的热度变化来分析股票未来可能的走势。百度的股市知识图谱在数据上有优势,在技术上也有特长,百度在搜索结果页中早已整合了知识图谱便于用户进行二次搜索。知识图谱技术核心是自然语言处理和深度学习技术的数据挖掘,这是百度擅长的。海量信息关联性靠人工来梳理不现实,耗时耗力无法满足实时性需求,基于深度学习技术,百度股市知识图谱本身可以实时迭代,模型本身也在不断更新。因此,指数产品CCTV、腾讯等媒体都可以做,但股市知识图谱只有搜索引擎公司才可以做,这也是百度股市通实现“智能选股”的关键所在。
百度股市通对于百度的价值在哪里?大数据商业化和互联网金融
百度股市通只是百度众多大数据产品中的一个。2014年开始百度已陆续推出流感预测、景点预测、商圈热力图、世界杯预测等基于大数据的产品。股市通是百度在大数据商业化上的又一个新产品,并且首次涉足证券领域,证券与大数据有天然关联性,结合点正在越来越多。
另外值得注意的是互联网金融已是百度非常重要的新业务方向。百度要做O2O就必须大力发展百度钱包这一互联网金融工具,二是百度本身是一个流量和营销入口,因此与基金合作推出百发、百赚、沃百富以及面向企业的小贷产品,是其这两年重点做的事情。做“百度股市通”在信息数据层面进一步完善了百度互联网金融的版图,这是其所擅长,也有商业价值,比如未来做个性化收费版本、可以成为百度互联网金融产品的销售渠道、甚至百度也有可能自己做一家证券机构,直接为股民提供全方位的服务。
可以看到百度股市通整合了不少传统金融机构的数据和服务,比如合作券商核心操盘内参等等,未来不排除会引入专业的操盘手或者分析师进入给股民做咨询服务。这也迎合了百度要“连接人与服务”的趋势。
小结一下:百度股市通是百度大数据业务进入金融领域的开始,它为百度在互联网金融上补齐了“信息”这一环,百度在自然语言处理、深度学习上的基础技术是这款选股助手的基础。
微博@互联网阿超 微信 罗超(luochaotmt),扫码来关注: