​深挖另类数据,完善知识图谱,「 熵简科技」想建造投资者与大数据之间的桥梁

证券行业迎来数据爆炸时代,传统的金融数据服务商积累了海量高质量的结构化数据,并按照一定逻辑分类展示给用户。不过高质量的数据只是研究基础,如何在这基础之上快速给出准确的投资判断,更多取决于金融行业研究人员脑中的投资经验。 

不过纯靠人力进行数据分析效率较低,而且分析师也存在认知边界。近几年大数据和人工智能技术的飞速发展,使得数据分析效率的大幅提升成为可能。成立于2017年7月的熵简科技就是基于对结构化、非结构化数据的分析和深度挖掘,为资产管理公司提供智能投研服务。

智能投研简单来讲,就是借助自然语义处理和机器学习,将大数据变成有利于投资者进行投资决策的小数据。熵简科技CEO费斌杰告诉36氪,智能投研有两大核心,分别是另类数据和知识图谱。

另类数据(Alternative Data)意指可能影响投资决策但又不属于市场统计范围之内的数据,而ACTD是另类数据中的一个重要分支,全称叫做Aggregated Consumer Transaction Data。熵简科技通过对各大电商平台进行持续的数据监控,能够对消费行业上市公司业绩作出前瞻性预测。除了ACTD之外,费斌杰提到,通过对Github上开源项目的pull/push数据进行持续监控,熵简科技能够前瞻性地预判科技型公司的产品开发进度和上线日期,这对于区块链、人工智能行业的投资者来说是一个重要的基本面前瞻分析指标。

在数据源方面,熵简科技搭建了稳定的数据采集体系,可实时监控1200+个数据源。费斌杰表示,爬虫技术相对成熟,技术难点更多体现在大数据的存取与分析上,尤其是非结构化数据的处理。

如果说另类数据是智能投研的原料,那么知识图谱(Knowledge Graph)就是智能投研的大脑。所谓“知识图谱”是将实体、属性、关系等非结构化数据固联起来,进而为投资决策提供逻辑支持。体现在投资行业,就是研究员可以将相关的行业、产品和公司等多方因素联系在一起,当观察到某个因素发生变化时,即可以根据关系链推理出观点和预测,为投资决策提供支撑。

熵简科技联合创始人刘佳琪告诉36氪,完善的知识图谱是AI在投资研究中应用的必要条件,金融行业最不缺的就是海量的高质量研究资料,通过对研报、公告等文本信息的深入挖掘,形成能够自我生长、自我学习的知识图谱体系,这是智能投研的重中之重。

知识图谱作为智能投研的灵魂,很大程度上决定了产品的价值。熵简科技现在拥有一个5人投研团队,他们组建起了多个行业的知识图谱,并不断完善它们。基于另类数据和知识图谱,熵简科技现在可以提供数百家上市公司的追踪和分析模块。

除了为现有客户提供好售前和售后服务,熵简科技需要同时投入人力物力,开发新的知识图谱并接入新的数据源。费斌杰表示他们正在扩招技术团队,以保证为客户提供高质量的智能投研服务。

智能投研的概念兴起已有一段时间,市面上也有相关产品问世,但大多是根据市场热度等指标对信息作简单处理,对于投资者的价值较为有限,距离产品成熟化还有很长的路要走。国外的智能投研产品发展相对较快,有Palantir Metropolis、Visible Alpha、Trefis、Alphasense、Dataminr、Kensho 等。国内智能投研公司近些年也纷纷面世,如通联数据、数库科技、文因互联等。

熵简科技现已完成1000万元的天使轮融资,投资方为清泉石资本,预计下个月即将开启新一轮融资。公司核心成员均来自清华大学以及一线互联网公司,合伙人团队此前分别就职于Bloomberg以及嘉实基金等国内一线公募、私募投资机构,对智能投研有着深刻的理解。

熵简科技招聘邮箱:hr@entropyreduce.com

Be the first to comment

Leave a Reply

Your email address will not be published.


*