王丛 – 文因互联

老中医与老司机:投资与机器学习

从事金融创业有半把年了,说实话依然是个门外汉,也只是从丝毫不懂到能明白一些名词的地步而已。期间与非常多的金融从业者交流过,愈发觉得这行业就像中医(绝对是褒义),越是资深的人越从内在机理说明问题,听诊把脉,感性理性并存,一些投资逻辑听起来甚至就像养生。学问太深,我只得管中窥豹,但发觉其中一些投资原则和机器学习的常用策略简直如出一辙,此篇文章就对这些“普世”道理随便侃两句。
 
大体来讲,机器学习是通过某种算法去解决一个优化问题,最终求得能达到普遍最优解的模型,这里面的一个重要概念就是模型要具备泛化能力,不能overfitting,意思就是有的模型针对某类数据和任务最优,可能换一拨数据就不灵了。转神一想,投资也是一样的。寻找某种策略,在风险与回报中谋求平衡,取得最优,其中风险则总与回报成正比。
 
特征选择与K线
K线特征
经典的机器学习重点在于特征选择,数据理解的深,特征选的好效果自然就好。而早在100年前霓虹国就有大神在米市研究出蜡烛图,也就是后来说的K线,遇到“十字星”,就会上涨,而看见“三只乌鸦”则会下跌。当时富豪们就是在做这些特征工程,当然特征玩的简单自然容易被别人炒走,慢慢就有了“十日线穿五日线”等无穷无尽的特征。(这里参考了布娜新老师的一篇文章,大家可以订阅,公众号非常有货)
 

继续阅读 “老中医与老司机:投资与机器学习”

对标A股?让文因搜索帮帮忙

自从文因搜索上线后,很多用户向我们提了应用场景、产品细节等多方面的建议,没有这些帮助,我们不可能将产品逐步完善,在这里,我们由衷感谢大家的反馈与支持!


我们这次又更新了什么功能呢?

找A股对标公司。重要程度不用多说,基本上每家企业的融资BP都会有一页描述同业务A股公司的市值及营收状况,这是投资人绕不开会问的问题。然而三板企业各行各业,需要非常资深的行业知识才能说清应该对标到哪些企业。而官方的固定分类很难划分这千奇百怪的市场,通过行业分类找对标是行不通的。那我们是怎么做的呢?我们通过机器学习分析多种行业分类,主营业务和主要产品,「 自动挖掘 」了与某企业业务最相近的其他企业,在每个企业详情页的下方就可以看到相似企业。有了这部分数据后我们还可以进行跨板块的搜索,想知道国内做“影视传媒”的上市公司都有哪些?操作很简单,仅需在筛选中勾选主板,再搜索“影视传媒”即可。

2.pic

继续阅读 “对标A股?让文因搜索帮帮忙”

金融语义分析的经验与总结

2016年6月25日在文因互联举行了以“金融语义分析的经验与总结”为主题的智能金融沙龙活动。参加沙龙的人员背景各不相同,有VC、 舆情分析师、研发工程师、学生等等。活动主要分为两部分:文因互联的CKO(首席知识官)——王丛主讲了“金融语义分析的经验与总结”;参会人员对目前金融语义分析状况进行自由讨论。

webwxgetmsgimg (6)

沙龙活动开始主讲人王丛首先进行了自我介绍,并且介绍了自己职位名称的来历:CKO中 K 是“知识”(Knowledge),自己博士期间研究的是知识工程,文因互联作为知识管理的公司,知识是很关键的,所以就叫CKO。由于文因互联现阶段产品需要用到语义分析的技术,所以王丛结合文因产品的发展历程讲述金融语义分析曾经走过的坑,又是怎么跳过坑,发现前方的路,以期为后来人提供些许启发。

文因搜索的入口是 wenyin.io

继续阅读 “金融语义分析的经验与总结”

语义搜索与金融领域的结合

之前,我们在3月份探讨了人工智能与量化交易的结合以及人工智能如何辅助金融相关报告的自动生成,而关于语义搜索的这篇迟迟没有完稿。一方面自己没有想清搜索能为金融带来多大的价值,其次是希望能用真正的产品说话,用产品告诉大家我们认为的搜索与金融结合是什么样子。

金融从业研究者的日常工作之一就是搜集海量信息,再整理和分析其中内容;然而在多次与他们沟通需求后,大多数人会提到上下游分析,对标企业研究,竞争对手研究,企业亮点/风险点分析等等。我们用将近1个月的时间试图解决这些场景问题,可想而知,这些能直接带来价值的需求并不是短时间可以解决的,不仅需要大量的数据储备与清理工作,还需要专业的业务逻辑。但反过来思考,如果有一个在数据层面上轻量级的搜索应用,将复杂逻辑判断交给用户去完成,是不是就可以完成上述任务?无论是竞争对手还是上下游产业链,都交给搜索去解决,于是就有了现在这款搜索产品。

继续阅读 “语义搜索与金融领域的结合”

新闻自动生成——人工智能正在逐步走进金融领域(其二)

上期,我们讲述了人工智能与量化交易的结合——主要利用机器学习,自然语言处理,以及最近火热的知识图谱技术,将海量异构信息分析,为投资者建立交易投资的预测模型。
本期,我们来关注成本问题,思考下人工智能如何辅助金融新闻、研报、投资意向书的生成。尽管交易才是金融领域的核心,但如果降低了工作的时间成本,减少数字罗列、整理、反复Copy-Paste的繁琐工作,分析员们便有更多的时间进行深入分析,早先一步准备材料并上会,便早一步握住了商机。此外,对于我国的上亿股民来说,信息传达的快速与准确是核心需求,机器自动生成的新闻便可提供客观实时的市场资讯。

继续阅读 “新闻自动生成——人工智能正在逐步走进金融领域(其二)”

人工智能正在逐步走进金融领域

随着互联网时代的深入发展,我们获取的各种数据都在无限膨胀,远远超过了人类大脑的处理能力,于是机器学习技术成为更利于发展的投资策略。以机器之手在互联网中抓取一个领域的数据和信息,将这些信息通过人工智能系统进行细致的分拣和筛选,进而得出最终的结论和决策。之后再将这些已被梳理好的决策分析反馈给该领域工作人员。接下来我们会分三期就人工智能和金融领域的结合做一系列分析,厘清人工智能在金融领域已经都做了哪些尝试,以及成果:

1.运用人工智能进行量化交易;
2.人工智能辅助金融新闻、报告、投资意向书的半自动化生产;
3.人工智能进行行业、企业的语义搜索。
 
本文专注于【运用人工智能进行量化交易】,后两者会在之后的微信公众号文章推出。
量化交易从很早开始就运用机器进行辅助工作,分析员通过编写简单函数,设计一些指标,观察数据分布,而这些仅仅把机器当做一个运算器来使用。直到近些年机器学习的崛起,数据可以快速海量地进行分析、拟合、预测,人们逐渐把人工智能与量化交易联系得愈发紧密。
我们可以把量化交易按照人工智能的子领域(机器学习,自然语言处理,知识图谱)分为三个阶段。

一.机器学习

022901
分析员们对财务、交易数据进行建模,分析其中显著特征,利用回归分析等传统机器学习算法预测交易策略。这种方式有两个主要弊端,其一是数据不够丰富,仅限于交易数据,更重要的是它受限于特征的选取与组合(Feature Engineering),模型的好坏取决于分析员对数据的敏感程度。此外一种做法是,模仿专家的行为,选择某一领域的特定专家,复制他们的决策过程,并导入可重复的计算框架。
 
代表公司:
Snip20160506_5
总部位于纽约的Rebellion Research在2007年推出了第一个纯人工智能(AI)投资基金。该公司的交易系统是基于贝叶斯机器学习,结合预测算法,响应新的信息和历史经验从而不断演化,有效地通过自学习完成全球44个国家在股票、债券、大宗商品和外汇上的交易。
日本的初创公司Alpaca,他们的交易平台Capitalico利用基于图像识别的深度学习技术,允许用户很容易地从存档里找到外汇交易图表并帮忙做好分析,这样一来,普通人就能知道明星交易员是如何做交易的,从他们的经验中学习并作出更准确的交易。
伦敦的对冲基金机构Castilium由金融领域大佬与计算机科学家一同创建,包括前德意志银行衍生品专家、花旗集团前董事长兼首席执行官和麻省理工的教授。他们采访了大量交易员和基金经理,复制分析师、交易员和风险经理们的推理和决策过程,并将它们纳入算法中。
坐落在香港的Aidyia致力于用人工智能分析美股市场,依赖于多种AI的混合,包括遗传算法(genetic evolution),概率逻辑(probabilistic logic),系统会分析大盘行情以及宏观经济数据,之后会做出自己的市场预测,并对最好的行动进行表决。
全球最大的对冲基金桥水联合(Bridgewater Asspcoates),使用一种基于历史数据与统计概率的交易算法,让系统能够自动学习市场变化并适应新的信息。与其类似的公司还有Point72 Asset,Renaissance Technologies, Two Sigma。

继续阅读 “人工智能正在逐步走进金融领域”