语义搜索与金融领域的结合

之前,我们在3月份探讨了人工智能与量化交易的结合以及人工智能如何辅助金融相关报告的自动生成,而关于语义搜索的这篇迟迟没有完稿。一方面自己没有想清搜索能为金融带来多大的价值,其次是希望能用真正的产品说话,用产品告诉大家我们认为的搜索与金融结合是什么样子。

金融从业研究者的日常工作之一就是搜集海量信息,再整理和分析其中内容;然而在多次与他们沟通需求后,大多数人会提到上下游分析,对标企业研究,竞争对手研究,企业亮点/风险点分析等等。我们用将近1个月的时间试图解决这些场景问题,可想而知,这些能直接带来价值的需求并不是短时间可以解决的,不仅需要大量的数据储备与清理工作,还需要专业的业务逻辑。但反过来思考,如果有一个在数据层面上轻量级的搜索应用,将复杂逻辑判断交给用户去完成,是不是就可以完成上述任务?无论是竞争对手还是上下游产业链,都交给搜索去解决,于是就有了现在这款搜索产品。

语义搜索现状:

理想中的语义搜索会透过现象看本质,准确地捕捉到用户搜索语句背后的意图,并以此来进行搜索,更准确地返回最符合其需求的结果。然而理想很丰满,现实很骨感,许多年来的相关产品无不是风声大雨点小。

从技术角度看,一个C端可用的语义搜索难度极大,涉及几乎人工智能领域中的所有环节,并且需要很精细的工程调优;从产品角度看,使用场景很尴尬,有价值的搜索往往是一系列链式、多阶逻辑的复杂搜索,在语义搜索无法提供更好的结果前,让用户制造高成本的搜索是不现实的,与其搜索“连续三年净利润超过1000万的新能源概念股”,不如直接用终端产品过滤查找来得快。(况且主板上的大量散户也根本不会这么问)

目前能称之为产品的语义搜索大多集中在非常特定的领域,比如国内外有很多公司将语义搜索用于医疗、法律等领域。C端的产品大多将语义技术嵌在一个已有的产品中,比如在淘宝可以直接搜索北京到郑州的机票,淘宝也在自动分析用户的评论,并将其中的关键信息用于搜索引擎优化。一年前异常火热的Magic模式最终也只能应用在简单的吃喝玩乐问答上,其中语义搜索的目的其实是为了降低人工问答的成本,再将问题分类并分发到特定的客服上。

于是我想语义搜索的落地在现有的技术阶段要考虑这两点,一是将搜索内容限定范围以限制技术开发成本,二是将搜索行为转变成其他产品形态以降低用户自由交互所带来的复杂性。

具体到金融领域上,我认为是这么处理:

  1. 提供不同类型的查询(比如企业、基金、事件等),将信息切片后再聚合,提供纵览的可视化元素,比如影视传媒相关定增的平均市值和融资市盈率。
  2. 将复杂查询交给用户完成,用户想找VR的上游,我们提供不了准确上游,但可以推荐给他摄像头的企业。用户想做一些复杂的过滤,我们提供一个方便的交互界面,交给用户去操作。
  3. 将需要反复查询的信息关联,比如查看信业基金的所有新三板投资项目,需要将信业旗下的有限合伙,有限合伙管理的基金,信业高管又单独成立的一些基金全部连起来;再比如投资人会关心某企业是否有持股平台,有的话它还做了别的投资没有。

    信业基金投资新三板概况
    信业基金投资新三板概况

我们目前的产品已经完成了部分,正不断努力去完善这里提到的功能。但在此之上,我们还能将语义搜索如何应用,真正的带给用户惊喜呢?

我们来事后诸葛亮几个挂牌公司的例子:

  • 山东疫苗案—实杰生物与沃森生物。2016年2月份疫苗案开始被媒体逐渐报道;3月7日,实杰生物总经理辞职;同月18日,山东药监局开始报道破案线索;21日晚上药监局公布实杰生物涉及此案;22日,实杰生物与其母公司沃森生物(创业板)同时停牌。通过实杰生物的股转说明书,我们可以知道它是从事疫苗代理销售,冷链管理的;它的主要疫苗包括此次案件涉及的产品;它的第二大客户便是山东省疾病预防控制中心。之后,从事同类业务的中小板上市公司鹭燕医药也涉及此案,24日刚开盘便跌了5.80%。通过这一系列信息,即使不能建立直接联系,但至少也可以警惕相应股票发生重大风险。
  • 金蛋理财借壳南京软智挂牌新三板。2015年6月3日,南京软智同意向邓巍等两名外者以1块钱的价格发行2000万股,同时辞去董事职位,并提名这三位为新进董事。1块钱的定增往往是对内部员工的激励措施;邓巍所拥有的公司钱得乐和南京软智的经营范围类似;南京软智的净资产很低,在13年年底只有300万。有这三个基本数据后,股东决议定增的公告一出来我们就应当能判断出借壳上市,而真正的收购公告在6月18日才公布出来。
  • 《叶问3》票房造假—十方控股与神开股份。《叶问3》的投资方是快鹿,控制着神开股份和十方控股这两家上市公司,与快鹿关联的是P2P公司金鹿财行,充当资金端,快鹿在影视业的关联公司是合禾影视,是资产端。2016年2月,十方控股和神开股份相继认购《叶问3》的票房收益权。票房作假可拉升二级市场股价来获得利益,并弥补P2P的融资成本。[1] 但众所周知票房造假是国内普遍现象,为何又在此时此刻被揪出来?3月25日成立的中国互联网金融协会的主要职责就是监管P2P市场,很难讲这里面没有联系。

更多的例子在二级市场、期货市场、货币市场频繁出现。AlphaGo的胜利对科大智能的影响(尽管科大智能并非做人工智能的),智利地震对铜期货的影响,中东危机对整体货币市场的影响等等。这样的商业尝试有很多,比如很著名的Kensho,但我想现有的技术还不足以建立这种强逻辑推演,即使建立也难以让研究员们相信其准确性。但如果能利用语义技术将诸多线索联系在一起并展示出来,即使不进行更深一步分析,或许也可以满足用户。就像在国外破案电影经常看到的线索墙(Mosaic Investigation Wall)一样,将金融投资所需的诸多要素进行弱语义关联,以某种形态一口气展示,也许就是语义搜索(甚至人工智能)带给金融领域的最好礼物。


评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注