事情是这样的——
前段时间和老朋友艾瑞咨询沟通,了解到一个有意义的需求 —— 为研报集成类产品艾瑞智慧增加图表搜索功能。
众所周知,艾瑞咨询在中国网络经济领域有十余年的积累,拥有30多个细分行业的研究成果,还集合了其他机构关于网络经济的数据和报告,为客户提供全面网络经济研究成果和行业发展信息。
但上万份报告,怎么看得过来?
为了让客户更方面地浏览研报,艾瑞咨询推出了艾瑞智慧这款产品,海量精品报告一键式查询。
然而,在后期用户调查过程中,发现了一个有意思的结论,客户浏览一份研报大概花费3分钟,其中80%的时间停留在图表页面,并且保存研报的方式,80%以上选择直接截取关键图表。
艾瑞的小伙伴儿立刻开起了脑洞:如果能够提供图表搜索功能,让客户能够直接定位图表,是否能够极大提高客户浏览研报的效率?
如果让客户批量浏览高质量图表,是否能提高研报的利用效率和影响力?
再增加图表下载的功能,是否能为客户提供附加价值呢?
……
说干就干,正是带着这样的期待,找到了文因互联团队。希望给研报系统加一点智能。
文因互联的技术团队对艾瑞提供的样例分析完毕,制定出技术方案,完成核心算法。在双方高效的沟通配合下,项目实现了短时间内快速上线。
上线后,图表提取系统自动处理了所有的报告,并提取出数万张图表,同时提供了多维度的筛选方式。
那么来看看现在的搜索有哪些变化吧。
举个例子。
原来查找一张图描述生鲜电商的发展情况,要先找到生鲜电商的研报,再一页页翻看,找到相应的图表截屏保存,耗时多且麻烦。
现在直接输入关键词,报告库中所有相关描述的图表就能够呈现在眼前,生鲜行业的市场规模、产业链、行业图谱等情况一目了然。
尤其是有一些图表原来可能藏在另一份看起来不相关的研报中,通过其他深层次关系关联而无法被直接搜索获取,现在通过图表的解析、图表信息的结构化可以便捷地找出来。
据下图所示,你可以根据报告年份,全部行业,热门概念一键搜索研报图表。
(感兴趣可点击体验艾瑞智慧产品)
客户一秒钟就可以获取大量优质的研报图表内容,搜索效率倍增,艾瑞智慧产品的日活以及留存率也得到了极大的提高。
此处应有掌声。
为你的系统安装图表搜索小零件
当然,故事还没完。
市场上每年都会产生大量的研报,仅2016年就发布了26万篇研报。那么多的研报,怎么看?
文因互联统计了3000多份研报,解析出图表将近5万张,平均每份研报含有15张左右图表。
如果想要看到这些图表,意味着需要从头到尾阅读一遍研报,工作繁忙的时候,往往不会有耐心一一打开去仔细阅读。
如果这其中只有1/10的研报被打开,意味着大概有350万张左右图表静静躺在角落,没有人知道它们描述了什么,这些有价值的素材就深藏在没有被打开的海量研报里,这是对研究人员智慧的极大浪费。
另一方面则是市场对图表数据资料的普遍渴求,由于图表的直观性特点,1秒就可以从图表中看到市场空间的变化,一张图就能阐述清楚产业链情况。比起文字,图表往往更具易读性和传播性,很多人都喜欢通过图表得到自己希望了解的信息。
很多研报机构都针对研报做了详尽的分类和标注,但这些仍旧停留在粗颗粒度的文章层面,没有对研报内容进行更细粒度的提取,从而很多有价值的信息都没有被有效利用。
如何提高效率?
一篇结构明晰的研报可以拆解成各种小部分,比如券商研报中企业的目标价,可以用作预测股价走势;一致性预期可以用作买入决策的依据;对标企业、行业龙头可以用于企业分析……
这些研报中的组成部分可以拆解成更加细粒度的功能点,批量自动提取,按不同维度检索,将极大提高效率。
信息的提取与检索正是文因互联专注的领域。
仅拿图表提取作为示例。
图表提取的难点主要在于,图表的识别、定位和切割,每一页报告中图表的位置和大小都是不确定的,人可以一眼看到报告中哪里是图表,机器却不知道,所以先要让机器识别出图表的位置。识别出图,还要能准确地找到图表,构建图表的索引和查询的优化。
如果从零到一单独开发,需要至少三个月的时间,而文因互联将图表提取和搜索技术打包成了一个可以快速部署的小零件,能最短时间部署上线。
如果你想为你的研报系统加一点智能,欢迎成为第一批天使客户。添加商务联络人微信,回复【图表搜索零件】。
如果也有对研报其他信息的提取需求,也欢迎沟通。
研报信息提取与搜索专场活动
如果你想高效率浏览研报、想沉淀研报挖掘存量数据价值,希望加强研报系统的语义搜索功能,想要定向提取研报转为结构化数据……
也欢迎来参加文因互联与艾瑞咨询联合举办的第26期智能金融沙龙·研报信息提取与搜索专场。
时间:暂定5月12日周六 14:30~16:30
地点:报名通过后,将于活动前三天通过短信告知
扫码即可报名
发表回复