文因君 – 文因互联

文因互联与正信用共建数据实验室,优化企业征信场景化应用

8月22日下午,正信用与北京文因互联科技有限公司签署战略合作协议。正信用副总经理胡海、洞析项目负责人马涛、产品经理何发荣,文因互联创始人鲍捷、数据经理贺余龙、数据提取工程师王爽、商务经理朱衡利,出席签约仪式。

继续阅读 “文因互联与正信用共建数据实验室,优化企业征信场景化应用”

智能金融决战前夕,我们架起的“步枪”和“刺刀”|专访

作者: Just (王金许)

首发公众号:AI科技大本营

对@西瓜大丸子汤而言——在新浪微博上,他有 5.2 万个粉丝,虽然没有加 v 认证,但也算是小 v 了,平常发一些创业感想、技术思考、生活碎记,还有诗……总之内容像是一锅大杂烩。——“黑猫白猫论”、“农村包围城市”等党在探索中国改革道路时留下的经典理论是他在谈论公司发展时的高频词。

他应该从那些文史里汲取了不少养分。今天早上他读的书是《参谋助手论——为首长服务的艺术》,从书名上你不难猜想大概内容,他发在微博上的评语是“片言苟会心,掩卷忽而笑”。此刻,在他窗户朝南的办公室里,东北方向的两面墙被大书架所占据,其中不乏有《史记》、《韩非子》等书籍。对了,屋里还有一只刚入职三个月的猫,阿丑。

采访就要开始了,但他突然打断向身边同事询问其他两个同事的去向,“在下午两点,(他们)必须——高度一致。”

1.

鲍捷是@西瓜大丸子汤的现实姓名,他的实际身份是文因互联的创始人,他们提供智能金融技术与服务。实际上,这家创业公司是他的第二次创业,2013 年初次创业时,他们花了两年时间做了一个叫“好东西传送门”的推荐引擎,但始终无法变现。随后,在综合各种因素排除其他创业选项后,团队将目光转向智能金融。

他们希望做出“金融神经系统”,这与其他企业宣传的“金融大脑”等标签表意趋同,所不同的是其内核,文因互联是以知识图谱为基础来构建整个系统。

鲍捷将其划分为四个阶段。最基础的层次是流程的自动化,比如审计、信贷、监管、证券的自动化。他们已为审计事务所提供了从财务审计到法务审计的服务,如财务数据自动化提取和自动化复合;为证券类客户做了自动财务健康度评测系统、风险评测系统。

其次,自动化之后会带来知识资产化——不止数据,鲍捷认为知识才是金融机构的最核心。现在大量文档中的知识是由人工读取然后储存在大脑,而当机器有了自动化处理能力后,知识会越来越多沉淀在机构系统里。当然,这个过程中除了 NLP 技术外,可能还有区块链等新技术的参与。

再从机构内部扩大到机构之间的数据交换层面,有了金融的知识图谱后,中国所有的金融机构、政府、研究机构间会构造出一个巨大的近乎实时的数据分发网络,鲍捷称其为“金融数据高速公路”。

最终要实现从手工业金融到大工业金融的转变可能需要花相当长的时间,他认为 20 年后的金融业会更像软件行业,“以天为单位的数据交换都要缩短到以秒为计,上市公司债券的风险检查从一个月缩短到 5 分钟”。

回到当下行业现状,手工业金融的进阶并非易事。由于金融机构内部目前无法改变 IT 系统,从源头解决金融数据的结构化寸步难行。事实上还可能是倒退的,鲍捷解释说,一部分数据在源头上已经是结构化数据,但机构间交换数据时却转换成了由人工读写的 PDF 文件甚至是扫描件这样的自然语言,“估计有 200 万人力浪费了”。

他们现在所做的是从接口层面帮助交易所、券商、咨询公司、律所机构等做公告、研报、法规、新闻、甚至扫描件的结构化,这是他们当前的一个“核心”工作。

切入点很明确,他们要从阻力最小的单点逐个击破。

2.

要想攻陷每个阵地,需要的是全链条的数据结构化能力,包括财务报表的公开化提取能力,还有公告、研报、法规的解析,解析后再进行实体链接,映射到知识图谱上,之后是规则建模与推理、语义搜索、自然语言问答。

具体而言,文因互联的技术链条主要围绕结构化数据生成和结构化数据使用两部分:

结构化数据的生成首先需要机器理解文档,比如理解自然语言文档和理解图像,那如何提取 PDF 文件中的数字?这又分为数据清洗、恢复篇章结构到段落、提取元素这三大步骤。提取元素后要做年报、研究报告等渠道的数据集成,将其中提到的大量如人名、机构名等“实体”进行实体识别和实体链接,然后形成知识图谱。随后是结构化数据的使用,他们要把不同客户业务系统中的业务规则与这些数据作关联,这涉及到推理、规则引擎等技术。

对应到产品上,由于 AI 本身的高度复杂性,当它与金融等行业属性结合时,面临的则是数量级的复杂度。

“康威定律”的启发在于,一个复杂系统不应该从一开始就追求大而全,而要从一个简单系统开始,注重系统的演化能力。所以鲍捷认为基于经验观察设计出来的 2B 产品几乎无一例外都会失败,即便这类产品的幕后推手是大企业也会“完蛋”,这类有实力、有生命力的产品都需要从实践案例中总结。

以史为鉴,他拿俄中两国改革方案作类比:俄国改革是“休克疗法”,由诺贝尔奖获得者设计的方案却在现实执行时一塌糊涂,中国改革是“摸着石头过河”就成功了。他认为做人工智能产品理应属于后者。

他们现在还处在做公报和研报解析的初级场景上,鲍捷提及场景跃迁的概念,认为他们的应用场景半径会从 10 亿扩展到 100 亿甚至 1000 亿。“当你从实践中总结出来的那些点逐渐到位时,就会发现技术不断在解锁场景,场景其实一直在那里,只是因为技术没有到那里。”既然如此,做好结构化数据、自然语言理解语义引擎等大量的基础技术工作不可或缺,且无捷径可走,“认不清楚这一点的,就不要在这个行业混了。”

行业竞争已经到了非常激烈的程度,这是鲍捷对行业趋势的感受。他近期写了几篇未公开发布的存稿,其中一篇完稿于 5 个月前,文中写“2019 年会是智能金融的决战年”,但他现在提前了这一时刻,“今年第四季度就是决战季”。

时间的提前是因为他觉察到金融投资的寒冬将至,届时这一阶段的对决会在整个行业准备不足的状态下进行。他没有给出有足够说服力的依据,但笃定于自身对行业竞争在一年之内尘埃落定的判断,“大多数人还没有意识到战争开始的时候,就已经结束了,明年这个时候砸 100 亿都没用。”

那文因互联会如何应战?鲍捷告诉 AI科技大本营,取胜的关键在于团队凝聚力,这考验核心团队的攻城能力,以及公司新人的成长性。而在他看来,文因互联团队在三年长征中获得的最宝贵财产就是塑造了一支坚强的核心队伍,身在其中的每个人的要求都是军官标准。

尽管战役是否会如他所料想的那样如期而至还是未知数,“但刺刀已经架在步枪上了,”与采访前告诫他的军官“保持一致”时的相似口吻,首长鲍捷似乎在指示他们要瞄准,“我们会一寸一寸赢得这个市场。”

文因互联CEO鲍捷博士将出席2018全国知识图谱与语义计算大会并作重要报告

“全国知识图谱与语义计算大会( CCKS: China Conference on Knowledge Graph and Semantic Computing )由中国中文信息学会语言与知识计算专委会定期举办,是国内知识图谱、语义技术、链接数据等领域的核心会议。会议聚集了知识表示、自然语言理解、智能问答、知识抽取、链接数据、图数据库、图挖掘、自动推理等相关技术领域的重要学者和研究人员。
本次会议的主题是:知识计算与语言理解。文因互联 CEO 鲍捷博士将出席会议并作重要报告。”

继续阅读 “文因互联CEO鲍捷博士将出席2018全国知识图谱与语义计算大会并作重要报告”

文因互联入驻京东AI加速器:以知识图谱赋能金融机构

导语
文因互联成立于2015年,是国内领先的智能金融解决方案提供商。团队在知识图谱技术、自然语言处理技术、金融知识建模等方面有深厚积淀。自公司成立以来,文因互联对智能金融的多个分支领域进行了探索,当前的主营业务是基于自然语言处理技术和知识图谱技术,为金融机构提供业务流程自动化和智能化解决方案。
入驻京东 AI 加速器后,将与京东AI加速器的深度合作,共同开发基于企业知识图谱的“银行小微贷款流程自动化系统”。同时,京东AI加速器将帮助文因互联与京东金融寻求合作,探索金融行业知识图谱领域深入合作的可能。

继续阅读 “文因互联入驻京东AI加速器:以知识图谱赋能金融机构”

文因互联中标全国股转系统监管科技重点研究项目

“近日,文因互联中标全国中小企业股份转让系统有限责任公司(以下简称全国股转系统)“信息服务平台预研项目”。将基于NLP的知识提取技术在信披核查中的研究,建设一整套可迭代优化的知识提取系统;以及基于NLP的智能搜索技术在市场服务中的研究,建设一整套可迭代优化的智能搜索系统。 ”

作为经国务院批准,依据证券法设立的继上交所、深交所之后第三家全国性证券交易场所,全国股转系统在中国证监会领导下,始终贯彻创新、协调、绿色、开放、共享的发展理念,落实《国民经济和社会发展第十三个五年规划纲要》关于“深化新三板改革”的战略部署,深化市场分层,完备市场融资制度,改善市场流动性,完善和充分发挥服务中小微企业,特别是创新型、创业型、成长型企业的功能,全力服务供给侧结构性改革,促进创新创业、结构优化和存量盘活,激发经济增长新动力。

文因互联成立于2015年,是国内领先的智能金融解决方案提供商。团队在知识图谱技术、自然语言处理技术、金融知识建模等方面有深厚积淀。公司成立以来,在智能金融的多个分支进行了探索,在自动化监管、自动化审计、银行数据治理和知识图谱建设等场景上已有成功案例,通过业务场景的智能升级,赋能金融机构向新价值链的跃迁。

加入智能金融交流群
添加微信群小助手微信号 wenyinai42,附上姓名、所属机构、部门及职位,审核后小助手会邀请您入群。
文因商务合作
请另联系微信号:wenyinba

专访 | 文因互联:从「金融数据」到「金融知识」

作者 Synced

机器之心原创

作者:邱陆陆

存储了一份财务报表的计算机存下了一条「数据」,而持有这份财务报表的分析师拥有了一份「信息」。其间的区别是,分析师可以通过阅读财务报表得到相关的「知识」并依此作出投资决策。

存储了三万份财务报表的计算机同样存下了三万条「数据」,而持有三万份财务报表的分析师却不再拥有三万份「信息」。原因十分简单:计算机的内存是线性的,人的处理分析能力却不是——即使有三万份报表摆在我的眼前,我也只能眼睁睁看着其中的大部分停留在「数据」的状态无能为力。

除非……计算机可以帮助我吗?哪怕我们并不说同一种语言,计算机并不能「理解」人类所谓的语义是什么。只要它把数据按照一定规则、以一种人类能理解的方式进行组织,我们是否也可以从三万份「数据」里获得等量的「信息」与「知识」?

这就是文因互联希望完成的工作:对纷繁复杂的数据进行处理,归纳总结出金融知识和逻辑,辅助解决各种金融场景下的问题。

继续阅读 “专访 | 文因互联:从「金融数据」到「金融知识」”

捣鼓了一个图表搜索小零件,给你的研报系统加一点智能,了解一下?| 活动预告

事情是这样的——

前段时间和老朋友艾瑞咨询沟通,了解到一个有意义的需求 —— 为研报集成类产品艾瑞智慧增加图表搜索功能。

继续阅读 “捣鼓了一个图表搜索小零件,给你的研报系统加一点智能,了解一下?| 活动预告”

我们研究了2017年3653个上市公司高管的离职原因,原来…

在普通投资者的大脑中,A 股上市公司通常被抽象为6位股票代码、涨跌不休的红绿曲线,很少会想起,大盘背后其实是一个个鲜活的个体,除了行业前景、资本风向等基本面,人事变动也是分析企业发展时必须留意的因素。

一天,人事变动事件公告提取小组的程序媛小姐姐被提取结果逗乐了,继 “世界很大,我想去看看”这一率性离职宣言在网络上爆红之后,又一位高管 “为寻找最真实的自己” 走向了另一片天地。

继续阅读 “我们研究了2017年3653个上市公司高管的离职原因,原来…”

活动邀请|5.5亿美元,金融AI史上最大收购:Kensho 的模式可复制吗?

当地时间3月7日,美国智能投研先行者Kensho被标普全球(S&P GLOBAL)以5.5亿美元收购,以现金加股票的方式。同时,这也创造了迄今为止华尔街最大规模的人工智能公司收购交易。

Kensho的自我定位是数据分析与机器学习公司,为金融、国家安全、医疗健康行业解决分析问题。

其中,它在金融领域的成就更广为人所知。旗下拥有一款名为Warren分析软件,主要利用大数据和机器学习,将数据、信息、决策进行智能整合,并实现数据之间的智能化关联,从而提高投资者工作效率和投资能力。

如果你对人工智能+金融感兴趣,这些问题你一定也好奇:

  1. 从公司融资角度看 kensho 被收购事件对国内智能投研对标创业公司的影响?
  2. 从创业者角度看,为何 kensho 没能成长为一个独角兽,甚至百亿市值的公司?
  3. 如何评价kensho的产品,它对当前金融领域的影响?
  4. kensho的产品及技术在国内是否可复制,对国内的追随者们有哪些在赛道选择、商业模式上的启发?
  5. 人工智能+金融什么时候能服务于大众群体,它未来的形态会如何发展?

……

本周六,第23期智能金融沙龙,我们特别邀请到文因互联CEO 鲍捷博士,和大家深扒“华尔街之狼” kensho的蜕变之路,挖掘背后模式的潜在商机,展望AI+金融模式的未来发展 ,欢迎报名,不要错过。

继续阅读 “活动邀请|5.5亿美元,金融AI史上最大收购:Kensho 的模式可复制吗?”

自动报告+金融问答,这里有一种更快的资讯获取方式

作为一家人工智能公司,文因互联一直在思考如何将知识图谱应用到金融领域。

金融业作为百业之母,与所有的行业都深深交织在一起,蕴含着海量数据,但大量数据都是以非结构的形式存在,无法利用机器进行高效处理直接使用。

虽然技术不断发展,但这些数据收集、研究的工作却还是依赖人力完成。如果能实现数据的结构化,就可以减少重复的手工体力劳动,帮助金融从业者提高工作效率,从而聚焦在更有价值的工作上。而知识图谱、信息提取、自然语言处理这些正好是文因最擅长的领域。

在2016年,我们已经可以从公告、年报、研报等公开数据中,提取行业、公司、人物、财务数据等实体概念和实体关系,开启金融知识图谱构建等相关工作。但是以何种方式交付给用户使用,我们做了很多尝试,这些尝试中有成功也有失败,但最终都为要做的事情打下更深的基础。

继续阅读 “自动报告+金融问答,这里有一种更快的资讯获取方式”