分享
金融服务行业智能投研调研报告:人工智能在投研的应用-20190609-中泰证券-23页.pdf
下载文档
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
金融 服务行业 智能 调研 报告 人工智能 应用 20190609 证券 23
请务必阅读正文之后的重要声明部分请务必阅读正文之后的重要声明部分 证券研究报告/行业深度报告 证券研究报告/行业深度报告 2019 年 06 月 09 日 2019 年 06 月 09 日 金融服务 人工智能在投研的应用-智能投研调研报告 评级:增持(维持)评级:增持(维持)分析师:戴志锋分析师:戴志锋 执业证书编号:执业证书编号:S0740517030004 电话:Email: 分析师:陆婕分析师:陆婕 执业证书编号:执业证书编号:S0740518010003 电话:Email: 基本状况基本状况 上市公司数行业总市值(百万元)行业流通市值(百万元)行业行业-市场走势对比市场走势对比 相关报告相关报告 2019.05.07 2019.04.10 2019.04.08 重点公司基本状况 重点公司基本状况 简称 股价(元)EPS PE PEG 评级 2015 2016E 2017E 2018E 2015 2016E 2017E 2018E 备注 投资要点投资要点 智能投研的产业链分析:智能投研的产业链分析:(1)智能投研是人工智能在投资研究及其他资本市场相关领域的应用,其核心是提升金融数据的分析能力,提高人工的工作效率。(2)智能投研的产业链涉及数据的获取、处理及应用。数据源包含传统金融数据、爬虫数据及另类数据等。中游主要是数据的采集和标准化。下游是数据的需求方和应用场景,包括投资机构、监管部门及非金融机构等。(3)智能投研行业的参与者包括传统的金融数据服务商、创业公司、互联网巨头及投资机构内部研发。三种商业模式:三种商业模式:(1)金融文本处理工具。针对特定场景的金融数据处理的工具,所处理的文本以标准化的金融文本为主,主要的功能是审核检查。客户以证监会、交易所等监管职能部门,其次是券商投行部门、银行信贷审核部门等,交付方式以项目制为主。(2)一级市场数据库。提供全方位了解一级市场公司的数据库和搜索工具。产品的核心是标签体系。目标客户包括一级市场投资机构、券商投行部门及直投部门、银行企业客户部门等。一般采用数据终端或者数据接口的方式交付。(3)二级市场数据库。提供比传统金融数据服务商颗粒度更高的数据产品,重点在非结构化数据的处理。成熟资本市场客户主要是二级市场投资者,尤其是量化投资。国内的客户还包括券商和综合金融集团。底层技术:底层技术:在智能投研中主要应用的人工智能技术包括图像识别、自然语言处理、情感分析、知识图谱等。(1)优势:人工智能拓展了数据来源,大幅提升了数据运算的能力。机器能分析多元、非线性关系,寻找相关性而非局限于因果关系。(2)不足:就现阶段来看,人工智能在有明确边界、规则和目标的场景中,效果更明显。(3)约束条件:数据质量影响智能投研的效果,随着底层数据质量不断提升,智能投研的效果会越来越好。市场空间及行业趋势:市场空间及行业趋势:(1)要从数据服务广义的角度看智能投研的市场空间。在考虑资产管理规模和资产管理机构数量之外,收入的增量空间还包括对数据量、数据维度、数据综合服务的需求提升,以及投资机构之外其他机构对金融数据的需求。从长期来看,智能投研的潜在市场空间远大于现有金融数据行业规模。(2)智能投研的发展趋势。资产管理机构在数据及技术方面的投入增速大于资产管理规模的增速。传统的金融数据公司通过并购整合保持持续的竞争优势。大量创业公司在努力拓展人工智能的边界。成功的智能投研公司在数据服务的广度或深度上超越对手。风险提示:风险提示:金融行业监管政策变化、人工智能技术发展不及预期2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -2-行业深度行业深度研究研究 内容目录内容目录 智能投研的产业链分析智能投研的产业链分析.-4-智能投研的定义.-4-智能投研产业链的供求关系.-4-智能投研行业的参与者.-5-商业模式商业模式.-7-金融文本处理工具.-7-一级市场数据库.-7-二级市场数据库.-8-底层技术底层技术.-8-人工智能.-8-自然语言处理.-9-知识图谱.-10-市场空间及行业趋势市场空间及行业趋势.-11-智能投研的市场空间.-11-智能投研的发展趋势.-12-海外案例分析海外案例分析.-13-数据分析公司 Kensho.-13-资产管理系统 Aladdin.-14-国内公司案例分析国内公司案例分析.-15-庖丁科技.-15-文因互联.-16-犀语科技.-17-视野金服.-18-因果树.-19-烯牛数据.-20-数库.-21-宽拓科技.-22-风险提示风险提示.-22-2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -3-行业深度行业深度研究研究 图表目录图表目录 图表图表1:广义的智能投研范畴:广义的智能投研范畴.-4-图表图表2:传统投研和智能投研对比:传统投研和智能投研对比.-4-图表图表3:智能投研的流程及功能:智能投研的流程及功能.-5-图表图表4:国内外主要的金融数据服务商:国内外主要的金融数据服务商.-6-图表图表5:智能投研相关创业公司融资事件:智能投研相关创业公司融资事件.-6-图表图表6:自然语言处理的四个层面:自然语言处理的四个层面.-9-图表图表7:自然语言生成的三个功能:自然语言生成的三个功能.-9-图表图表8:情感分析的步骤:情感分析的步骤.-10-图表图表9:知识图谱技术的层次:知识图谱技术的层次.-10-图表图表10:建立知识图谱的步骤:建立知识图谱的步骤.-11-图表图表11:主要上市金融数据公司的营业收入(亿美元):主要上市金融数据公司的营业收入(亿美元).-11-图表图表12:资产管理业务总规模(万亿元):资产管理业务总规模(万亿元).-12-图表图表13:海外典型智能投研创业公司:海外典型智能投研创业公司.-13-图表图表14:贝莱德阿拉丁平台的五大功能:贝莱德阿拉丁平台的五大功能.-14-图表图表15:贝莱德的阿拉丁平台的收入及增速(百万美元):贝莱德的阿拉丁平台的收入及增速(百万美元).-15-图表图表16:庖丁科技的四个产品:庖丁科技的四个产品.-16-图表图表17:文因互联的知识图谱能力:文因互联的知识图谱能力.-17-图表图表18:犀语科技的三个:犀语科技的三个产品产品.-18-图表图表19:视野金服的商业模式:视野金服的商业模式.-18-图表图表20:烯牛数据的数据平台:烯牛数据的数据平台.-20-2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -4-行业深度行业深度研究研究 智能投研的产业链分析智能投研的产业链分析 智能投研的定义智能投研的定义 狭义:人工智能在投资研究上的应用。狭义:人工智能在投资研究上的应用。通过人工智能技术拓宽投资信息来源,提高获取信息的及时性,减少基础数据处理的工作量,通过自动化的数据分析,为投资决策提供参考,从而提高投资研究的效率。图表图表1:传统投研和智能投研对比传统投研和智能投研对比 传统投研传统投研 智能投研智能投研 数据源 传统的金融数据,包括宏观、行业、公司等 拓宽了数据来源,包括舆情数据、社交数据、卫星数据等 数据获取方式 结构化数据库、其他信息通过各种渠道手动搜集 非结构化数据的机构化,通过网络爬虫及人工智能算法自动搜集整理 数据处理方式 基于研究人员自身的知识储备及分析能力手动处理数据 基于自然语言处理、知识图谱等人工智能技术进行自动化的分析,思考维度更加全面、逻辑推理更加稳定 结论呈现 研究人员撰写研究报告 智能搜索引擎、智能问答、智能研报 来源:中泰证券研究所 广义:广义:人工智能在资本市场人工智能在资本市场相关领域的应用。相关领域的应用。从使用者的角度来看,智能投研的受众包括各种类型的投资者(买方)、券商(卖方)、监管机构、银行和财经媒体等。从投资的标的来看覆盖一级市场公司、股票、债券、外汇等。而人工智能的应用场景涉及业务的各种环节,与投研直接相关的就包括研究、投资、交易和风险管理。图表图表2:广义的智能投研广义的智能投研范畴范畴 分类分类 构成构成 主体 各种一二级市场的投资机构(公募、私募、PE、VC、产业基金、金融集团等)、券商(投行部、研究部)、监管部门(证监会、交易所)、银行、财经媒体等 标的 一级市场公司、二级市场股票(A 股、港股、美股)、固收类(债券、资产证券化)、大宗商品、外汇等 职能 市场营销、客服、研究、投资、交易、风险管理、合规等 来源:中泰证券研究所 智能投研产业链的供求关系智能投研产业链的供求关系 智能投研的产业链涉及数据的获取、处理及应用。智能投研的产业链涉及数据的获取、处理及应用。大部分独立的智能投研公司主要在数据的处理环节。最终与投资交易直接挂钩的智能投研由2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -5-行业深度行业深度研究研究 投资机构自己搭建为主,同时会采购外部第三方的数据和服务,在内部进行整合。图表图表3:智能投研的流程及功能智能投研的流程及功能 来源:中泰证券研究所 产业产业链链的上游是数据源的上游是数据源。(1)传统数据。金融行业本身已经存在大量标准化的数据,包括公司财务数据、公司公告、交易数据、宏观数据、行业数据、券商研报等,这些数据主要由金融数据公司进行整合。(2)爬虫数据。这些数据来自于互联网,相比传统金融数据库,这些数据的颗粒度更细,数据来源主要是地方政府网站、地方监管部门网站、社交网站、媒体网站等。(3)另类数据,主要指通过智能设备采集的数据,包括卫星图片、天气数据等,更多的是通过个人移动终端采集的各种数据。产业产业链链的中游主要是数据的采集和标准化。的中游主要是数据的采集和标准化。产品形态包括数据处理的工具或者处理之后的数据产品。(1)数据抓取工具:直接对客户开放的基础产品,也是开发其他高级工具的底层技术。应用于标准化金融文本的关键信息摘取。(2)核查类工具:对于有明确规则的金融文本提供自动核查,包括核对财务数据。(3)产业链图谱:通过打标签和标签之间的关系建立,细化行业分类,展现产业链上下游、竞争对手、股权投资等关系,寻找潜在的投资标的或发现潜在的风险传导路径。产业链的下游是数据的需求方和应用场景产业链的下游是数据的需求方和应用场景,以金融机构为主。,以金融机构为主。(1)券商主要包括三个部门的需求。投行部门:提交文件的审核、找项目。网金部:APP 智能投顾功能的底层支持。研究所:报告的质控检查、信息搜索、公告数据提取。(2)投资机构。一级市场投资者:找项目,监控竞争对手。二级市场投资者:量化投资的策略因子、资产组合的监控及风险预警。(3)证监会&交易所:标准金融文本的审核、信息披露的监控等监管科技范畴。(4)其他需求。如银行的小微企业信贷风控、寻找潜在的企业客户;企业寻找合作伙伴等。智能投研行业的参与者智能投研行业的参与者 传统的金融数据服务商传统的金融数据服务商。智能投研对于这些数据服务商来说可以提升数据采集的自动化程度,增加数据功能模块。彭博、汤森路透是全球市占率最高的两家金融数据公司,其优势在于数据全、颗粒度细、服务好,但价格比较高。商业模式也较为类似,除了提供数据终端之外,也是财经媒体,拥有自己的电视台、电台。Captital IQ、Factset、MorningStar与头部的两家公司形成一定的差异化竞争,虽然数据不够全,但在细分领域上做更深的数据挖掘和加工,且价格相对便宜。国内金融数据服务市场的集中度更高,基本处于万得一家独大的状态。数据获取 数据爬取 另类数据 数据处理 结构化 标准化 数据建模 标签 知识图谱 数据输出 智能搜索 可视化 预测 2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -6-行业深度行业深度研究研究 图表图表4:国内外主要的金融数据服务商国内外主要的金融数据服务商 区域区域 主要机构主要机构 海外 彭博、汤森路透、Captital IQ、Factset、MorningStar 国内 Wind 万得、东方财富 choice、同花顺 iFinD、恒生聚源 来源:中泰证券研究所 创业公司创业公司。在智能投研领域有大量的创业公司。这些创业团队一般都具有人工智能的技术背景和金融行业从业经历。根据不同的团队基因,每家公司的切入角度有所不同。有望在细分领域取得突破。业务路径选择与团队背景有关。图表图表5:智能投研智能投研相关相关创业公司融资事件创业公司融资事件 时间 公司 轮次 融资金额 投资方 2019 年 3 月 虎博科技 A 轮 3300 万美元 PAC、宜信新金融产业投资基金和高榕资本 2018 年 12 月 阿博茨科技 B 轮 3000 万美元 Mindworks 概念资本、SIG 海纳亚洲及启明创投 2018 年 11 月 熵简科技 A 轮 数千万元 小米领投,嘉实投资及老股东清泉石资本跟投 2018 年 10 月 香侬科技 A 轮 1.1 亿元 红杉中国领投 2018 年 10 月 阿法金融 A 轮 数千万元 蚂蚁金服领投、线性资本跟投 2018 年 7 月 宽拓科技 A+轮 数千万元 领沨资本领投、首轮融资独家投资方将门创投继续跟投 2018 年 3 月 百观科技 Pre-A 轮 数百万美元 华创资本领投 来源:中泰证券研究所、零壹财经 互联网巨头互联网巨头。具有明显的数据优势,可提供独家因子给量化基金。BAT在人工智能领域均有布局,重点放在通用的基础技术研发上。其中蚂蚁金服在金融行业的布局较广。蚂蚁金服在底层通用技术的研发包括人脸识别技术、图像识别技术、自然语言处理等,应用在泛金融场景中的包括智能客服、智能营销、智能推送、智能定损、安全风控等。从整个资产管理行业来看,蚂蚁金服在获客、客户运营方面有优势,在投研领域,互联网巨头在另类数据方面有明显的优势,可以提供独家的因子给投资机构。投资机构内部研发投资机构内部研发。就投资而言,外部第三方以提供数据工具为主,具体落地到投资策略制定和交易执行一般在投资机构内部。投资机构通常会外部采购标准模块,叠加内部投资策略,构建内部智能投研系统。(1)海外智能投研使用已经较为普遍。成熟的金融市场有充足的投资工具,运用人工智能的量化投资已积累了一定量的历史数据。部分由人工智能管理的基金取得了超过业绩基准的超额收益。(2)国内的资本市场仍处于发展早期,历史数据和交易工具比较缺乏,前几年推出的大数据基金并未取得理想的业绩表现。目前国内有部分公募基金正在积极探索智能投研的应用,包括嘉实基金、天弘基金、富国基金、华夏基金等,智能投研的发展是资产管理行业的大势所趋。2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -7-行业深度行业深度研究研究 商业模式商业模式 金融文本处理工具金融文本处理工具 产品定位产品定位及目标客户及目标客户。(1)针对特定场景的金融数据处理的工具。这里所指的数据处理本身有明确的规则,例如招股书有标准的格式、财务要遵循会计准则等,通过使用智能化的数据工具,可以减少人工审核的工作量,提升效率。(2)所处理的文本以标准化的金融文本为主,包括债券募集说明书、IPO 招股书、上市公司公告、审计报告、信贷报告、金融产品说明书、监管函、券商研报、保险合同等。(3)实现的功能包括关键信息的抽取、文件内容及格式的审核、财务审核、智能搜索、自动问答、会计勾稽关系验证、公告合规性检查、信贷业务合规性审核、券商研报质控等。(4)由于大部分功能是审核检查,所以需求最刚性的是证监会、交易所等监管职能部门,其次是券商投行部门、银行信贷审核部门等。竞争优势及核心技术竞争优势及核心技术。(1)底层技术主要是自然语言处理,相关算法都有公开的论文可以参考。在此基础上,每家公司会有不同的切入点、具体标注数据的方法和效率与团队背景和能力有关。(2)评价指标主要是标注的准确率和标注速度。准确率根据客户的要求决定,不同的文本类型和任务存在差异。最终技术能力的认可要看客户是否买单。(3)算法和数据都很重要,一般来说,标注的数据越多,准确率越高。现实中的文本对于机器来说永远会有无法识别的新问题出现,因此机器的准确率无法达到 100%。交付方式及收费模式交付方式及收费模式。从调研的情况来看,由于行业处于发展早期,公司主要收入来源还是项目制,根据客户需求开发系统,收取一次性的系统开发费加每年的升级服务费。在做项目的过程中可以了解客户需求,完善产品,未来有望实现标准化产品的输出。一级市场数据库一级市场数据库 产品定位及目标客户。产品定位及目标客户。(1)提供全方位了解一级市场公司的数据库和搜索工具。一级市场公司的数量远大于二级市场,但数据颗粒度远低于二级市场。因此这类公司要从更大范围获取数据、清洗并将其结构化,最终形成一级市场公司以及一级市场投资机构的画像。(2)产品的核心是标签体系,对每一个公司设定一系列标签,通过标签形成产业链、投资链的关系网络。其中行业标签是重中之重,它是串联起产业链关系、竞争对手、投资机构偏好的关键。基于这样一个底层数据网络,可以满足客户不同的数据需求,包括竞品分析(商业模式、经营情况、相似程度等)、上下游风险的传导以及供求关系、企业经营的实时跟踪等。这些信息能帮助投资机构更好地分析行业及公司,提升效率,抓住业务机会。(3)目标客户包括一级市场投资机构、券商投行部门及直投部门、银行企业客户部门、咨询公司、媒体、产业园区、产业基金和企业等。竞争优势及核心技术竞争优势及核心技术。(1)在数据源上差异不大,大部分都是公开数据,包括工商数据、证监会官网、基金业协会官网、公司官网和公众号、专利、招聘网站、新闻等,核心能力是抓取数据并处理数据的能力。在数2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -8-行业深度行业深度研究研究 据标签的设定上需要专家支持和金融行业实务操作经验。(2)底层技术是图像识别、自然语言处理和知识图谱。(3)数据特色。就我们调研的公司来看,各家在公司标签的选择和行业的侧重点上呈现出差异,例如:因果树注重小型科技型企业的数据挖掘,建立了技术词汇的知识图谱;视野金服在投融资数据上具有特色,公司覆盖广,一级市场投资机构的投资情况,包括投资偏好、退出情况、投资和管理关系等,资本市场标签包括启动上市辅导、科创板潜在企业、IPO 审核意见等;烯牛数据重点覆盖新经济公司,实时跟踪这些公司的产品和业务情况,挖掘热门的细分行业。交付方式及收费模式交付方式及收费模式。一般采用数据终端或者数据接口的方式交付。如果客户本身有系统基础,即可采用数据接口方式,将其接入业务系统。数据终端按照数量收取年费,数据接口按数据调用量收费。二级市场数据库二级市场数据库 产品定位及目标客户。产品定位及目标客户。(1)提供比传统金融数据服务商颗粒度更高的数据产品,重点在非结构化数据的处理,与传统的结构化数据形成互补,形成更完整的数据体系。(2)产品的逻辑基本上与上述一级市场数据库类似,差别在于二级市场公司信息披露多、交易数据丰富,因此在数据处理上颗粒度更细。首先在财务数据上做更细化的拆解,例如营业收入的构成,抽取每个产品的收入、成本和毛利率水平,使同业比较的有效性更强;其次是智能搜索引擎,从海量信息中找到与标的公司有关的内容,或设定条件,实现个性化的信息推送功能;最后是事件标签,对各类事件进行分类分组,提取事件要素,结合情感分析,预测事件对公司股价的影响,包括风险事件在产业链上的传导。(2)成熟资本市场客户主要是二级市场投资者,尤其是量化投资。国内的客户还包括券商和综合金融集团。券商的需求包括券商 APP 里智能投顾的底层数据支持、研究所研究支持等。竞争优势及核心技术竞争优势及核心技术。(1)数据挖掘的广度和深度是构建竞争优势的主要途径。核心是通过数据积累形成的产业知识体系,早期依赖于专家支持,后续主要由算法驱动,不断迭代。一般来说,积累时间越长、处理数据越多,产业知识体系越完善,搜索及预测效果越好。(2)底层技术是图像识别、自然语言处理、情感分析和知识图谱。交付方式及收费模式交付方式及收费模式。比较成熟的数据库采用数据终端的销售模式,按数量收取年费。此外,也可以与系统开发相结合。底层技术底层技术 人工智能人工智能 在智能投研中主要应用的人工智能技术在智能投研中主要应用的人工智能技术包括图像识别、自然语言处理、包括图像识别、自然语言处理、情感分析、知识图谱等。情感分析、知识图谱等。这些技术的使用本身存在递进的关系。首先通过图像识别技术,对图像中印刷或者手写的文字进行识别,输出可以编辑的文档格式。其次是通过自然语言处理及情感分析对本文进行结构化处理,变成机器可读的数据。最后结合专家知识和机器学习等算法,建立起数据之间的关系网络,实现一定程度的分析功能。2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -9-行业深度行业深度研究研究 人工智能的能力边界人工智能的能力边界。(。(1)优势:)优势:相比人工模式,人工智能拓展了数据来源,大幅提升了数据运算的能力。人脑习惯于线性关系和因果关系的分析,而机器能分析多元、非线性关系,寻找相关性而非局限于因果关系。(2)不足:)不足:就现阶段来看,人工智能在有明确边界、规则和目标的场景中,效果更明显。例如:数据工具类产品主要应用于审核、检查、核对等场景,这些场景的特征就是规则明确、目标清晰;人工智能已经可以实现自动写新闻,但自动写的研究报告可用性不强,更适合上市公司财务数据披露使用,原因在于研究报告的分析角度受撰写者的思考逻辑和知识背景差异而不同;人工智能在防范风险上的表现优于寻找机会,历史数据积累有助于风险模型的不断优化,而潜在的投资机会往往会突破原有的分析框架。(3)约束条件:)约束条件:数据质量影响智能投研的效果,随着底层数据质量不断提升,智能投研的效果会越来越好。自然语言处理自然语言处理 自然语言处理(NLP)就是将复杂的人类自然交流的语言转化成标准化的计算机语言。自然语言处理包括两个部分,一是自然语言理解(NLU),使计算机理解人类的语言,二是自然语言生成(NLG),把计算机运算的结果以人类自然语言的形式呈现。图表图表6:自然语言处理的四个层面自然语言处理的四个层面 层面层面 描述描述 词典构造 构造包含尽量多的语法信息、语义信息、语用信息等的机器语言词典,将其作为构建自然语言理解平台的基础。语法分析 对自然语言进行表层的形式化分析,包括词法分析和句法分析两部分。词法分析是将自然语言进行切分,并将每个切分的词加上词性标记,它是句法分析的基础。句法分析是将句子的词语序列映射为句法成分的层次结构。语义分析 在语法分析的基础上理清句子的语义结构关系,对整个句子的语义进行组合和表达并说明句子中词语搭配上存在的各种语义限制条件。篇章分析 研究句子之间的关系以及整个篇章中包含的知识。来源:中泰证券研究所、中国证券2018 年第 11 期 图表图表7:自然语言生成的三个功能自然语言生成的三个功能 功能功能 描述描述 内容规划 决定生成的文本所要表达的内容,并对已确定的内容进行结构化描述,使之符合阅读理解习惯。句子规划 进一步明确定义规划文本的细节。表层生成 将句子规划后的文本描述映射至由文字、标点和结构注解信息组成的表层文本。来源:中泰证券研究所、中国证券2018 年第 11 期 情感分析是自然语言处理中的一个重要研究方面,主要是对带有感情色2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -10-行业深度行业深度研究研究 彩的主观性文本进行分析、处理、归纳和推理。情感分析的发展得益于社交媒体的兴起,产生了大量个体参与的、对于人物、事件和产品的评论信息,通过机器学习,得出可量化的数据结论。图表图表8:情感分析的步骤情感分析的步骤 步骤步骤 描述描述 情感信息的提取 在文本中抽取有价值的情感信息。情感信息的分类 主要包括主、客观信息的分类和主观信息的情感分类。情感信息检索 可以检索出与主题相关且包含情感信息的文档。情感信息归纳 可以将与大量主题相关的情感文档进行自动分析和归纳并得出情感分析结论。来源:中泰证券研究所、中国证券2018 年第 11 期 自然语言处理的应用场景:大数据分析、日志挖掘及分析、自动摘要、文本分类、信息提取、文本朗读/语音合成、语音识别、信息检索、文字校对、机器翻译、问答系统等。在金融行业的应用包括舆情监测、智能风控、智能客服等。知识图谱知识图谱 知识图谱:将知识结构绘制成以各个知识单元概念为节点的地图。知识图谱的基础是自然语言处理,在计算机对文本中的知识点理解之后,再建立起各个知识单元之间的关系,形成知识网络,最后以可视化的形式展现出来,或者通过智能搜索引擎呈现。知识图谱的底层是文本、标签和表格,在此基础上构建图表、模式、本体和规则。图表图表9:知识图谱技术的层次知识图谱技术的层次 来源:中泰证券研究所、文因互联 投研领域的知识图谱。在投研领域,知识单元包括公司、产品、股东、管理层等,知识单元之间的关系包括上下游、竞争对手、合作、股权、担保等。知识图谱可以知识单元之间的关系网络直观地显示出来,当其中某个节点发生变化时,能快速识别出这个变化在关系网络中的传导过2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -11-行业深度行业深度研究研究 程及对特定主体的具体影响。图表图表10:建立知识图谱的建立知识图谱的步骤步骤 步骤步骤 描述描述 实体识别 从新闻资讯、公司公告、券商研究报告等海量的信息源中抓取实体。关系构建 基于机器学习等方法发掘实体之间的各种关系。来源:中泰证券研究所、中国证券2018 年第 11 期 市场空间及行业趋势市场空间及行业趋势 智能投研的市场空间智能投研的市场空间 要从要从数据服务数据服务广义的角度看智能投研的市场空间。(广义的角度看智能投研的市场空间。(1)如果仅从投资机)如果仅从投资机构的付费能力看,智能投顾的市场空间有限构的付费能力看,智能投顾的市场空间有限。头部的券商和具有一定资产管理规模的投资机构是收入的主要来源,机构数量和资产规模成为主要的限制条件。目前国内传统的金融数据服务被万得基本垄断,市占率超过 80%,万得 2016 年的营业收入为 13.3 亿元,整个市场规模在 20-30亿元左右。(2)增量空间增量空间 1:投资机构需求的多元化。:投资机构需求的多元化。从数据层面,从传统的结构化数据向非机构化数据拓展,而非结构化数据的规模占到80%。从服务层面,在数据功能上要不断完善,提高自动化程度,减少简单重复的人工作业;此外数据服务与软件服务相结合,形成综合性的投资管理平台。(3)增量空间)增量空间 2:目标客户的多元化。:目标客户的多元化。从金融行业领域来看,除了投研部门之外,金融数据服务的对象丰富,包括投行业务部门、银行信贷部门、监管审核部门等。其他潜在客户还有媒体、企业、政府、法律机构等。从从长期来看,智能投研的潜在市场空间远大于现有长期来看,智能投研的潜在市场空间远大于现有金融数据行业金融数据行业规模。规模。根据第三方市场调研机构 Burton-Taylor 的数据,全球金融数据市场的规模达到 260 亿美元,全球的资产管理规模约为 80 万亿美元;由证券业协会统计的国内资产管理行业的约为 50 万亿元,而金融数据行业的规模仅为 20-30 亿,与海外市场相比,市场潜力巨大。图表图表11:主要上市金融数据公司的营业收入(亿美元)主要上市金融数据公司的营业收入(亿美元)来源:中泰证券研究所、wind 注:汤森路透 2018 年出售了金融风险业务 55%的股份,2018 年收入中未包含该业务收入 126 122 112 113 55 51 53 57 61 63 9 10 11 12 14 8 8 8 9 10 0204060801001201402014年2015年2016年2017年2018年汤森路透标普全球辉盛研究系统晨星信息2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -12-行业深度行业深度研究研究 资产管理行业长期保持资产管理行业长期保持增长。增长。资产管理行业是智能投研的主要客户来源,资产管理行业的机构数量、资产规模决定了智能投研行业的收入规模。根据证券业协会的统计,截止 2018 年末,资产管理业务总规模约为 50万亿元,其中包含了公募基金、私募基金、基金子公司、证券公司及期货公司。从增速来看,由于近两年宏观经济增速下滑、资本市场波动及监管趋严等因素影响,资产管理规模增速放缓,其中 2018 年整体规模有所下滑,但从 2014 年以来,规模的复合增速达到了 25%。随着资产管理行业成熟度提升,更多机构(保险机构、外资机构等)和资金(养老金、居民储蓄等)进入资本市场,资产管理行业规模长期将保持增长态势。图表图表12:资产管理业务总规模(万亿元)资产管理业务总规模(万亿元)来源:中泰证券研究所、wind 智能投研的发展趋势智能投研的发展趋势 顺应资产管理行业精细化的发展趋势顺应资产管理行业精细化的发展趋势,资产管理机构在数据及技术方面,资产管理机构在数据及技术方面的投入增速大于资产管理规模的增速。的投入增速大于资产管理规模的增速。一方面,投资机构通过自动化程序不断提升运营效率,包括投资研究和交易;另一方面,投资交易的风格越来越偏被动和量化,逐渐降低人为主观操作的比例,或者说通过技术手段更好的执行投资经理的投资策略,这些需求都要提升投资机构的科技投入。具体来说,收益产品要求更低的管理成本和交易成本,提升跟踪标的的准确度,收益产品的管理难度不断提升,需要持续发现新的、有效的投资策略才能获取超额收益。Smart 产品介于主动及被动管理之间,人工智能可以帮助该类产品进行动态的因子调整,进一步提升获取超额收益的可能性。传统的金融数据公传统的金融数据公司通过并购整合保持持续的竞争优势司通过并购整合保持持续的竞争优势。传统的金融数据服务公司在数据积累及客户资源上具备优势,通过外部并购优秀的创业公司可提升数据产品能力,利用最前沿的人工智能技术,赋能已有的数据业务,增强客户粘性、做大收入规模。例如标普全球公司最近两年连续收购了固定收益技术供应商Algomi、替代数据技术公司Ursa Space 20.5038.2051.7953.5750.36-0.200.000.200.400.600.801.000.0010.0020.0030.0040.0050.0060.0020142015201620172018资产管理业务总规模增速2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -13-行业深度行业深度研究研究 Systems 和 Kensho 以及机器学习与分析公司 Panjiva Inc。大量创业公司在努力拓展人工智能大量创业公司在努力拓展人工智能的边界。的边界。尽管海外金融数据市场非常成熟,头部几家基本都有数十年的历史,但在一级市场上仍有大量的初创公司在细分领域进行探索,运用自然语言处理、知识图谱等人工智能技术开发差异化的数据产品。图表图表13:海外典型智能投研创业公司海外典型智能投研创业公司 公司公司 简介简介 AlphaSense 搜索引擎,整合公司公告、新闻、研究报告中的投资信息。Automated Insights 自动写作,自动撰写新闻和上市公司的营收报告。AlgoDynamix 风控系统,对全球金融交易所数据进行实时分析,及时发现市场异常,对潜在风险发出预警。Visible Alpha 财务模型,整合各家卖方报告的财务预测模型,除了三表之外,还包括其他业绩驱动因素的分析及预测。Dataminr 社交数据的大数据挖掘,搜集社交媒体上的实时数据,包括每天 5 亿条的推特,利用机器学习提前发现可能会影响公司的事件。来源:中泰证券研究所、公开信息整理 智能智能投研投研公司成功公司成功路径路径:深度和广度必取其一。:深度和广度必取其一。(1)所谓广度,是指智能投研产品定位的目标市场的大小。一是把握资本市场的变化趋势,瞄准资产规模占比提升的细分市场,例如前几年的债券市场、近期快速拓展的 ETF 市场。由于这些市场处于扩张期,参与机构数量会增加,相应的智能投顾市场也会扩容,把握机会就能快速做大客户规模。二是关注非投资机构的需求,自然语言处理是相对底层的技术,从金融本文中训练出来的算法也可以向其他行业的标准化文本进行复制,从而扩大受众范围。(2)所谓深度,是指智能投研产品的数据挖掘能力及智能化水平。根据现有公开数据构建更加细化的产业链知识图谱,发现潜在的相关性,并持续将更多维度的数据纳入。另一种路径是做出有市场影响力的数据产品,如行业指数等,这也是成为头部数据公司的标志。海外案例分析海外案例分析 数据分析数据分析公司公司 Kensho Kensho 的公司定位是数据分析公司,运用机器学习,建立事件与资产价格之间的相关性。(1)底层是一个庞大的数据库,事件库覆盖全球的政治、经济、行业、技术、自然等 9 万种事件,资产包括股票、基金、大宗商品、外汇等。(2)中间层是金融数据的知识图谱,从事件到资产价格,Kensho 运用了机器学习技术,涉及各种指标之间的相关性、各种因素的不同组合,最后经过复杂的计算给出最有可能的结果(3)前台是基于自然语言处理技术的智能搜索引擎,使人与系统可进行自然的对话。用户只需按照人际交流的方式进行提问,系统就能理解用户的意思,2 1 0 6 3 6 7 7/3 6 1 3 9/2 0 1 9 0 6 1 0 1 6:4 8 请务必阅读正文之后的请务必阅读正文之后的重要声明重要声明部分部分 -14-行业深度行业深度研究研究 并快速计算,输出结果是预测某一事件发生之后某一种资产的价格变化趋势。Kensho 曾正确预测英国脱欧对英镑汇率的影响、美元反弹对科技股股价的影响。与传统数据服务商的合作使效用最大化。Kensho 在 2018 年 3 月以 5.5亿美元的价格被标普收购,是近几年来人工智能领域最大金额的一笔收购。Kensho 成为标普旗下成员对于其业务发展有明显的促进作用,一方面能获得标普积累多年的数据资源,独特的数据资源是构成竞争壁垒的重要因素;另一方面标普服务全球主要金融机构,客户基础扎实,对于客户需求了解深入,原有数据服务结合 Kensho 前沿的数据产品能进一步巩固市场地位,并引领金融数据服务行业的技术发展。资产管理系统资产管理系统 Aladdin 贝莱德的阿拉丁是一个集风险分析、资产组合管理、交易和运营工具为一体的资产管理平台系统,贝莱德通过阿拉丁平台向资产管理公司输出行业领先的风险管理能力。阿拉丁的优势在于丰富的数据积累,并且仍在不断从第三方获取数据和信息,基于庞大的数据库对风险因子进行实时监测,基于蒙特卡洛测试,模拟各种市场极端情况,对资产组合进行压力测试。通过大量的情景分析来协助资产管理公司预测、分析并应对风

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开