痛点
01
传统算法基于关键词和规则对文章进行情绪判断,无法考虑分词和上下文语境,缺少对语义的理解能力。
痛点
02
市场上现有的舆情服务供应商的舆情分析数据普遍存在判定不准确、负面区分度不够等问题。而且面向业务的直接需求反馈也很难针对性的优化和调整。
痛点
03
为了第一时间感知重要舆情,企业往往需要同时接入多个信息源。各个信息源之间存在大量的互相转载和轻度修改的文章,这对业务人员进行舆情监测带来了很重的负担。
痛点
04
传统的舆情分析技术只能从篇章或句子层面使用关键词规则进行情绪判断,对于同时提到多个对象公司的情况无法做出准确的判断。
基于语义和领域知识的情绪理解
基于孟子预训练模型技术体系,可以从语义角度结合上下文对文本情绪进行理解。通过对海量金融领域专业基础语料以及一线舆情分析人员的判断进行学习,极大地提高了舆情判断的准确性和专业度。
多粒度、全方位的舆情分析
利用孟子预训练语言模型技术的上下文理解能力以及抽象能力,可以从多个角度对目标文章展开分析。配合公司实体识别和链指,可以精准的识别和关联几万家上市发债企业,在错综复杂的描述中准确地定位到针对每个公司实体不同的情绪。
海量文章智能去重
通过孟子预训练语言模型技术,可以根据对文章的内容进行抽象理解来判断描述内容是否重复,有效识别使用规则难以区分的轻度改写的重复文章。防止业务人员被大量重复消息淹没,无法及时关注到重要舆情。
在舆情分级准确度上,帮助各个下游业务系统准确识别多级别舆情信息,有效地提升了各级别舆情间的区分度,为业务端提供了更细粒度的决策支持信号。
业务人员关注的公司主体经常会在大量的文章中被提及,但大部分时候并不是作为主要的舆情对象出现。通过对全文的描述内容进行分析,可以判断其是否是主要的舆情对象,并提供针对这家公司的情绪分析。
随着大数据技术的发展,金融机构接入的舆情信息源数量已经达到万级别。通过海量信息去重技术,可以大幅过滤内容重复的文章,减少对业务人员的信息噪音干扰。