【金猿产品展】Elens智语——“傻瓜化”实现领域模型定制的自然语言处理平台

一览群智产品

本产品由一览群智投递并参与“数据猿年度金猿策划活动——2020大数据产业创新服务产品榜单及奖项”评选。

大数据产业创新服务媒体

——聚焦数据 · 改变商业


为解决自然语言处理任务中诸多困难,降低技术实现门槛,实现快速训练、快速部署,一览群智自主研发了从数据采集到模型发布的自然语言处理生态闭环系统——智语自然语言处理平台。

该平台是一款囊括了由数据治理、数据标注、模型训练、结果评估等模块的全链条AI产品体系。融合主流机器学习以及深度学习框架,通过自动建模、分布式算法库及模型训练接口,可轻松构建AI模型,快速实现人工智能的落地应用,快速提升业务价值。

同时,智语自然语言处理平台集成了一整套自底向上的丰富、高效、高精度的中文自然语言处理模块,涵盖文本分析全链条,提供正文抽取、句子切分、分词、词性标注、命名实体识别、依存句法、语法分析、文本分类、情感分析、信息抽取、实体消歧、文本聚类等20余种文本分析组件。适用于智能搜索引擎、情报分析、泛媒体分析、知识管理等各个领域。

应用场景/人群

●政府场景

宏观经济、税收征管、工商监管

●公共安全

案件研判、情报线索发现、警情案情分析

●金融行业

智能反洗钱、智能审单、智能风控与自动授信

●媒体情报

媒体传播分析、智能舆情监测、融媒体大数据可视化

●电子商务

商品推荐、关联搜索、智能物流

产品功能

1.基础自然语言处理任务:针对中英文提供分词等通用基础自然语言处理功能;

2.多样性信息抽取:针对实体、实体关系以及部分文档格式进行信息抽取;

3.多系列文本分析功能:支持文本分类、情感分析、文本聚类等系列文本分析功能;

4.可拓展性:分布式架构,可处理海量文本数据,20台虚机的集群其日处理文本能力可达数百GB,可覆盖3000万篇以上微博、公众号更新数据,以及数百万网页的智能解析处理,可为不同场景定制添加算法和接口;

5.开发接口:接口封装标准化,提供二次开发接口,可编程可配置,支持编程API、云服务、Spark集群三种模式;作为基础分析组件可快速引入应用,大大降低开发成本。

产品优势

●更准

经独立第三方测评及实际项目验证,在分词、情感分析等各项任务上准确率均领先竞品,实体识别准确率已达到93%。

●更快

同等硬件条件下,机器学习版和深度学习版全量功能处理速度均领先业界水平。

●更全

涵盖文本分析全链条,提供词性标注、命名实体识别、文本分类、情感分析、实体消歧、文本聚类等 20 余种文本分析组件,在金融、公安等行业有丰富的场景应用经验。并且支持中文,英文,维吾尔、阿拉伯语等多语种功能。

●更新

互联网新词词典、分词词典、实体特征词典每周更新,内置模型每月更新,保持业界最新。

●更捷

支持java/python等语言的便捷调用;支持云部署;便捷训练和扩展模型;便捷服务安装;便捷权限控制。Python深度学习包支持pip安装,并且提供详细的说明文档和预置的训练,预测,服务发布脚本。

使用客户/人群

本年度代表性客户:建设银行、招商银行、阿里巴巴集团、中国新闻社、中油瑞飞、中国国际出版集团、锐安科技等。

2020年客户数量:15-20家。

市场价值

一览群智通过提升智语产品能力,加速了自然语言处理技术的落地。智语平台全面的NLP基础模块能力,适用于智能搜索引擎、情报分析、泛媒体分析、知识管理等各个领域,在金融、公安、媒体等场景中都带来有效的落地应用。

例如,在媒体场景中,由于网络的开放性和虚拟性,面对舆情数据量的增大、传播速度的加快,如何加强对网络舆情的及时监控,有效引导、对网络舆论危机的积极化解,网络舆情管理成为一大难点。某政府机构通过智语平台,利用其自然语言处理、文本分析技术对采集到的信息进行舆论倾向性、趋势、路径、传播等维度进行分析,有效形成对舆情监测成果的智能检索、展示和预警。

另外,在一些新兴领域,智语平台也作出了很多前瞻性的探索。例如在财经、法律、社交等领域尝试实现多种问答机器人,在多个领域进行文本生成的尝试。这些前瞻性的工作在取得了巨大成效的同事,也探索出一条把AI转化成生产力的道路。让智语平台可以在多场景落地开花。

(0)

相关推荐