GNLP产品介绍


             

GNLP产品介绍

1. 平台简介

GNLP(Giant Natural Language Processing)语义理解平台(以下简称GNLP)是将非结构化或半结构化的自然语言文本转化为计算机可深层处理的结构化信息、并进行分类、分析的 软件平台。通俗地说,GNLP“阅读”文本,自动生成语义标签、管理标签、关系标签(当有大批量文本时),并可进一步“分析”形成分析报告。

GNLP构建于极天完全自主知识产权的两大核心技术:SimRank和SemNet。

  • SimRank是语义计算模型。该模型是GNLP的核心。

  • SemNet是语义网(Ontology),包括模型及管理工具,为SimRank建立语义模型数据。

形象地说,GNLP是一个模拟人脑的智能系统,SemNet是大脑中的知识组织系统,SimRank则是思考系统,两者紧密配合,完成智能信息处理。

GNLP产品介绍

2. 平台功能

GNLP能够整合处理各种数据源,包括企业内容仓库(知识库、文档库等)、数据库、互联网网站、微信、微博等。无论是结构化数据还是非结构化数据,通过GNLP对数据内容的理解,均能实现自动化的信息处理。

GNLP产品介绍

  • 搜索服务 : 利用语义网引擎,从用户文字表达的语义层次上来认识和处理用户的检索请求。通过对知识源进行语义上的标注,以及对用户的查询表达进行分词、语法分析、语义分析等处理,从而获得更准确、全面的检索结果。

  • 分类服务 : 对文本按预定义的分类要求,进行自动归类。系统在分类训练和自动归类中,利用语义网引擎理解文本的主旨内容,进行文本的特征提取、相似度计算、分类评估。分类结果准确性高,鲁棒性好,并能不断增量学习。

  •  分析服务 : 对文本流进行在线分析,包括数据清洗,摘要提取,关联及热点分析等,形成文本流的即时画像。

  • 自然语言处理服务 : 对文本进行分词、词性标注、新词发现、关键词自动提取。

  • 语义网服务 : 将文字符号序列转化为词汇单元序列或语义网节点序列的处理器。语义网引擎是智能信息处理的基础引擎。

 

3.GNLP平台特点

  • 精准
    SimRank遵循“观其伴而知其意” 的计算模型,挖掘概念之间的内在关联,并使用SemNet准确理解语义,进而识别文档之间的语义相似性。与使用关键字词典进行自然语言理解的同类产品相比,GNLP显著提高了准确度。

  • 智能
    GNLP的分类和分析工作全部由系统自动完成,且能够在线增量学习,无需人工干预或手工处理。处理结果稳定可靠。

  • 通用
    GNLP中的SemNet模型包括通用语义网和领域语义网两个层次。
    分层次的语义网技术,使GNLP既能支持通用领域,又能支持专业领域的应用需求。

  • 支持全语料
    GNLP处理对象覆盖词、句子、段落、篇章。用户可以使用以上任意方式表达信息需求,摆脱了传统搜索引擎基于关键字的束缚。

GNLP产品介绍

4. GNLP应用价值

GNLP可作为完整解决方案,对数据进行内容理解,进而分析和挖掘,提供有价值的结果信息和直观的结果展示手段(图、树、表等)。

GNLP又可作为解决方案中的集成组件,基于GNLP的各种应用解决方案,包括智能搜索、自动分类、内容分析、智能应答、信息监控、情感分析等,已广泛应用于电信、移动、银行、证券、地产等行业应用之中。


转载于:https://my.oschina.net/u/856502/blog/534626