Internet是全球信息共享的基础设施,是一种开放和面向 所有用户的技术。它一方面要保证信息方便、快捷的共享;另一方面要防止垃圾信息的传播。网络内容分析是一种管理信 息传播的重要手段。它是网络信息安全核心理论与关键技术 研究网络内容分析所涉及的新理论、新体系结构、新方法和新技术。
内容过滤技术一般包括名单过滤技术、关键词过滤技术、图像过滤技术、模板过滤技术和智能过滤技术等。目前,内容过滤技术还处于初级阶段,实用的技术相对比较单一,主要表现在名单过滤和关键词过滤技术,而图像过滤与模板过滤技术还处于起步阶段,面I临着图片的智能识别和过滤对机器或网络性能存在信息影响的障碍。现阶段的内容过滤技术主要是对URL网址过滤和网页文字等固定内容过滤,还无法做到智能的判断,这是内容过滤技术在现阶段的不足。
Nlpir Parser语义智能内容过滤系统是由灵玖软件成功研制,可以导入大批量用户业务敏感的关键词列表,实现对内存与文件的实时智能扫描,生成命中的敏感关键词、敏感类别与权重等信息。同时提供二次开发接口,可以无缝地融合到客户的各类复杂应用系统之中,可兼容Windows,Linux, Android,Maemo5, FreeBSD等不同操作系统平台,可以供Java,C,C#等各类开发语言使用。
Nlpir Parser语义智能内容过滤系统技术特点:
1.精准的切词:使用先进的灵玖LJWS切词技术,准确高效的对句子切分,避免了歧义的产生;
2. 快速高效:Nlpir Parser语义智能内容过滤系统单线程每秒可处理10MB的文本数据。;
3.准确率高:根据100万条数据的实际测试,准确率高达99.97%。
4.支持微博客、短信等短文本内容过滤:支持微博客、短信等内容短小而又不规范的内容过滤。
5.智能学习功能:Nlpir Parser语义智能内容过滤系统的所有的知识库是通过机器学习,自动抽取新的语言知识,以适应新的网络语言变化,做到因时而变
6.技术先进:Nlpir Parser语义智能内容过滤系统综合运用了自然语言理解技术、信息检索技术、模糊匹配与机器学习技术,技术含量高。