中国运载火箭技术研究院研究发展部自主研制的“一种基于聚类的文本查重方法”获国家发明专利。
近年来,随着学术界造假事件频繁发生,知识产权保护的呼声日益高涨,文本查重技术的研究逐渐成为相关专家和学者的研究热点。目前,国内外学者提出的一些文本查重方法,存在查重效率低等诸多不足。
为此,该发明方法克服现有技术的不足,提供一种基于聚类的文本查重方法,首先对已有文本进行聚类,进行第一次的粗略查重,排除部分文本后,再进行第二次的精确查重,从而减少不必要的重复性比对工作,提升文本查重效率。
网友评论
文明上网理性发言,请遵守新闻评论服务协议