每到临近毕业季,年轻的学子大都面临工作、毕业、感情、生活等很多压力,顺利通过学校论文检测也成了头等大事,每年大部分毕业论文都会经过中国知网的“学术不端检测”,但是很多学子对知网系统的检测规则原理可能并不了解,如果盲目的修改即便是大部分论文原创内容可能也不能通过学校规定的重复率,所以我们对知网系统最新检测规则原理和算法做一个全面的介绍,希望可以帮助广大同学们顺利完成学业。
1、知网查重规则
知网检测系统是按照分段检测重复率,知网学位论文检测为整篇上传,上传论文之后,系统会自动识别文章的大纲目录信息,如果有自动生成的目录信息,就会按照章节进行分段检测,否则会自动分段检测。
2、知网对比数据库
中国学术期刊网络出版总库、中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库。部分书籍不在知网库,检测不到。
3、知网系统检测阀值
知网检测阀值是5%,按照知网系统以段落检测的规则,就是说如果某段一万字,如果引用或者抄袭的文献达到500字才会被检测出来,低于这个数字检测不出。
4、知网论文检测条件:
连续13个字相似或抄袭都会被红字标注,(但有2个前提条件,一是看该段引用的文献字数是否超过知网系统5%的阀值,如果没超过就不会被标红。另一个是看引用的文献是否被知网收录,如果知网没收录也检测不出来。)
5、知网检测系统升级
(1)重复13个字有间隔也算重复率
查重系统的根据是以词为基础,先前很多人按照知网系统原理在文章中所有字符之间插入空格,然后压缩字符间距,直接绕过了检测系统,现在这种方法随着知网系统技术升级已经不可取了。
(2)新增跨语言检测功能
知网系统检测算法相当复杂,虽然大家对知网系统也掌握了一些修改的技巧经验,但随着知网的技术与算法升级,有些可能已经过时了。知网的检测系统现在增加了跨语言检测功能,即便是把国外的论文翻译成中文也是有可能被检测出来。
6、知网系统检测盲区
知网系统目前仍然无法检测图片,国内其他的检查系统也不行,图片只能靠肉眼区分识别。
7、总文字复制比
我们最终的目的就是要使我们的论文总体复制率达到学校规定的范围内,(各高校规定范围并不一致,不在赘述)
知网的总文字复制比=抄袭率+引用率
重复字数除以总文字总和,而不是由各段落复制比加权平均得出。
同学们需要按照最新的知网查重原理规则来斟酌修改,目前知网的学术不端系统也非完善,一是规则,二是技术方面。如果想有效降低重复率,只能在知网系统不完善的地方下工夫,通过对原理规则的熟悉可以及时的规避和降低重复率,技术上知网对图片检测处理还是有很大的障碍,软件检测识别在含义检测上也不是很智能,所以同学们大可通过对已了解的这些信息,对论文做特定的加工处理,修改到学校规定的重复率范围内,顺利完成学业。