1)知网系统目前的检测范围涵盖中国学术期刊网络出版总库、中国博士论文网络出版总库、中国优秀硕士论文网络出版总库、中国报纸全文数据库、中国专利全文数据库(知网版)、中国科技成果数据库(知网版)、中国年鉴网络出版总库、中国工具书数据库、中国标准数据库(知网版)。正陆续引进英文数据库、网络数据库等资源。
随着技术的不断完善,知网查重会无孔不入,吓死宝宝了,还好宝宝马上就要毕业了,祝福研一的小朋友,到博士毕业应该就能用先进的技术了!
2)大部分学校的重复率要求在20-30%,有部分学校要求在10%甚至是5%以下,10%以下的注意啦,注意啦,即使这篇文章基本都是自己一个字一个字敲出来的,也非常容易超10%,材料方法总得写个疾病诊断啥的,评价规范啥的吧,这些随便查查就超标了。针对10%的小伙伴,在提交之前记得去查重下。
3)知网查重比较贵,动不动好几百,建议大家先用passpaper查重,passpaper比较严格,万方比较松,把查重不过的地方改掉后,再拿去知网查重。
4)知网检测系统对论文的分节是以“章”作为判断分节的。封面、摘要、绪论、第一章、第二章、等等这样一系列的都会各自分成一个片段来检测,每一个片段都计算出一个相似度,再通过这样每章的相似度来计算出整篇论文的总重复率。然而知道这些并没有什么卵用。
5)知网系统共设定了4种不同的颜色表示检测结果中的不同的文字重合情况:绿色表示未检测到重合情况;黄色表示检测到的重合比例在0%-40%之间或者重合文字大于1000字;橙色表示检测到的重合比例在40%-50%之间或者重合文字大于5000字;红色表示检测到的重合比例在50%-100%之间或者重合文字大于10000字。
从实战经验来看,改红色的,其他的先不管然后再查,还是不过再动手改橙色的。
6)系统的最小检测单位是句子吗?如果是,那么在每句话里改动一两个字就检测不出来了吗?官网答:系统采用的是语义级别检测技术,没有“最小检测单位”的概念。系统在识别重复和引用内容时,会结合上下文的内容,对达到一定的语义级别的内容进行判定,并不是单纯根据一两个词、字或者单独的句子进行判断。完整内容的重合情况,是由系统根据算法综合得出的,对文献内容的原样抄袭、改写、语句顺序调整等,都能自动检测和识别,且能快速定位和动态标注显示。
上面的官网的原话,讲得挺复杂和吓人的,但是实际操作来看,“连续13个字重复”做为识别标准,但是英文摘要比较坑爹,一个单词算一个字,于是there was no signigicant difference也悲惨地算进去了。修改的话也就是飘红的重复部分改得面目全非就好了呢。
7)表格里的内容是可以识别的,如果表格内容有很大重复,就得把表格弄成图片,针对上述的纳入标准这种,实在不行也可以弄成图片。图片按照官网的说法是检的,但是正在测试阶段,我理解为“还没有开始实行”。
下面的官网的原话:“学术不端的各种行为中,文字复制是最为普遍和严重的,目前本检测系统对文字复制的检测已经达到相当高的水平。同时,系统已经实现了对公式和表格的检测,并将有关的检测结果展示在检测报告中。而对于图片内容的检测,目前系统已经具备了图片检测的技术,正在进行集成的测试和优化,欢迎继续关注并给与本检测系统更多的批评性和建设性的意见和建议”
祝福研一的小朋友,到博士毕业应该就能用先进的技术了!
8)虽然知网对比库不包括书籍、教材等,但是不要抄书!不要抄书!不要抄书!重要的事情讲三遍,因为你到查重时会发现,基本都被大家抄光了。新书也不好抄,新书抄旧书,而旧书已经被抄得差不多了。建议写前言讨论啥的多看点英文综述,英文不好那就没有办法了。
9)每次查的结果会有小小的不同,所以论文修改一次后,不要以为就肯定能过了,知网系统会根据论文内容的不同调整重新检测段落。所以对于那些要求非常严格的学校,只能多查多改。