知网作为中国大部分高校和科研机构的御用学术不端行为检测系统,影响了广大毕业生的毕业答辩和一些科研人员的论文发布。尤其是对于毕业生而言,论文查重不合格代表着不能参加毕业答辩,从而延期毕业。清楚地了解到知网查重计算方法,从而有效降重成为毕业季所有人的难题,因此笔者总结了知网查重的计算方法如下:
1、论文提交
论文提交后,知网会对提交的论文进行扫描,目前知网支持的论文文本格式有doc、docx、txt、pdf,论文提交后,知网系统会对论文进行转码,从而区分句子、段落、章节、引用、参考文献等;
另外,知网查重为整篇文本上传。PDF格式比Word格式多一个文本转换的过程(此处可参考WPS中PDF格式转化为Word格式),文本转换的过程中有可能导致原本的目录、参考文献等的格式被打乱,从而导致系统不能正确识别而在查重时被标红,因此能使用Word格式就尽量不要用PDF格式。
2、论文检测:重复率=重复字数/总字数×100%,章节重复率=章节重复字数/章节总字数×100%
知网论文查重是以章节为单位进行查重,连续8个字相似或抄袭判定为“重复句”,连续13个字相似或抄袭判定为“重复段”,被判定为重复的句子或段落前后会着重进行检测。检测出“重复句”或“重复段”需要满足以下条件:知网对论文查重的重复率设置了一个5%的阈值,以段落为单位,低于5%的抄袭或者引用是检测不出来的。
3、查重报告中各段颜色代表:
红色:文字复制比部分
绿色:引用部分
黑色:无问题部分
灰色:未检测部分(通常是目录、参考文献部分)
4、论文格式:
论文格式不正确导致查重是目录、参考文献部分被查重,会大大增高重复率,因此目录、参考文献的格式尤为重要。
整篇论文提交后,知网会根据目录检测章节信息,对论文进行转码,然后系统分章节检测,此时目录不参与查重检测,同时目录也有可能被当成正文检测,重复则被认定为“抄袭”,计入重复率。
查重时可以依照学校要求删除目录、附录等部分,但是参考文献一般不会删除,参考文献又容易因为格式不能被识别从而增高重复率,有效方法是①登陆知网,找到自己参考的文献,如“中医院校《神经心理学》教学思考与建议”;②点击文献题目右下方“导出/参考文献”,点击“复制到剪贴板”;③粘贴到自己的论文里,所有文献依次替换。
关于引用,引用的时候最好引用整段话,字数达到5%的阈值才会被认定为引用,如果引用时使用句号,容易被认定为引用结束,推荐使用分号代替句号。另外,引用也算重复率,还是用自己的话重新表述一遍吧。
5、论文降重时需要规避哪几点?
降重时不要改变论文整体结构和大纲,因为知网查重采用的时最先进的模糊算法,如果整体结构和大纲被打乱再进行查重,容易被识别为另外一篇论文,从而导致第一次查重时的标红第二次未被标红,或第一次查重时未被标红的部分第二次查重时被标红。
引用文献时尽量选择多篇文献,一篇截取几句,这样因为未达到5%的阈值,是不会被检测出来的,详细的与正文查重一致。
知网查重问题的解决方法
对于初次使用知网查重系统的同学们来说,可能会遇到非常多的问题,今天小编就来告诉大家应该怎样解决知网查重中的问题。
1、在首次论文查重的时候没有出现内容抄袭的情况,但是在第二次论文查重的时候为什么会出现内容存在抄袭的现象?实际上互联网上的一些资料都是在不断更新的,可能你这次检测的时候是没有人发表理我的,但是之后再次检测时就有人已经提交上传了自己论文内容,这样一来就会出现抄袭的现象了。
2、一篇相同的论文为什么会出现两次不同的检测结果?其实论文不仅只包括了正文内容,还包括了封面、前言、目录等等内容,由多部分内容组成的。如果第一次只检测了正文内容,可能原创度比较高,但在之后检测的时候,把封面、前言和目录这些内容全部提交,那么检测结果很可能会出现差异。
3、为什么参考文献标明了出处还是会被系统计入重复?虽然论文可以标注参考文献的出处,但标注参考文献也是有具体要求的,并不是在文中可以无限制的标注。如果标注的格式正确或字数超过要求的范围,那么肯定会被判定为重复的。
4、论文查重已经达到学校的要求,为什么导师还说论文不合格?我们的论文通过知网查重系统,只能说明文章内容没有抄袭,但系统并不能识别出论文内容是否合格,需要经过专家们的审核才能算是通过,自己还是要再一次的仔细检查,看看被自己修改过了文章语子通顺吗?是否有什么重复性的段落或错别字,一定要确保自己的论文存在可读性。