个人项目1:文章查重

发布时间:2022-07-05 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了个人项目1:文章查重脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。
这个作业属于哪个课程 https://edu.cnblogs.COM/Campus/gdgy/InternationalcourseincomputationalscienceandtechnoLOGy
这个作业要求在哪里 https://edu.cnblogs.com/campus/gdgy/Internationalcourseincomputationalscienceandtechnology/homework/12187
这个作业的目标 实现论文查重算法,学习PSP使用,熟练gIThub操作

Github仓库链接: https://github.com/JudgeDu/JadeDu/tree/main/3119009467

PSP表格

PSP2.1 PErsonal Software PRocess Stages 预估耗时(分钟) 实际耗时(分钟)
Planning 计划 10 10
EstiMATE 估计这个任务需要多少时间 10 10
Development 开发 600 510
Analysis 需求分析 (包括学习新技) 200 230
Design Spec 生成设计文档 30 40
Design review 设计复审 15 20
Coding Standard 代码规范 (为目前的开发制定合适的规范) 20 20
Design 具体设计 120 100
Coding 具体编码 400 420
Code Review 代码复审 30 60
test 测试(自我测试,修改代码,提交修改) 30 30
Reporting 报告 120 180
Test Repor 测试报告 30 30
Size Measurement 计算工作量 20 20
Postmortem & Process Improvement Plan 事后总结, 并提出过程改进计划 15 15
Sum up 合计 1650 1695

计算模块接口部分的性能

个人项目1:文章查重

个人项目1:文章查重

如上

设计思路 我在网上进行了相关学习后决定使用计算余弦值的方法。如下 用jieba切割句子,成为一个个单独的字或词

个人项目1:文章查重

为词赋值,将其转化为单位向量,并且计算余弦值,然后判断重复率

个人项目1:文章查重

测试结果

个人项目1:文章查重

个人项目1:文章查重

个人项目1:文章查重

个人项目1:文章查重

个人项目1:文章查重

如上

异常处理说明

个人项目1:文章查重

如上

脚本宝典总结

以上是脚本宝典为你收集整理的个人项目1:文章查重全部内容,希望文章能够帮你解决个人项目1:文章查重所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。