校对程序开发需求(必须有类似案例经验)

2026-03-12 14:35

需求:开发校对系统,要求能检查包括并不限于如下错误类型:错别字、敏感词、禁用词、标点符号错误、多字错误、少字错误、领导人名字职务等错误、落马官员、涉政敏感词、固定表述错误、敏感人物、隐私信息、非法链接(暗链、黑链、外链)。

技术要求:

1、使用本地算法实现,非调用第三方校对接口。

2、支持用户导入自定义错词库、敏感词库

3、开发人员需要有校对相关行业经验,自有错词库、校对算法。自有错误规则库不低于1000万条(其中错别字词不少于800万条)。

4、如使用到开源方案需提前说明沟通。

如 shibing624/pycorrector、twnlp/ChineseErrorCorrector3-4B 等开源二次开发需要说明比原方案优化的地方。

5、校对准确率不低于市面上常见校对系统。误报率不高于市面上常见校对系统。

6、项目需要交付完整方案、训练数据集、源代码。
已有4人报名
*************
*************
浏览 544
点赞
2评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
全部评论
全栈架构师阿志2026-03-20 19:15
需要先确认下:目前是希望做一个可本地部署的校对系统原型/业务版,还是直接对标成熟商用校对产品? 另外,需求里提到的千万级规则库、错别字库、准确率和误报率指标,需要明确评测标准、测试集范围和验收方式。 如果方便的话,可以先发下使用场景、文本类型、日处理量、必须优先覆盖的错误类别,以及预期交付周期,我评估后给你明确方案。
点赞回复
我们有丰富的经验
点赞回复
推荐
点赞
2评论
收藏
分享

手机扫一扫分享

分享
举报