来源 :金融界2024-01-13
据国家知识产权局公告,金现代信息产业股份有限公司取得一项名为“一种基于深度学习的中文错字校正方法“,授权公告号CN109522558B,申请日期为2018年11月。
专利摘要显示,本发明提供了一种基于深度学习的中文错字校正方法,包括:S1、利用BiLSTM+Attention+CRF模型进行词语分词;S2、对分词的结果利用提前预置的词库进行匹配,识别出词语中的错别字,并进行校正;S3、利用BiLSTM+Attention机制的语言模型对输入序列进行处理,识别错误的词语。本发明实现了中文文本的高精度分词,解决了现有技术中分词不准确以及错别字识别不准确的问题,通过BiLSTM+Attention+CRF模型提高了分词的精度,提升了错别字校正的准确率,并提高了错别字校正效果,利用双向LSTM实现了更高精度的词语错误检测。