期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
基于深度学习的学生行为分析与教学效果评价 被引量:24
1
作者 周楠 周建设 《现代教育技术》 CSSCI 2021年第8期102-111,共10页
利用人工智能开展学生学习行为分析与教学效果评价对改变教学方式具有重要的意义。文章提出了一种基于深度学习的互动课堂学生学习行为分析与教学效果评价LBREM方法,该方法首先通过智能学习平台获取学生学习行为视频信息,然后对视频中... 利用人工智能开展学生学习行为分析与教学效果评价对改变教学方式具有重要的意义。文章提出了一种基于深度学习的互动课堂学生学习行为分析与教学效果评价LBREM方法,该方法首先通过智能学习平台获取学生学习行为视频信息,然后对视频中的学生表情进行检测与学习行为识别,最后以国际汉语课堂教学为例开展学生学习行为统计分析和建立教学效果评价模型并开展实证研究。实证效果表明,LBREM方法能够快速、准确的识别学习者学习行为和开展教学效果评价,在智慧课堂、远程学习、移动学习、MOOC等智能教育教学评价和个性化推荐中具有重要的借鉴意义。 展开更多
关键词 学习行为 教学评价 深度学习 智能教育
下载PDF
数据论文及关联科学数据集出版元数据标准研究 被引量:6
2
作者 高瑜蔚 朱艳华 +3 位作者 孔丽华 胡良霖 周建设 李坤 《中国科技期刊研究》 北大核心 2023年第10期1270-1282,共13页
【目的】探究数据论文及关联数据集出版的元数据标准化工作,为数据期刊建设、科学数据出版机构开展相关创新实践提供参考,推动我国科学数据高质量发布共享。【方法】通过文献调研、内容对比和归纳法分析国内外数据论文出版现状,结合科... 【目的】探究数据论文及关联数据集出版的元数据标准化工作,为数据期刊建设、科学数据出版机构开展相关创新实践提供参考,推动我国科学数据高质量发布共享。【方法】通过文献调研、内容对比和归纳法分析国内外数据论文出版现状,结合科学数据出版工作实践,提炼数据论文及关联科学数据集出版要素,明确元数据规范对象、关联关系和特点。【结果】提出符合我国管理要求的数据论文及关联科学数据集出版元数据标准规范,形成元数据标准架构,明确元素定义和属性描述,并给出应用示例。【结论】研究成果支撑了国家标准《数据论文出版元数据》研制,对推进我国科学数据产权保护、促进科学数据开放共享和充分释放数据价值具有重要意义。 展开更多
关键词 开放科学 数据论文 科学数据出版 元数据 标准规范
原文传递
论语言智能教育 被引量:5
3
作者 周建设 薛嗣媛 《语言战略研究》 北大核心 2023年第4期30-43,共14页
语言智能教育是数智时代出现的新事物,涉及三方面内容:以语言智能学科为对象的理论教育,以语言智能工程为对象的技术教育,以语言智能服务为对象的应用教育。语言智能学科是基于语言理论的交叉学科,主要涉及脑语智能和计算智能两大主体... 语言智能教育是数智时代出现的新事物,涉及三方面内容:以语言智能学科为对象的理论教育,以语言智能工程为对象的技术教育,以语言智能服务为对象的应用教育。语言智能学科是基于语言理论的交叉学科,主要涉及脑语智能和计算智能两大主体内容。基于基础理论研究、数据资源建设、关键技术研发和应用系统创新四大主要方向,形成语言智能教育新模式。智能语音、机器翻译、知识图谱、智能内容生成、主题聚合度计算、情感计算、人文基因计算、写作智能评测等语言智能关键技术,是实现语言智能工程的基础。由教学资源建设、智能教学设计、智能读写训练、语言能力评估组成的“四位一体”的语言智能教学平台是语言智能在赋能全社会教育中的应用实践。 展开更多
关键词 数智时代 语言智能 智能教育 语言智能教育 技术应用
下载PDF
我国科学数据标准规范实践与思考 被引量:4
4
作者 朱艳华 高瑜蔚 +1 位作者 胡良霖 胡泊 《中国科学数据(中英文网络版)》 CSCD 2023年第1期158-167,共10页
科学数据标准规范是推动数据资源共享服务的重要基础,研究分析其需求变化和未来发展对充分发挥数据价值,提升我国科技创新竞争力具有重要意义。本文基于工作实践,调研分析我国科学数据标准研制现状,总结梳理现阶段数据标准研制的新需求... 科学数据标准规范是推动数据资源共享服务的重要基础,研究分析其需求变化和未来发展对充分发挥数据价值,提升我国科技创新竞争力具有重要意义。本文基于工作实践,调研分析我国科学数据标准研制现状,总结梳理现阶段数据标准研制的新需求。最后,文章提出我国科学数据标准规范工作思考与建议,包括充分发挥数据标准规范技术支撑作用,加强国际标准引领和团体标准研发,以及持续跟踪标准使用的效果和评价。 展开更多
关键词 科学数据 数据资源 标准规范体系 标准实践
下载PDF
中文智能阅读的困境与突破 被引量:8
5
作者 张文彦 张凯 《语言战略研究》 2018年第4期70-77,共8页
智能阅读作为当下教育领域发展的热点之一,无疑具有重要的社会意义和研究价值。和传统阅读方式相比,智能阅读将是改变中国阅读现状的有力手段。中国政府高度重视阅读推广工作。本文在人工智能时代背景下,通过调研当前各类型阅读平台的... 智能阅读作为当下教育领域发展的热点之一,无疑具有重要的社会意义和研究价值。和传统阅读方式相比,智能阅读将是改变中国阅读现状的有力手段。中国政府高度重视阅读推广工作。本文在人工智能时代背景下,通过调研当前各类型阅读平台的发展现状、社会意义等内容,分析目前中文智能阅读基础理论薄弱、技术难以借鉴等五大发展痛点,对智能阅读未来发展提出确立发展目标、确立国家标准等五项发展建议和理论完善、内容立体等三项走向预测。 展开更多
关键词 智能阅读 阅读分级标准 阅读能力评测理论 立体化阅读
下载PDF
语言智能技术发展与语言数据治理技术模式构建 被引量:7
6
作者 张凯 薛嗣媛 周建设 《语言战略研究》 CSSCI 北大核心 2022年第4期35-48,共14页
梳理近60年(1960~2019)语言智能技术专利申请文献,可以发现近5年语言智能技术进步显著,预计在未来较长一段时期内仍将处于技术爆发期。当下,语言数据治理的重要性日渐凸显。分析当前智能技术赋能下机器翻译、智能客服、网络舆情监测、... 梳理近60年(1960~2019)语言智能技术专利申请文献,可以发现近5年语言智能技术进步显著,预计在未来较长一段时期内仍将处于技术爆发期。当下,语言数据治理的重要性日渐凸显。分析当前智能技术赋能下机器翻译、智能客服、网络舆情监测、多语言资源建设等语言数据热点服务,指出语言数据治理体系面临的技术困境:(1)语言数据的偏见现象;(2)经典语言治理模型的短板。为破解困境并弥补经典数据挖掘模式的短板,提出点状聚合、线性组合和多层事态3种语言数据治理模式并展开对比分析,以期对智能化数据治理提供参考。 展开更多
关键词 专利文献分析 语言智能技术发展 语言数据治理 语言数据治理技术模式
下载PDF
写作智能评测研究综述和发展前景 被引量:4
7
作者 薛嗣媛 周建设 任福继 《中文信息学报》 CSCD 北大核心 2023年第2期1-14,共14页
随着计算机技术的发展,写作智能评测研究有了更加丰富的技术手段和应用场景。该文对写作智能评测的相关研究进行了梳理,首先对写作智能评测系统的发展历程进行了阶段性梳理;其次介绍了写作智能评测研究的任务模式、常用数据库、评估方式... 随着计算机技术的发展,写作智能评测研究有了更加丰富的技术手段和应用场景。该文对写作智能评测的相关研究进行了梳理,首先对写作智能评测系统的发展历程进行了阶段性梳理;其次介绍了写作智能评测研究的任务模式、常用数据库、评估方式;再次梳理了写作智能评测的主要技术方法;再次以面向汉语母语者、面向汉语非母语者两个不同维度展开介绍中文写作智能评测研究的现状及面临的挑战;最后对未来写作智能评测研究发展进行展望。 展开更多
关键词 写话智能评测 汉语作文测评 语言智能技术 中文信息处理
下载PDF
大语言模型在汉语写作智能评估中的应用研究 被引量:1
8
作者 薛嗣媛 周建设 《昆明学院学报》 2024年第2期10-22,共13页
研究旨在评估大语言模型在写作自动评分、智能评语生成两个典型写作智能评估任务中的性能。研究以汉语二语学习者为研究对象,采用了3种不同提示策略验证大语言模型在写作自动评分和自动评语反馈方面的有效性,包括标准提示、思维链提示... 研究旨在评估大语言模型在写作自动评分、智能评语生成两个典型写作智能评估任务中的性能。研究以汉语二语学习者为研究对象,采用了3种不同提示策略验证大语言模型在写作自动评分和自动评语反馈方面的有效性,包括标准提示、思维链提示以及自洽思维链提示。结果显示,尽管大语言模型在写作自动评分任务中表现出一定的潜力,其稳定性和可靠性仍有待提高,但通过不断优化这些提示策略,可以显著增强模型处理写作评分和评语生成的能力。此外,这3种提示语会产生不同的效果,以提示的方式评估大语言模型的性能表现存在主观性,还不能完全替代教师独立开展评估测试,但现阶段可以作为辅助工具提高教师评估作文的效率。本研究的发现为大语言模型在汉语写作智能评估领域的应用提供了有力支持,为未来开发更高效、更精准的汉语写作智能评估系统提供参考。 展开更多
关键词 写作智能评估 自动作文评分 智能评语生成 大语言模型 ChatGLM
下载PDF
语言智能评测理论研究与技术应用——以英语作文智能评测系统为例 被引量:7
9
作者 周建设 张凯 +3 位作者 罗茵 娜仁图雅 张跃 刘小力 《语言战略研究》 2017年第5期12-19,共8页
近些年,语言智能评测技术取得了重要突破并得到应用推广,拓展了中国语言产业发展的新领域。本文基于大数据背景,分析语言评测技术发展及相关理论模型,结合2017年"英语百万同题英语写作"数据,对比分析用户行为、效果提升等情况... 近些年,语言智能评测技术取得了重要突破并得到应用推广,拓展了中国语言产业发展的新领域。本文基于大数据背景,分析语言评测技术发展及相关理论模型,结合2017年"英语百万同题英语写作"数据,对比分析用户行为、效果提升等情况,印证评测技术的有效性和发展语言智能评测产业的重要性。 展开更多
关键词 英语作文评测 评测技术 语言智能 语言产业 人工智能
下载PDF
国家基础学科公共科学数据中心建设与发展实践
10
作者 高瑜蔚 胡良霖 +4 位作者 朱艳华 李坤 赵欢 马晓萌 王璐 《科学通报》 EI CAS CSCD 北大核心 2024年第24期3578-3588,共11页
数智时代,科学数据作为国家重要战略性资源和生产要素之一,将对国家科技水平提升和经济发展提供重要动能.《科学数据管理办法》发布后,国家基础学科公共科学数据中心正式成立,旨在汇集管理我国基础学科领域及典型区域长期科研活动积累... 数智时代,科学数据作为国家重要战略性资源和生产要素之一,将对国家科技水平提升和经济发展提供重要动能.《科学数据管理办法》发布后,国家基础学科公共科学数据中心正式成立,旨在汇集管理我国基础学科领域及典型区域长期科研活动积累的科学数据,以及相关基础领域政府预算资金支持项目汇交的科学数据,具有基础性、跨学科性和前沿性特征.经过近五年的建设实践,目前已形成完善的基础学科数据资源体系,以及支持分布式科学数据资源统一管理、集成融合、分析挖掘和应用服务的标准体系、服务体系和技术体系,持续深化数据国际交流合作.同时,创新科学数据出版新模式,引领科学数据的高效汇聚、开放共享、多学科交叉融合分析和创新应用.未来将在基础学科高质量数据集构建、数据治理服务模式创新、多学科交叉融合应用等方面进一步开展工作.本文综述国家基础学科公共科学数据中心建设模式与实践成效,以期为科学数据管理机构建设运行提供通用参考. 展开更多
关键词 科学数据中心 开放共享 多学科交叉 开放科学
原文传递
可计量的开放科学数据集影响力评价指标体系构建研究 被引量:2
11
作者 高瑜蔚 游新冬 +2 位作者 胡良霖 吕学强 周建设 《情报科学》 北大核心 2023年第7期49-60,69,共13页
【目的/意义】开放科学迈入全球共识新阶段,构建可计量的开放科学数据影响力评价指标体系,将为我国科学数据共享成效量化评价提供参考方案,对完善数据战略、释放科学数据价值和增加国际科技话语权具有重要意义。【方法/过程】基于文献... 【目的/意义】开放科学迈入全球共识新阶段,构建可计量的开放科学数据影响力评价指标体系,将为我国科学数据共享成效量化评价提供参考方案,对完善数据战略、释放科学数据价值和增加国际科技话语权具有重要意义。【方法/过程】基于文献调研法和国家科学数据中心工作实践,设置可计量的开放科学数据集影响力评价指标,采用专家打分法筛选指标;运用层次分析法对具有科学性、代表性和全面性的样本和指标进行量化研究,实现指标体系所涵盖的所有指标项可计量和各指标的权重可计量。【结果/结论】本文构建可计量的开放科学数据集影响力评价指标体系,涵盖学术影响力、决策影响力、社会影响力、国际影响力和经济影响力5个一级指标及24个二级指标。结论表明:开放科学数据集支撑的学术成果、社会影响、政府决策和国际合作等是其影响力评价指标体系的重要组成,科学数据的经济价值得到广泛认同。【创新/局限】基于调研和实践,本文依据多领域科学数据权威专家数据构建了可计量的开放科学数据集评价指标体系。受限于篇幅,实证研究有待进一步展开。 展开更多
关键词 开放科学 可计量 科学数据集评价 指标体系 层次分析法
原文传递
我国科技期刊数据政策制定研究 被引量:2
12
作者 张泽钰 姜璐璐 +3 位作者 高瑜蔚 李成赞 王鹏尧 周园春 《中国科技期刊研究》 北大核心 2023年第11期1367-1373,共7页
【目的】提出适用于我国科技期刊的关联数据存缴共享政策模板,为我国科技期刊制定数据政策提供基本要素、结构框架和主要内容参考。【方法】通过文献调研、实证研究等方式,分析我国科学数据管理规范体系,研究梳理国际出版商期刊数据政... 【目的】提出适用于我国科技期刊的关联数据存缴共享政策模板,为我国科技期刊制定数据政策提供基本要素、结构框架和主要内容参考。【方法】通过文献调研、实证研究等方式,分析我国科学数据管理规范体系,研究梳理国际出版商期刊数据政策、国际组织期刊数据政策框架建议、我国科学数据管理体系等内容,分析我国科技期刊数据政策基本要素。【结果】根据调研分析,提出一套通用型科技期刊数据政策模板,该模板可依据期刊实际需要自由组合、个性定制,可为不同期刊制定数据政策提供参考。【结论】目前已有44种期刊采用此模板,此模板帮助部分科技期刊“从无到有”制定数据政策,有利于论文关联数据的开放共享和长期存储。 展开更多
关键词 科学数据 论文关联数据 数据政策 数据存储库 科技期刊
原文传递
教育、科技、人才协同发展背景下的语言人才培养
13
作者 周建设 董苏 薛嗣媛 《外国语文》 北大核心 2024年第4期33-44,共12页
大语言模型的出现对当代语言人才培养提出了挑战性要求,教育部提出了一系列关于教育、科技、人才的战略要求。必然地,探索语言人才培养已成为我国语言文字工作者的时代使命。本文顺应语言科技发展趋势,适应语言人才培养需求,结合教育数... 大语言模型的出现对当代语言人才培养提出了挑战性要求,教育部提出了一系列关于教育、科技、人才的战略要求。必然地,探索语言人才培养已成为我国语言文字工作者的时代使命。本文顺应语言科技发展趋势,适应语言人才培养需求,结合教育数字化转型,全面了解国内外语言人才培养的研究基础和实践成果,分析语言人才培养政策,科学设计数智时代语言智能人才培养规格,完善语言智能培养方案,创新语言智能培养模式,实施语言智能培养战略。 展开更多
关键词 语言人才培养 语言智能 语言智能教育 大语言模型 数智时代
下载PDF
聚类标注和多粒度特征融合的基金新闻分类
14
作者 胡菊香 吕学强 +1 位作者 游新冬 周建设 《小型微型计算机系统》 CSCD 北大核心 2024年第2期257-264,共8页
针对人工标注类别耗时耗力、效率低,以及现有文本分类方法忽略词语、句子之间关系,未对文本分类关键特征赋予更高权重等问题,提出了一种基于聚类加权标注和多粒度特征融合的基金新闻分类方法.基于聚类加权的类别标注算法将K-Means和DBS... 针对人工标注类别耗时耗力、效率低,以及现有文本分类方法忽略词语、句子之间关系,未对文本分类关键特征赋予更高权重等问题,提出了一种基于聚类加权标注和多粒度特征融合的基金新闻分类方法.基于聚类加权的类别标注算法将K-Means和DBSCAN的聚类结果进行加权计算并自动标注基金文本数据,辅以少量人工校对,为后续基金新闻分类提供数据支撑.多粒度特征融合的分类算法首先从词粒度出发构建停用词表、扩展词典;其次从句粒度出发抽取新闻摘要,捕捉更具有语义关联的文本信息;最后将多头注意力机制嵌入BERT模型,对关键特征赋予更高权重,以提高分类的准确性.本文从多个角度进行了充分地实验,该方法具有高效的处理能力和有效性,其分类精确率可达到95.21%,优于现有方法. 展开更多
关键词 多粒度 特征融合 文本分类 深度学习
下载PDF
语言智能场景下在线课程学习行为情感语义分析与效果评价 被引量:1
15
作者 周楠 周建设 《现代教育技术》 2023年第8期96-106,共11页
利用语言智能技术解决在线课程学生学习行为情感语义分析存在的数据量大、分析耗费时间多、处理繁杂等问题,有助于实时掌握学习效果、改善教学方式。基于此,文章提出一种基于语言智能场景的学习行为情感语义分析ESAM-LI方法,该方法在梳... 利用语言智能技术解决在线课程学生学习行为情感语义分析存在的数据量大、分析耗费时间多、处理繁杂等问题,有助于实时掌握学习效果、改善教学方式。基于此,文章提出一种基于语言智能场景的学习行为情感语义分析ESAM-LI方法,该方法在梳理学习行为情感语义类型的基础上,首先获取在线课程学习行为文本信息并以基于Albert的微调模型方式进行模型训练;然后结合文本语言处理的BiLSTM模型和条件随机场CRF模型构建学习行为情感语义分析专业领域模型,同时构建情感信息标注标准并识别课程及教学知识点相关实体,获取学习行为情感语义极性类型;最后结合课程实体和教学知识点实体情感语义类型建立教学效果满意度评价模型并开展实证研究。实证效果表明,在课程效果评价和教学知识点评价上,ESAM-LI方法与传统教学效果评价方法两者高度一致,但ESAM-LI具有传统方法难以企及的处理速度,且能够克服人工主观误差,可为改善在线课程教学效果提供重要的借鉴。 展开更多
关键词 在线课程 语言智能 学习行为 情感分析 教学评价
下载PDF
SGNet:融合多特征的密集人群计数网络 被引量:3
16
作者 韩晶 王希畅 +1 位作者 吕学强 张凯 《计算机工程与设计》 北大核心 2022年第11期3001-3007,共7页
为解决密集人群计数任务中多列卷积核独立训练的限制及缺少针对性优化的问题,提出融合多尺度特征的密集人群计数算法SGNet。通过设计一种围绕相同感受野SRF(same receptive field)的特征融合方法,达到强化不同特征列之间的关联性,获得... 为解决密集人群计数任务中多列卷积核独立训练的限制及缺少针对性优化的问题,提出融合多尺度特征的密集人群计数算法SGNet。通过设计一种围绕相同感受野SRF(same receptive field)的特征融合方法,达到强化不同特征列之间的关联性,获得更多的特征细节和特征信息的目的;融合网格赢家通吃GWTA(grid winner-take-all)的思想设计损失函数,通过计算区域损失值着重优化重要特征。实验结果表明,与基线模型相比SGNet在任一数据集上的检测效果均有一定程度的提升,验证了该模型具有较强的鲁棒性及可移植性。 展开更多
关键词 密集人群 人数估计 密度图生成 相同感受野 网格赢家通吃
下载PDF
基于孪生神经网络的行文一致性测评研究 被引量:2
17
作者 刘杰 张文轩 +2 位作者 李亚光 张逸超 周建设 《北京理工大学学报》 EI CAS CSCD 北大核心 2022年第6期649-657,共9页
针对目前的篇章级行文一致性度量模型只考虑了待测作文的全文行文一致性,无法捕捉文本语义块的隐含语义特征及其之间的一致性问题,提出了一种通用的作文行文一致性测评模型.该模型借鉴孪生神经网络的思想,创新性地同时提取作文中核心人... 针对目前的篇章级行文一致性度量模型只考虑了待测作文的全文行文一致性,无法捕捉文本语义块的隐含语义特征及其之间的一致性问题,提出了一种通用的作文行文一致性测评模型.该模型借鉴孪生神经网络的思想,创新性地同时提取作文中核心人物的性格、形象特征以及故事情节特征并进行相似度度量,从而获取文本的中心思想以及行文一致性的匹配分数;使用无监督主题模型Biterm-LDA(Latent Dirichlet Allocation)对作文进行主题特征提取,解决了对手工标注的依赖。实验结果表明提出的模型评分与人工标注结果多数一致,且优于普通神经网络模型. 展开更多
关键词 作文测评 作文自动评分 行文一致性 孪生神经网络
下载PDF
TIMR:模板图像匹配矫正 被引量:2
18
作者 张祥祥 吕学强 +2 位作者 韩晶 游新冬 张凯 《小型微型计算机系统》 CSCD 北大核心 2022年第4期807-814,共8页
针对当前文档图像透视变形矫正算法抗干扰性差,矫正效果不佳等问题,本文提出一种基于BRISK特征点检测与匹配的文档图像矫正算法,称之为模板图像匹配矫正算法(Template Image Matching Rectification,TIMR).该算法仅需制作目标领域内的... 针对当前文档图像透视变形矫正算法抗干扰性差,矫正效果不佳等问题,本文提出一种基于BRISK特征点检测与匹配的文档图像矫正算法,称之为模板图像匹配矫正算法(Template Image Matching Rectification,TIMR).该算法仅需制作目标领域内的单张矫正模板图像,并结合BRISK算法与本文提出的双重特征点过滤算法实现该领域所有透视变形文档图像的矫正处理.其中,双重过滤算法包含特征点先验过滤(Prior Filtering,PF)与特征点迭代匹配过滤(Iterative Matching Filtering,IMF)算法,有效地过滤掉了矫正模板图像中的无关特征点与不稳定特征点,实现特征点匹配与TIMR算法的加速.在特定的医疗领域的检验单文档图像数据上进行矫正测试,并与当前主流矫正的算法与商业软件进行了比较.实验结果表明,本文算法具有使用简单方便,鲁棒性强,矫正效果好和矫正速度快等特点. 展开更多
关键词 图像处理 文档图像矫正 透视变换 图像匹配
下载PDF
基于逻辑图像理论的机器智能辅助阅读定量模型构建及其验证 被引量:2
19
作者 周建设 张文彦 +1 位作者 张凯 马鲁妮 《语言文字应用》 CSSCI 北大核心 2019年第3期96-104,共9页
本文从逻辑图像理论出发,在讨论了影响阅读量的相关因素特征后,提出了基于逻辑图像理论的智能辅助阅读定量模型,并以290名小学生和50名高校生作为实验分析对象,分别就阅读速度、心像信息量获取曲线等内容进行拟合和分析,设计出不同类型... 本文从逻辑图像理论出发,在讨论了影响阅读量的相关因素特征后,提出了基于逻辑图像理论的智能辅助阅读定量模型,并以290名小学生和50名高校生作为实验分析对象,分别就阅读速度、心像信息量获取曲线等内容进行拟合和分析,设计出不同类型的智能辅助阅读定量初始化原型,并给出后续定量生长曲线方向。本文为机器智能辅助阅读系统的定量考核提供基础模型和实验分析说明,是智能辅助阅读"六定模型"中的重要组成部分。 展开更多
关键词 逻辑图像理论 阅读定量模型 心像信息获取量 智能辅助阅读
下载PDF
DPENet:轻量化文档姿态估计网络 被引量:1
20
作者 韩晶 吕学强 +2 位作者 张祥祥 郝伟 张凯 《计算机工程与应用》 CSCD 北大核心 2022年第22期210-218,共9页
现有的用于矫正透视倾斜变形文档的深度学习模型存在空间泛化性差、模型参数量大、推理速度慢等问题。从姿态估计的角度出发,提出一种轻量化文档姿态估计网络DPENet(lightweight document pose estimation network),以优化上述问题。将... 现有的用于矫正透视倾斜变形文档的深度学习模型存在空间泛化性差、模型参数量大、推理速度慢等问题。从姿态估计的角度出发,提出一种轻量化文档姿态估计网络DPENet(lightweight document pose estimation network),以优化上述问题。将文档图像中的单一文档视为一个姿态估计对象,将文档的四个角点视为文档对象的四个姿态估计点,采用兼具全连接回归与高斯热图回归优点的DSNT(differentiable spatial to numerical transform)模块实现文档图像角点的高精度定位,并通过透视变换处理实现透视变形文档图像的高精度矫正。DPENet采用轻量化设计,以面向移动端的MobileNetV2为主干网络,模型体量只有10.6 MB。在SmartDoc-QA(仅取148张文档图像)数据集上与现有的三种主流网络进行了对比实验,实验结果表明,DPENet的矫正成功率(96.6%)和平均位移误差(mean displacement error,MDE)(1.28个像素)均优于其他三种网络,同时其平均矫正速度也有良好的表现。在保持轻量化和速度快的条件下,DPENet网络具有更高的变形文档矫正成功率和矫正精度。 展开更多
关键词 姿态估计 深度学习 文档图像矫正 轻量化网络 MobileNetV2
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部