期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于多特征融合结合深度学习模型的药材切片鉴别 被引量:1
1
作者 周丽媛 高红梅 +1 位作者 赵启军 高定国 《世界科学技术-中医药现代化》 CSCD 北大核心 2024年第1期211-217,共7页
目的针对现有复杂背景药材切片自动鉴别准确率较低的问题,实现复杂背景下药材切片图像的准确识别。方法基于整理的藏药材切片图像数据集进行实验,分析切片的RGB、HOG、LBP特征,使用改进的HOG算法进行多特征融合,最后使深度学习网络对任... 目的针对现有复杂背景药材切片自动鉴别准确率较低的问题,实现复杂背景下药材切片图像的准确识别。方法基于整理的藏药材切片图像数据集进行实验,分析切片的RGB、HOG、LBP特征,使用改进的HOG算法进行多特征融合,最后使深度学习网络对任务图像进行识别。结果本文提出的多特征融合结合深度学习方法对32种复杂背景下藏药材切片的3610张图像识别准确率达到91.68%,同时该方法对川贝母、山楂及半夏等20种常见中药饮片的平均鉴别准确率达到98.00%,优于其他现有的复杂背景下的中药饮片识别方法,说明该方法对其他中药材鉴定也同样具有可行性,应用范围较广泛。结论多特征融合能够较好地提取复杂背景下药材切片的区分特征,对于背景复杂且堆积遮挡严重的藏药材切片识别率较高,可有效应用于自然场景下的中药材、藏药材切片与其他中药饮片识别,具有较好的应用前景。 展开更多
关键词 特征融合 深度学习 藏药材 图像识别 药材切片 注意力机制
下载PDF
基于注意力网络的长时牦牛个体识别研究
2
作者 达措 赵启军 +2 位作者 高定国 索南尖措 尼玛扎西 《中国农机化学报》 北大核心 2024年第1期202-208,共7页
为推动精准畜牧业的发展及探讨长时间跨度下的动物个体识别,构建间隔6个月和12个月的同一批牦牛个体图像数据集。试验采用引入注意力机制的PCB+SE-ResNet50识别模型,实现短时和长时牦牛个体识别,从而分析影响长时牦牛个体识别的因素,并... 为推动精准畜牧业的发展及探讨长时间跨度下的动物个体识别,构建间隔6个月和12个月的同一批牦牛个体图像数据集。试验采用引入注意力机制的PCB+SE-ResNet50识别模型,实现短时和长时牦牛个体识别,从而分析影响长时牦牛个体识别的因素,并在该长时数据集上与ViT和PGCFL模型识别结果进行比较。结果表明:该模型在间隔6个月和12个月的数据集上识别平均精度均值达到60.37%、41.56%。相较于ViT,分别提高1.64%、5.82%;相较于PGCFL,分别提高12.40%、11.22%。该研究可为长时牦牛个体识别、养殖信息化及牲畜精准管理等提供理论依据和方法指导。 展开更多
关键词 精准畜牧业 牦牛 个体识别 注意力机制 动物生物特征
下载PDF
乌梅印刷多字体藏文文本的检测与识别 被引量:1
3
作者 高定国 侯闫 +1 位作者 高红梅 索朗曲珍 《高原科学研究》 CSCD 2023年第1期92-100,共9页
随着藏文信息处理技术的发展,藏文乌金字体的识别取得了很好的效果,但藏文乌梅字体由于书写风格差异大,检测和识别难,目前的乌梅字体识别仅限于以字丁识别、单一字体为主。近几年随着计算机字体的丰富,出现了乌梅印刷多字体文本。为了... 随着藏文信息处理技术的发展,藏文乌金字体的识别取得了很好的效果,但藏文乌梅字体由于书写风格差异大,检测和识别难,目前的乌梅字体识别仅限于以字丁识别、单一字体为主。近几年随着计算机字体的丰富,出现了乌梅印刷多字体文本。为了准确识别这类文本,文章基于中英文的预训练模型DBNet开展藏文文本检测,以ResNet-50为骨干网络的CRNN和SRN两种不同编码-解码方式开展端到端的乌梅印刷多字体文本识别,并以实验测试两种模型的识别结果。实验表明,当训练和测试所用字体一致时两个模型的识别效果相当;使用不在训练集中的另外8种乌梅字体进行测试时,SRN识别算法相比CRNN在TCR、TDR和LRA三个评价指标上分别提升0.5363%、1.7681%和3.4875%,表现出更强的泛化能力。 展开更多
关键词 乌梅 多字体 藏文文本 识别
下载PDF
敦煌藏文文献模糊版面的双重去噪预处理研究
4
作者 侯照 高定国 《信息与电脑》 2023年第6期93-99,共7页
敦煌文献是中华文化的宝贵遗产,其中藏文文献占据很大的比例。为收集、整理、利用敦煌藏文文献,对敦煌藏文文献的模糊版面进行专项研究是敦煌文献识别的基础,对推动文献的数字化发展具有重要意义。因此,文章构建了敦煌手写体藏文模糊图... 敦煌文献是中华文化的宝贵遗产,其中藏文文献占据很大的比例。为收集、整理、利用敦煌藏文文献,对敦煌藏文文献的模糊版面进行专项研究是敦煌文献识别的基础,对推动文献的数字化发展具有重要意义。因此,文章构建了敦煌手写体藏文模糊图像数据集,提出了一种名为高斯-文本卷积双重去噪(Gaussian-Text Convolution Dual Filtering,GTCDF)的预处理方法,实现敦煌藏文文献模糊版面的有效去噪。实验结果表明,此研究方法在敦煌手写体藏文模糊图像数据集上进行预处理,文本字符错误率下降20.41%。和其他现有预处理方法相比,此研究方法表现更优,可有效应用于敦煌藏文文献模糊版面的自动识别,对敦煌文献的数字化发展具有一定的推动作用。 展开更多
关键词 敦煌文献 藏文 模糊版面 预处理
下载PDF
西藏地区高校“面向对象技术”课程“立体”人才培养模式研究——以西藏大学为例
5
作者 高红梅 黄宇轩 +1 位作者 高定国 倪胜巧 《高原科学研究》 CSCD 2023年第2期105-113,共9页
计算机编程是实践性和应用性很强的课程,结合“新工科”建设的新要求和学生实际情况进行创新教学势在必行。文章以西藏大学“面向对象技术”课程为例,通过对教学内容、教材、教学资源、教学方法及手段、课程组织等开展创新探索。依托开... 计算机编程是实践性和应用性很强的课程,结合“新工科”建设的新要求和学生实际情况进行创新教学势在必行。文章以西藏大学“面向对象技术”课程为例,通过对教学内容、教材、教学资源、教学方法及手段、课程组织等开展创新探索。依托开放实验室,在项目培育驱动下,结合信息技术和校企合作等多渠道搭建智慧课程学习平台,构建“立体”课程教学模式,形成该课程大学四年系统、连贯、完整、立体的课程人才培养体系。实践证明该模式能够改变教学内容和教学方式单一、学生动手能力弱、主观能动性不强、专业整合统筹能力欠缺等问题。同时以该课程教学为契机,完成大学期间的工程能力培养和创新工作,更好的实现工科人才培养目标。 展开更多
关键词 “立体”人才培养 “面向对象技术”课程 开放实验室 西藏高校
下载PDF
结构先验指导的文本图像修复模型
6
作者 刘雨轩 赵启军 +2 位作者 潘帆 高定国 普布旦增 《中国图象图形学报》 CSCD 北大核心 2023年第12期3699-3712,共14页
目的图像修复是根据图像中已知内容来自动恢复丢失内容的过程。目前基于深度学习的图像修复模型在自然图像和人脸图像修复上取得了一定效果,但是鲜有对文本图像修复的研究,其中保证结构连贯和纹理一致的方法也没有关注文字本身的修复。... 目的图像修复是根据图像中已知内容来自动恢复丢失内容的过程。目前基于深度学习的图像修复模型在自然图像和人脸图像修复上取得了一定效果,但是鲜有对文本图像修复的研究,其中保证结构连贯和纹理一致的方法也没有关注文字本身的修复。针对这一问题,提出了一种结构先验指导的文本图像修复模型。方法首先以Transformer为基础,构建一个结构先验重建网络,捕捉全局依赖关系重建文本骨架和边缘结构先验图像,然后提出一种新的静态到动态残差模块(static-to-dynamic residual block,StDRB),将静态特征转换到动态文本图像序列特征,并将其融合到编码器—解码器结构的修复网络中,在结构先验指导和梯度先验损失等联合损失的监督下,使修复后的文本笔划连贯,内容真实自然,达到有利于下游文本检测和识别任务的目的。结果实验在藏文和英文两种语言的合成数据集上,与4种图像修复模型进行了比较。结果表明,本文模型在主观视觉感受上达到了较好的效果,在藏文和英文数据集上的峰值信噪比和结构相似度分别达到了42.31 dB,98.10%和39.23 dB,98.55%,使用Tesser⁃act OCR(optical character recognition)识别修复后藏文图像中的文字的准确率达到了62.83%,使用Tesseract OCR、CRNN(convolutional recurrent neural network)以及ASTER(attentional scene text recognizer)识别修复后英文图像中的文字的准确率分别达到了85.13%,86.04%和76.71%,均优于对比模型。结论本文提出的文本图像修复模型借鉴了图像修复方法的思想,利用文本图像中文字本身的特性,取得了更加准确的文本图像修复结果。 展开更多
关键词 图像修复 文本图像修复 结构先验 静态到动态残差模块(StDRB) 联合损失
原文传递
基于自然背景下的藏药材植株识别研究
7
作者 周丽媛 高红梅 +1 位作者 高定国 赵启军 《信息与电脑》 2022年第24期183-185,共3页
藏药材植株的分类识别是藏药材信息化建设的重要内容。早期的藏药材植株识别要依靠人工进行鉴别,极易出错且工作量较大。文章提出一种基于残差网络(Residual Network,ResNet)结合注意力机制的藏药材植株识别模型。实验结果表明,该方法... 藏药材植株的分类识别是藏药材信息化建设的重要内容。早期的藏药材植株识别要依靠人工进行鉴别,极易出错且工作量较大。文章提出一种基于残差网络(Residual Network,ResNet)结合注意力机制的藏药材植株识别模型。实验结果表明,该方法对33种自然场景下藏药材植株图像的识别准确率达到92.3%,优于其他中草药自动识别方法,可有效应用于自然场景下的藏药材植株自动识别,对于藏药材信息化建设工作具有较好的推进作用。 展开更多
关键词 深度学习 藏药材 图像识别 注意力机制
下载PDF
基于特征提示的跨语种语音识别模型
8
作者 王嘉文 高定国 +1 位作者 索朗曲珍 尼琼 《科学技术与工程》 北大核心 2024年第24期10348-10355,共8页
跨语种语音识别是一种利用多种源语言的数据来训练一个能够识别目标语言的语音识别系统,它可以促进不同语言和文化之间的交流和理解。为解决跨语种语音识别存在着如何利用多语种数据来提高低资源语言的识别性能,源语言和目标语言之间的... 跨语种语音识别是一种利用多种源语言的数据来训练一个能够识别目标语言的语音识别系统,它可以促进不同语言和文化之间的交流和理解。为解决跨语种语音识别存在着如何利用多语种数据来提高低资源语言的识别性能,源语言和目标语言之间的领域偏移或干扰,不同语言之间的任务权重和数据分布等问题,通过特征提示的方法研究跨语种语音识别模型;为简化传统需要专业人员对音素进行统一标注的过程,通过对原数据标识对应语种的方法研究跨语种语音数据标注方式,在2个公开数据集上进行实验。结果表明:所提模型相比于目前主流的语音识别模型Conformer模型平均错误率降低46.44%,相比于基线模型平均错误率降低2.1%,达到较高的识别准确率。研究成果为跨语种语音识别领域提供了新的思路和方法。 展开更多
关键词 特征提示 跨语种 语音识别 CONFORMER Contextnet
下载PDF
低质古籍文献图像预处理方法研究
9
作者 高定国 李婧怡 索朗曲珍 《高原科学研究》 CSCD 2024年第1期112-120,共9页
敦煌藏文文献是研究唐代吐蕃社会历史的珍贵文献。目前在敦煌藏文文献数字化研究方面,由于文献年代久远、书写载体低劣、保存条件差等各方面的原因使得文档图像背景杂乱、文字模糊并残缺不全,严重影响了文本识别系统的准确性和鲁棒性。... 敦煌藏文文献是研究唐代吐蕃社会历史的珍贵文献。目前在敦煌藏文文献数字化研究方面,由于文献年代久远、书写载体低劣、保存条件差等各方面的原因使得文档图像背景杂乱、文字模糊并残缺不全,严重影响了文本识别系统的准确性和鲁棒性。为了研究低质古籍文献图像的预处理对文字识别的影响,文章以古籍文献图像质量极差的敦煌藏文文献作为研究对象,分别采用对数变换、伽马变换、中值滤波变换、高斯滤波处理和PS人工批处理等传统方法,及全局阈值、自适应阈值和自定义阈值的二值化、基于神经网络ViT的图像增强方法对图像进行增强。对比实验表明,低质古籍图像预处理对文字识别率提升影响不大,但高斯滤波处理、自定义阈值的图像二值化和基于神经网络的图像数据增强对识别率提升有一定的促进作用。 展开更多
关键词 古籍 敦煌文献 低质文档 预处理
下载PDF
基于VITS模型的藏语康巴方言语音合成研究
10
作者 王嘉文 高定国 +1 位作者 尼琼 巴果 《电脑知识与技术》 2024年第4期8-10,15,共4页
藏语康巴方言是一种分布在中国西南部的少数民族语言,数据量低且具有丰富的声调和声母变化,给语音合成带来了很大的挑战。目前,现有的藏语语音合成模型大多基于传统的声码器或神经网络架构,需要大量的标注数据和复杂的训练过程,而且合... 藏语康巴方言是一种分布在中国西南部的少数民族语言,数据量低且具有丰富的声调和声母变化,给语音合成带来了很大的挑战。目前,现有的藏语语音合成模型大多基于传统的声码器或神经网络架构,需要大量的标注数据和复杂的训练过程,而且合成效果不理想。文章通过改进VITS模型,使其运用于藏语语音合成,在一个小规模的藏语康巴方言语料库上训练了VITS模型。实验结果表明,VITS模型可以很好地应用于藏语康巴方言的语音合成,不仅可以保持语音的自然度和清晰度,还可以准确地反映语音的声调和声母变化。 展开更多
关键词 VITS 藏语 康巴方言 语音合成
下载PDF
视频中藏文文本的检测方法研究
11
作者 索朗曲珍 高定国 +1 位作者 李婧怡 白玛旺久 《电脑知识与技术》 2023年第35期1-5,共5页
随着各种视频的增多,对于大量视频中文字的提取与监测等方面提出了更高的要求,研究视频中文字的文本检测和识别对语音文本的收集、视频监测等有重要的意义。目前视频中藏文文本的检测、识别研究还处于起步阶段,该文采用DBNet、DBNet++、... 随着各种视频的增多,对于大量视频中文字的提取与监测等方面提出了更高的要求,研究视频中文字的文本检测和识别对语音文本的收集、视频监测等有重要的意义。目前视频中藏文文本的检测、识别研究还处于起步阶段,该文采用DBNet、DBNet++、PSENet、EAST、FCENet等5种基于分割的深度学习文字检测算法对视频中藏文字幕进行了检测,对比分析了5种检测算法对视频中藏文字符的检测性能。实验表明,在文字检测阶段采用的渐进式扩展算法PSENet在测试集上具有更好的检测性能,其在测试集上的准确率、召回率、F1值分别达到了0.996、0.995、0.998。 展开更多
关键词 视频 藏文文本 检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部