-
题名综合文字和非文字区域特征的文档图像检索
被引量:4
- 1
-
-
作者
张田
-
机构
山东大学信息科学与工程学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第12期5-8,共4页
-
基金
国家自然科学基金重点项目No.60832008~~
-
文摘
提出一种改进的自适应文字区域提取算法,将文档图像分割成文字区域和非文字区域。对文字区域提取连通字符间空白、连通字符高度和宽度等局部特征,以及书写样式、段落特征等全局特征;对非文字区域,提取关键块特征。然后利用检索算法将文字区域特征和非文字区域特征结合起来,提高检索的准确性。同时,在检索算法中引入多维数据检索结构,有效地提高检索速度。通过对大规模文档数据库(包含12024个文档)的检索,表明该算法具有较高的效率,优于现有的一般文档图像检索算法。
-
关键词
文档图像检索
文字区域提取
段落特征
多维数据检索结构
-
Keywords
document image retrieval
text area extraction
paragraph feature
multi-dimensional retrieval structure
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于特征的文档图像检索
被引量:2
- 2
-
-
作者
张田
王希常
尘昌华
-
机构
山东师范大学管理与经济学院
山东师范大学信息科学与工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2009年第22期176-178,共3页
-
基金
山东省自然科学基金资助项目(2005ZRB01001)
山东师范大学学位论文创新基金资助项目
-
文摘
提出一种综合利用文档图像的段落特征和局部像素分布相对差特征进行文档图像检索的方法。给出段落特征和局部像素分布相对差特征的定义、提取方法以及基于这2个特征结合使用的检索方法。段落特征这一全局特征以及局部像素分布相对差特征这一局部特征相结合能够较好地表征和区分文档图像,检索方法将两者充分结合取得较好的效果。
-
关键词
文档图像检索
全局特征
段落特征
局部特征
局部像素分布相对差
-
Keywords
document image retrieval
global feature
paragraph feature
local feature
local relative difference of pixel distributions
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名一种改进的房产档案特征提取与分类方法
被引量:1
- 3
-
-
作者
钱俊霖
余建桥
-
机构
西南大学数据库与智能检索实验室
-
出处
《计算机工程》
CAS
CSCD
2012年第10期266-268,共3页
-
基金
重庆市自然科学基金资助项目(CSTC
2009BB2308)
中央高校基本科研业务费基金资助项目(XDJK2009C017)
-
文摘
针对房产电子档案分类与关键信息提取的问题,提出一种改进的特征提取与分类方法。将文档图像的段落特征和局部像素分布值特征作为房产文档图像的综合特征,利用模板训练支持向量机分类器,实现对入库的房产档案图像的自动分类。实验结果表明,该方法的分类效果和稳定性较好。
-
关键词
房产档案
段落特征
特征提取
档案分类
支持向量机分类器
局部特征
-
Keywords
house property archives
paragraph feature
feature extraction
archives classification
Support Vector Machine(SVM) classifier
local feature
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于人工智能技术的英语语段辅助评阅系统设计
被引量:2
- 4
-
-
作者
李琼
张小奇
-
机构
宣城职业技术学院
-
出处
《河北北方学院学报(自然科学版)》
2022年第1期44-48,共5页
-
文摘
目的为提高对英语语段的评阅能力,基于人工智能技术设计了一种英语语段辅助评阅系统。方法首先设计英语语段辅助评阅系统的总体结构,通过数据挖掘过程获得英语语段的大数据集合。然后设计英语语段特征检测模型,并分析英语语段特征。基于此,采用调度决策的方法构建英语语段辅助评阅的语言参数分布集,根据英语语段的语义参数分析结果,结合随机节点映射方法构建英语语段辅助评阅的信息聚类模型,根据人工智能算法完成英语语段辅助评阅的专家系统设计,从而实现对英语语段的辅助评阅。结果仿真结果表明,设计的英语语段辅助评阅系统的评阅准确度和可靠性均较高。结论系统的应用性较强,满足了设计预期。
-
关键词
人工智能技术
英语语段
辅助评阅
语义特征
-
Keywords
artificial intelligence technology
English paragraph
auxiliary review
semantic feature
-
分类号
TP399
[自动化与计算机技术—计算机应用技术]
-
-
题名汉译英段落翻译质量智能评估算法
- 5
-
-
作者
李荣
-
机构
湖南科技大学外国语学院
-
出处
《湖南工业职业技术学院学报》
2023年第4期121-125,共5页
-
基金
中国标准化协会服务贸易标准化科研课题研究项目“大学英语教学标准化促进中国国际服务贸易的研究与实践”(项目编号:FMBZH-1925)。
-
文摘
段落翻译作为大学英语四、六级考试中的主观题型之一具有重要地位。考虑到目前的段落翻译质量评估都是完全采用人工审阅的方式,这需要耗费大量的人力且整体审阅效率较低。为了缓解上述问题,本文提取了六种高质量的特征并结合朴素贝叶斯算法提出了一种汉译英段落翻译质量智能评估算法。实验结果表明,本文所提算法的平均F1值可以达到84.1%,这充分说明本方法可以用来辅助专家提升段落翻译的评阅效率。
-
关键词
段落翻译
质量评估
特征提取
朴素贝叶斯
-
Keywords
paragraph translation
quality evaluation
feature extraction
Naive Bayes
-
分类号
H391
[语言文字]
-
-
题名英语专业学生英文段落写作修辞特点研究
- 6
-
-
作者
赵淑君
陈博思奇
刘凌
-
机构
湖北工业大学外国语学院
-
出处
《英语广场(学术研究)》
2020年第14期41-45,共5页
-
基金
湖北省2018年大学生创新创业训练计划项目(201810500041)。
-
文摘
本研究从篇章的主题句、承题句、发展句三个方面,对高校英专学生英语段落写作的修辞特点,即词语选用、句式变换、组段谋篇进行研究,找出现有问题,分析原因,并提出教学建议。本研究提出要重视师生在英语写作教学中对修辞意识的培养和训练,为进一步提高学生英语笔头交际能力提供新视角。
-
关键词
英专学生
英语段落
修辞特点
-
Keywords
English majors
English paragraph
rhetoric feature
-
分类号
H31
[语言文字—英语]
G63
[文化科学—教育学]
-
-
题名一种基于段落同现频率的加权方法
被引量:3
- 7
-
-
作者
楼华锋
刘功申
-
机构
上海交通大学信息安全工程学院
-
出处
《信息安全与通信保密》
2009年第12期57-59,63,共4页
-
基金
上海科委科技攻关基金资助项目(编号:08511501902)
-
文摘
聚类算法的研究已经非常成熟了,但是这些聚类算法一般都是基于数值型信息,所以怎样把现有的一些经典聚类算法有效地应用到文本聚类,特别是中文文本聚类是一个非常重要的问题。文中提出了一种基于语义分析,利用段落同现频率来加权特征向量权值的方法。实验证明:基于语义分析特征向量加权的方法能够提高10%左右的文本聚类效果。同时,文中还研究了段落同现频率阈值选取问题,发现段落同现频率阈值选取大小对聚类效果有很大影响。
-
关键词
特征向量模型
段落同现频率
特征向量加权
-
Keywords
vector space model(VSM)
paragraph co-occurrence frequency(PCF)
feature value weighted
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名论彝语标准格律诗——“三段诗”
被引量:1
- 8
-
-
作者
王明贵
-
机构
毕节学院彝学研究院
-
出处
《贵州民族研究》
CSSCI
北大核心
2012年第5期48-53,共6页
-
基金
2010年度国家社会科学基金一般项目"彝族诗歌格律研究"(项目编号:10BZW121)的子课题成果
-
文摘
学术界往往用泛指的"三段式歌谣"代指彝语标准格律诗"三段诗"。"三段诗"不是普通的"三段式歌谣",它有其特殊的形成机制、结构特征、独特格律要求和文化哲学生态;它曾经被彝族古代文艺理论家所注意到,但是由于缺乏集中而精深的理论与实证相结合的研究,至今学术界对"三段诗"仍然有误解。对彝语"三段诗"进行理论与实证相结合的集中研究,可以消除这些误解。
-
关键词
三段诗
彝语标准格律诗
特征
文化生态
-
Keywords
three paragraph poem
standard metrical poetry on Yi Language
feature
Cultural Ecology
-
分类号
I207.22
[文学—中国文学]
-