期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Mathematical Expression Extraction in Text Fields of Documents Based on HMM
1
作者 Xuedong Tian Ruihan Bai +2 位作者 Fang Yang Jinyuan Bai Xinfu Li 《Journal of Computer and Communications》 2017年第14期1-13,共13页
Aiming at the problem that the mathematical expressions in unstructured text fields of documents are hard to be extracted automatically, rapidly and effectively, a method based on Hidden Markov Model (HMM) is proposed... Aiming at the problem that the mathematical expressions in unstructured text fields of documents are hard to be extracted automatically, rapidly and effectively, a method based on Hidden Markov Model (HMM) is proposed. Firstly, this method trained the HMM model through employing the symbol combination features of mathematical expressions. Then, some preprocessing works such as removing labels and filtering words were carried out. Finally, the preprocessed text was converted into an observation sequence as the input of the HMM model to determine which is the mathematical expression and extracts it. The experimental results show that the proposed method can effectively extract the mathematical expressions from the text fields of documents, and also has the relatively high accuracy rate and recall rate. 展开更多
关键词 Mathematical Expression EXTRACTION Hidden MARKOV Model text fields DOCUMENTS SYMBOL Combination Features
下载PDF
基于ASP的数据库开发中图像和大文本的存取方法
2
作者 何鲲 王邦元 《安徽建筑工业学院学报(自然科学版)》 2004年第1期63-65,共3页
ActiveServerPages是IIS提供的一种动态网页技术 ,可以用来开发高效Web数据库应用程序。本文讨论了在ASP脚本中采用Recordset对象的Getchunk方法和Appendchunk方法 ,从表中获取以及向表中插入BLOB数据的方法 ,来节省WEB服务器资源。
关键词 ASP 数据库 动态网页 Appendchunk法
下载PDF
文中油田东营组油藏沉积特征与成藏研究
3
作者 蒋文才 陆诗文 +3 位作者 黄克献 吴小丁 樊明会 李慧娟 《河南科技》 2013年第8X期165-166,共2页
东营组油藏属于文中油田次生油藏,目前在文中油田文10、文15、文276块等区块多井录井显示较好,且部分井电测结果显示为油层,多年来陆续对该油藏进行了试油试采试验。部分井见到了工业油气流。但是由于对对东营组油藏成藏规律认识不清,... 东营组油藏属于文中油田次生油藏,目前在文中油田文10、文15、文276块等区块多井录井显示较好,且部分井电测结果显示为油层,多年来陆续对该油藏进行了试油试采试验。部分井见到了工业油气流。但是由于对对东营组油藏成藏规律认识不清,没有进行系统的研究开发。需要对东营组油藏展布规律、成藏规模及潜力进行深入研究。 展开更多
关键词 东营组油藏 文中油田 砂泥岩沉积体系 储层物性
下载PDF
面向智能手机拍摄的变形文档图像校正 被引量:6
4
作者 周丽 冯百明 +1 位作者 关煜 方格 《计算机工程与科学》 CSCD 北大核心 2022年第1期102-109,共8页
智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题。针对以上问题,提出了一种基于最小化重投影的变形文档图像... 智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题。针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法。该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域。然后利用主成分分析法PCA在行连通域生成文本关键点。最后通过最小化关键点和其投影点之间的距离获取重采样参数,再对变形的页面进行最小化重投影来进行文档图像校正。校正后识别率得到有效提高,相比现有方法,所提方法取得了更好的识别效果,且使用消融实验验证了文本域合并和最小化重投影这2个模块对识别性能的提升效果。 展开更多
关键词 变形文档图像 文本域轮廓检测 PCA 最小化重投影 文档图像校正
下载PDF
局部与全局双重特征融合的自然场景文本检测 被引量:2
5
作者 李云洪 闫君宏 胡蕾 《数据采集与处理》 CSCD 北大核心 2022年第2期415-425,共11页
自然场景中文本的形状、方向和类别等变化丰富,场景文本检测仍然面临挑战。为了能够更好地将文本与非文本分隔并准确定位自然场景图像中的文本区域,本文提出一种局部与全局双重特征融合的文本检测网络,通过跳跃连接的方式实现多尺度全... 自然场景中文本的形状、方向和类别等变化丰富,场景文本检测仍然面临挑战。为了能够更好地将文本与非文本分隔并准确定位自然场景图像中的文本区域,本文提出一种局部与全局双重特征融合的文本检测网络,通过跳跃连接的方式实现多尺度全局特征融合,对恒等残差块进行改进实现局部细粒度特征融合,从而减少特征信息丢失,增强对文本区域特征提取力度,并采用多边形偏移文本域与文本边缘信息相结合的方式准确定位文本区域。为了评估本文方法的有效性,在现有经典数据集ICDAR2015和CTW1500上进行了多组对比实验,实验结果表明在复杂场景下该方法文本检测的性能更加卓越。 展开更多
关键词 文本检测 跳跃连接 细粒度特征融合 全局特征融合 多边形偏移文本域
下载PDF
基于文本域分割和文本行检测的扭曲文档图像校正
6
作者 张再银 童立靖 +1 位作者 湛健 沈冲 《电脑与信息技术》 2015年第1期13-15,共3页
针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要。文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的... 针对由照相机拍摄的文档图像可能存在倾斜或扭曲变形而导致光学字符识别(OCR)软件不能正确识别的情况,图像的校正处理方法研究变得越来越有必要。文中,首先采用文本域分割将文本分割为多个连通域,每个连通域包含一个字,标记出连通域的上、下、左、右边界,通过这些边界的联系检测出文本行;其次根据文本行首个连通域检测出校正基准线;最后根据校正基线和垂直位移距离分别对文字进行位移而得到校正后的图像,从而可以被光学字符识别软件识别。 展开更多
关键词 文本域分割 文本行检测 扭曲恢复
下载PDF
人类学与文学的互动──人类学学者访谈录之十二 被引量:5
7
作者 徐杰舜 叶舒宪 《广西民族学院学报(哲学社会科学版)》 CSSCI 北大核心 2001年第5期20-26,共7页
人类学与文学(包括文学创作、文学理论和文学批评)的相遇、交流、互动,是20世纪人文社会科学领域中引人注目的现象,由此催生的边缘学科研究如文学人类学与人类学诗学,在世纪之交时蓬勃发展,改变了两大学科的原有格局,拓展了学... 人类学与文学(包括文学创作、文学理论和文学批评)的相遇、交流、互动,是20世纪人文社会科学领域中引人注目的现象,由此催生的边缘学科研究如文学人类学与人类学诗学,在世纪之交时蓬勃发展,改变了两大学科的原有格局,拓展了学术空间。 展开更多
关键词 文学人类学 互动关系 人类学诗学 民族志诗学 口传文学 文学创作 文学批评
下载PDF
FCA在医学领域文本分类中的研究和应用 被引量:2
8
作者 徐坤 曹锦丹 毕强 《现代图书情报技术》 CSSCI 北大核心 2012年第3期23-26,共4页
在对文本分类技术和形式概念分析理论进行分析的基础上,针对医学领域文本的专业性特点,阐述利用形式概念分析进行医学领域文本分类的技术路线。通过中图法构建形式背景,进而生成概念格,利用概念格对领域文本进行分类,使分类效果接近人... 在对文本分类技术和形式概念分析理论进行分析的基础上,针对医学领域文本的专业性特点,阐述利用形式概念分析进行医学领域文本分类的技术路线。通过中图法构建形式背景,进而生成概念格,利用概念格对领域文本进行分类,使分类效果接近人工分类。探索基于形式概念分析的医学领域文本分类的新途径。 展开更多
关键词 文本分类 医学领域文本 形式概念分析 概念格
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部