期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
基于直线连续性的页面倾斜检测与校正 被引量:18
1
作者 王姝华 李佐 蔡士杰 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2001年第8期736-741,共6页
在文档扫描过程中 ,输入的文档图像不可避免地会发生倾斜现象 ,而布局分析及字符识别算法对页面倾斜都十分敏感 ,因此倾斜检测和校正是文档分析预处理的重要环节 .文中提出了一个基于直线连续性的倾斜检测方法 .它将字符连通区包围盒底... 在文档扫描过程中 ,输入的文档图像不可避免地会发生倾斜现象 ,而布局分析及字符识别算法对页面倾斜都十分敏感 ,因此倾斜检测和校正是文档分析预处理的重要环节 .文中提出了一个基于直线连续性的倾斜检测方法 .它将字符连通区包围盒底边中心点作为特征点 ,利用文本行中特征点与基线的关系 ,计算出基线的方向 ,即为页面倾斜方向 .接着 ,介绍了一种基于偏移值的倾斜校正方法 .实验证明 ,该算法速度快 ,准确度高 . 展开更多
关键词 文档处理 直线连续性 页面倾斜 检测 校正 计算机 自动处理 字符识别
下载PDF
Hough变换在中文名片图像倾斜校正中的应用 被引量:18
2
作者 潘武模 焦扬 王庆人 《中文信息学报》 CSCD 北大核心 2001年第3期50-56,共7页
近来 ,文档图像的计算机自动理解已取得很多进展。但是 ,对于具有倾斜的图像的理解仍然存在许多困难。这种困难在中文名片图像自动识别与理解系统中尤为突出。必须在系统的输入端对图像作有效的倾斜校正以保证系统的性能。由于中文名片... 近来 ,文档图像的计算机自动理解已取得很多进展。但是 ,对于具有倾斜的图像的理解仍然存在许多困难。这种困难在中文名片图像自动识别与理解系统中尤为突出。必须在系统的输入端对图像作有效的倾斜校正以保证系统的性能。由于中文名片版面复杂 ,名片中文字行以及每行字符较少 ,使得现有的倾斜校正算法在处理名片图像时效果很不理想。Hough变换可用于一般文档图像的倾斜校正。但是 ,Hough变换在名片图像中的应用还有待研究。本文提出一种二级Hough变换算法 ,并应用于名片图像理解系统 ,利用名片图像自身的特点提高Hough变换的精确度和速度。这一方法的效果已被实验结果所证实。 展开更多
关键词 文档分析 版面理解 倾斜校正 HOUGH变换 中文名片
下载PDF
一种改进的中文文档图像倾斜检测方法 被引量:8
3
作者 孙楠 刘志文 《计算机仿真》 CSCD 2006年第9期184-187,共4页
图像获取设备将纸质文档转换为文档图像时,经常会使文档图像出现某种程度的倾斜,从而可能使后续的文档版面理解和OCR识别算法失败。文中提出一种基于近邻法的中文图像的倾斜角度检测方法,并采用最小二乘法减小倾斜估计的误差,从而大大... 图像获取设备将纸质文档转换为文档图像时,经常会使文档图像出现某种程度的倾斜,从而可能使后续的文档版面理解和OCR识别算法失败。文中提出一种基于近邻法的中文图像的倾斜角度检测方法,并采用最小二乘法减小倾斜估计的误差,从而大大优化了运算速度,增强了算法的鲁棒性,与现有方法相比,具有运算速度快,检测精度高的优势。算法在V is-ual C++下编程加以实现,通过对检测库中100幅倾斜中文文档图像的检测证明,该方法具有精度高和适应性强的特点。 展开更多
关键词 文档图像 倾侧检测 近邻法 最小二乘法
下载PDF
基于灰度图像的表格框线去除算法 被引量:9
4
作者 张重阳 陈强 +1 位作者 娄震 杨静宇 《计算机研究与发展》 EI CSCD 北大核心 2005年第4期635-639,共5页
笔画与表格框线的交叠的现象在表格型文档中普遍存在,严重影响了文档自动处理系统的性能.现有的去线算法大部分都是基于二值图像的,许多有用的局部信息已经丢失.提出了直接利用图像灰度信息的灰值线检测与去除算法.首先利用图像的边缘... 笔画与表格框线的交叠的现象在表格型文档中普遍存在,严重影响了文档自动处理系统的性能.现有的去线算法大部分都是基于二值图像的,许多有用的局部信息已经丢失.提出了直接利用图像灰度信息的灰值线检测与去除算法.首先利用图像的边缘特征检测直线以及字线的相交位置;然后通过对直线上相交点对的分析确定字线的交叠方式,并将这些方式归纳为穿透和未穿透两类简单的形式;最后将直线划分为保护区和擦除区两部分,保护区内的像素在去线过程中被保留,而擦除区内的像素则利用灰度形态学算法来擦除.在我国现行支票上的实验表明算法是有效的. 展开更多
关键词 文档处理 表格处理 直线检测 直线去除
下载PDF
恶意文档检测研究综述 被引量:9
5
作者 喻民 姜建国 +3 位作者 李罡 刘超 黄伟庆 宋楠 《信息安全学报》 CSCD 2021年第3期54-76,共23页
近年来,以窃取敏感数据、破坏国家重要基础设施为主要目标的高级持续威胁(Advanced Persistent Threat,APT)已经给国家安全带来了严重的威胁。与可执行文件相比,恶意文档具有涉及领域广、影响范围大、用户防范意识不足、攻击手段灵活多... 近年来,以窃取敏感数据、破坏国家重要基础设施为主要目标的高级持续威胁(Advanced Persistent Threat,APT)已经给国家安全带来了严重的威胁。与可执行文件相比,恶意文档具有涉及领域广、影响范围大、用户防范意识不足、攻击手段灵活多样、难以检测等诸多特点,已经成为实施APT攻击的重要载体。因此有必要关注恶意文档检测已有的研究成果与发展趋势。本文首先对文档类型及其结构进行了解析,然后阐述了文档的安全隐患、攻击技术以及传播途径等。将当前恶意文档检测方法归纳为静态检测法、动态检测法、动静态结合检测法以及其他相关研究等四类,分别对各类检测方法的研究状况、进展进行了分析和总结。最后,提出了当前恶意文档检测研究的性能评价方法,综述了代表性的数据、检测工具和平台,并展望了未来的研究方向。 展开更多
关键词 恶意文档 恶意代码 检测方法 性能评价 特征分析
下载PDF
文档智能分析与识别前沿:回顾与展望 被引量:6
6
作者 刘成林 金连文 +2 位作者 白翔 李晓辉 殷飞 《中国图象图形学报》 CSCD 北大核心 2023年第8期2223-2252,共30页
文档分析与识别(简称文档识别)技术将各种非结构化文档数据(图像、联机笔迹)转化为结构化数据,便于计算机处理和理解,应用场景十分广阔。20世纪60年代以来,文档识别方法研究与应用受到广泛关注并取得巨大进展。得益于深度学习技术的发... 文档分析与识别(简称文档识别)技术将各种非结构化文档数据(图像、联机笔迹)转化为结构化数据,便于计算机处理和理解,应用场景十分广阔。20世纪60年代以来,文档识别方法研究与应用受到广泛关注并取得巨大进展。得益于深度学习技术的发展和应用,文档识别的性能快速提升,相关技术在文档数字化、票据处理、笔迹录入、智能交通、文档检索与信息抽取等领域得到广泛应用。首先介绍文档识别的背景和技术范畴,回顾该领域发展历史,然后重点对深度学习方法兴起以来的研究进行综述,分析当前技术存在的不足,并建议未来值得重视的研究方向。研究现状综述部分,按文档分析与识别的几个主要技术环节(文档图像预处理、版面分析、场景文本检测、文本识别、结构化符号和图形识别、文档检索与信息抽取)分别进行介绍,简述传统方法研究的代表性工作,重点介绍深度学习方法研究的新进展。总体上,当前研究对象向深度、广度扩展,处理方法全面转向深度神经网络模型和深度学习方法,识别性能大幅提升且应用场景不断扩展。在现状分析基础上,指出当前技术在识别精度和可靠性、可解释性、学习能力和自适应性等方面还有明显不足。最后从提升性能、应用扩展、提升学习能力几个角度提出一些研究方向。从提升性能角度,研究问题包括文本识别可靠性、可解释性、全要素识别、长尾问题、多语言、复杂版面分割与理解、变形文档分析与识别等。应用扩展包括新应用(如机器人流程自动化(robotic process automation,RPA)、文字信息抄录、考古)和新技术问题(语义信息抽取、跨模态融合、面向应用的推理决策等)两方面。从提升学习能力角度,相关问题包括小样本学习、迁移学习、多任务学习、领域自适应、结构化预测、弱监督学习、自监督学习、开放� 展开更多
关键词 文档分析与识别 文档智能 版面分析 文本检测 文本识别 图形符号识别 语义信息抽取
原文传递
基于文档平滑和查询扩展的文档敏感信息检测方法 被引量:8
7
作者 苏赢彬 杜学绘 +1 位作者 夏春涛 李海华 《计算机应用》 CSCD 北大核心 2014年第9期2639-2644,共6页
由于办公终端可能出现敏感信息泄露的风险,对终端上的文档进行敏感信息检测就显得十分重要,但现有敏感信息检测方法中存在上下文信息无关的索引导致文档建模不准确、查询语义扩展不充分的问题。为此,首先提出基于上下文的文档索引平滑算... 由于办公终端可能出现敏感信息泄露的风险,对终端上的文档进行敏感信息检测就显得十分重要,但现有敏感信息检测方法中存在上下文信息无关的索引导致文档建模不准确、查询语义扩展不充分的问题。为此,首先提出基于上下文的文档索引平滑算法,构建尽可能保留文档信息的索引;然后改进查询语义扩展算法,结合领域本体中概念敏感度适当扩大敏感信息检测范围;最后将文档平滑和查询扩展融合于语言模型,在其基础上提出了文档敏感信息检测方法。将采用不同索引机制、查询关键字扩展算法及检测模型的四种方法进行比较,所提出的算法在文档敏感信息检测中的查全率、准确率和F值分别为0.798,0.786和0.792,各项性能指标均明显优于对比算法。结果表明该算法是一种能更有效检测敏感信息的方法。 展开更多
关键词 敏感信息 文档平滑 语义扩展 语言模型 检测方法
下载PDF
文档图像识别技术回顾与展望 被引量:6
8
作者 刘成林 《数据与计算发展前沿》 2019年第2期17-25,共9页
【目的】文档图像是一类广泛存在且具有重要应用价值的数据。从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标。自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展。本文为科研人员... 【目的】文档图像是一类广泛存在且具有重要应用价值的数据。从文档图像中检测文字并转化为计算机内码(电子文本)是文档识别的主要目标。自上世纪50年代以来,文档识别(又称文字识别,OCR)的研究和应用取得了巨大的进展。本文为科研人员和工程人员提供一个比较全面的文档图像识别技术总体介绍,便于大家开展技术创新和技术应用。【方法】本文在介绍文档识别应用背景的基础上,对该领域历史上主要方法进行回顾,对当前技术状况和研究动态进行分析,并展望未来发展趋势。【结果】1950年代到2000年代,在统计模式识别、特征提取、结构分析、字符切分、字符串识别和版面分析等方面积累了大量有效方法。【结论】近年来深度学习(深度神经网络)逐渐成为主导性的方法,使文字检测和识别的性能得到明显提升,但在复杂版面分析能力、文字识别的可靠性、泛化性等方面仍然存在不足。 展开更多
关键词 文档识别 版面分析 文本检测 深度学习 字符识别 文本行识别
下载PDF
一种文本图像倾斜校正的方法 被引量:5
9
作者 王辉 牟宏鑫 +1 位作者 王嘉梅 梁志茂 《云南民族大学学报(自然科学版)》 CAS 2010年第3期232-234,共3页
文档图像倾斜检测与校正是文档分析的预处理的重要环节.提出了一种基于像素点的方法来检测文档图像的倾斜问题,并通过迭代运算来准确的实现倾斜文档图像的校正.实验结果表明,本算法速度快,精确度高,具有较强的实用性.
关键词 文本倾斜 倾斜检测 倾斜校正
下载PDF
恶意PDF文档检测技术研究进展 被引量:6
10
作者 林杨东 杜学绘 孙奕 《计算机应用研究》 CSCD 北大核心 2018年第8期2251-2255,共5页
针对PDF的漏洞及相应攻击手段日新月异,传统的恶意PDF文档检测技术难以应对各种新型威胁。目前针对恶意PDF文档检测的研究已取得一定成果,为了更深入地解决该技术存在的不足,采用文献分析方法,首先讨论了必要性、简述了其相关概念和检... 针对PDF的漏洞及相应攻击手段日新月异,传统的恶意PDF文档检测技术难以应对各种新型威胁。目前针对恶意PDF文档检测的研究已取得一定成果,为了更深入地解决该技术存在的不足,采用文献分析方法,首先讨论了必要性、简述了其相关概念和检测基本框架;其次针对其分析技术的不同将现有方案进行分类,从适用范围、检测效果、检测效率等多个方面进行对比分析。最后归纳了该领域当前的热点和发展前景。 展开更多
关键词 PDF 文档检测 静态分析 动态分析
下载PDF
毕业设计文档管理技术探索及实践 被引量:5
11
作者 张卫丰 周国强 《教育与教学研究》 2009年第11期58-60,67,共4页
文章提出了一种基于文档自动生成和格式自动检测的毕业设计文档管理技术。这种技术利用文档内容和格式共享模板,实现了大量文档的自动生成和格式的自动检测,解决了大量重复文档内容的手工填写和格式检测的低效和易出错的问题,提高了毕... 文章提出了一种基于文档自动生成和格式自动检测的毕业设计文档管理技术。这种技术利用文档内容和格式共享模板,实现了大量文档的自动生成和格式的自动检测,解决了大量重复文档内容的手工填写和格式检测的低效和易出错的问题,提高了毕业设计文档的管理效率;同时便于进行版本控制从而保证文档一致性。利用该技术的毕业设计文档管理系统自投入到应用以来取得了满意的效果。 展开更多
关键词 毕业设计 文档生成 文档管理 格式检测
下载PDF
一种用于抄袭识别的文档距离度量 被引量:5
12
作者 胡明晓 DING Leon X 《计算机工程与应用》 CSCD 北大核心 2010年第7期148-152,177,共6页
广义编辑距离的计算是一个NP-完全问题,在充分考虑了文档抄袭行为的特点之后提出一种基于广义编辑距离的单向的低计算复杂性的文档距离度量方法。首先,计算第一文档的各段落在第二文档全文中的近似串匹配距离之和,同时确定各段落在第二... 广义编辑距离的计算是一个NP-完全问题,在充分考虑了文档抄袭行为的特点之后提出一种基于广义编辑距离的单向的低计算复杂性的文档距离度量方法。首先,计算第一文档的各段落在第二文档全文中的近似串匹配距离之和,同时确定各段落在第二文档中的近似匹配子串(即原象串),然后根据这些原象串得到回退数和前跳数,最后将三者求和作为文档距离。该文档距离是一种广义编辑距离的近似值,能够在O(n2)时间内计算,并能充分反映抄袭方向。针对人工文档和实际文档的两组实验表明该距离具有较低的漏检率、误检率。 展开更多
关键词 文档距离 广义编辑距离 近似串匹配 抄袭识别 电子文档管理
下载PDF
一种面向文档复制检测的特征提取方法 被引量:3
13
作者 李旭 刘国华 +1 位作者 余靖 王蕾 《小型微型计算机系统》 CSCD 北大核心 2008年第5期813-816,共4页
介绍一种文档复制检测中基于窗口的特征提取方法,并从理论上分析了性能.采用重叠的文本块分割文档,利用滚动的HASH函数把文本块映射成散列值,再从定义的散列值窗口中选择文本特征.实验验证了方法的特性并与具有代表性的文档复制检测系... 介绍一种文档复制检测中基于窗口的特征提取方法,并从理论上分析了性能.采用重叠的文本块分割文档,利用滚动的HASH函数把文本块映射成散列值,再从定义的散列值窗口中选择文本特征.实验验证了方法的特性并与具有代表性的文档复制检测系统进行了对比,结果表明该方法能够确保发现文本长度大于保证阈值的复制内容,有效地提高了检测结果的准确性. 展开更多
关键词 数字文档 复制检测 特征提取 相似度
下载PDF
面向NoSQL数据库的JSON文档异常检测与语义消歧模型 被引量:5
14
作者 刘立成 徐一凡 +1 位作者 谢贵才 段磊 《计算机科学》 CSCD 北大核心 2021年第2期93-99,共7页
随着信息化技术的发展,面对材料等相关领域数据的多源异构、扩展性强、爆炸增长等特点,传统关系数据库无法对数据进行存储,因此可利用NoSQL的无模式存储、高扩展性等特性来解决这一难题。作为NoSQL数据库常用的数据存储格式,JSON因简单... 随着信息化技术的发展,面对材料等相关领域数据的多源异构、扩展性强、爆炸增长等特点,传统关系数据库无法对数据进行存储,因此可利用NoSQL的无模式存储、高扩展性等特性来解决这一难题。作为NoSQL数据库常用的数据存储格式,JSON因简单性和灵活性备受欢迎。然而,NoSQL数据库缺乏模式信息,在JSON文档存入数据库之前,需要对其进行数据验证与分析。目前,大多数方法是基于JSON schema对JSON文档格式的规范性进行校验,无法有效解决JSON文档的异常检测以及语义歧义问题。为此,文中提出了面向NoSQL数据库的JSON文档异常检测与语义消歧模型doctorJSON。该模型基于JSON schema对存入的JSON文档分别设计了异常检测算法deoutJSON和语义消歧算法disemaJSON,以检测JSON文档存在的异常和歧义。在真实数据集与合成数据集上的实验验证了所提模型的有效性和执行效率。 展开更多
关键词 NOSQL数据库 JSON schema JSON文档 异常检测 语义消歧
下载PDF
表格型票据中框线检测与去除算法 被引量:5
15
作者 张艳 郁生阳 +1 位作者 张重阳 杨静宇 《计算机研究与发展》 EI CSCD 北大核心 2008年第5期909-914,共6页
字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去... 字符笔画与表格线的粘连或交叠是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去除算法,首先充分利用票据灰度图像的特点准确地检测出框线,再采用一种连通链结构描述叠加后的框线区域,然后对交叠进行判断和标记,根据标记保留字符笔划去除框线干扰.经过实际银行支票图像测试证明了算法的有效性和鲁棒性. 展开更多
关键词 文档分析 表格识别 直线检测 连通链结构 框线去除
下载PDF
基于极坐标转换的中文印章文字识别 被引量:5
16
作者 戴俊峰 杨天 熊闻心 《计算机工程与设计》 北大核心 2021年第11期3174-3180,共7页
为能够处理文档中印章元素的关键信息,促进办公智能化,提出一种基于极坐标转换的印章文字识别方法。根据印章元素通常成圆环状排列的特点,对中文印章图像进行极坐标展开,克服印章文字方向不统一的问题,利用CTPN+CRNN网络进行文字的检测... 为能够处理文档中印章元素的关键信息,促进办公智能化,提出一种基于极坐标转换的印章文字识别方法。根据印章元素通常成圆环状排列的特点,对中文印章图像进行极坐标展开,克服印章文字方向不统一的问题,利用CTPN+CRNN网络进行文字的检测与识别,对CTPN网络中的文本构造算法进行改进,实现对印章内容快速准确的识别。用该算法对自制的中文印章数据集进行实验,印章内容的文字识别召回率可以达到90.4%,表明该算法可以有效检测识别印章内容,对文档的分类与鉴别研究具有重要的意义。 展开更多
关键词 印章识别 极坐标转换 文档鉴别 文字分割 文字检测
下载PDF
基于边界识别与组合的裁判文书证据抽取方法研究 被引量:5
17
作者 杨健 黄瑞章 +2 位作者 丁志远 陈艳平 秦永彬 《中文信息学报》 CSCD 北大核心 2020年第3期80-87,共8页
裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",... 裁判文书中的证据是法官量刑的基础。通过证据抽取可以对案件审判质量进行评估,从而支撑"智慧法院"建设。裁判文书中的证据大多数都比较长且存在嵌套现象,例如,"张X的身份证复印件"中的"身份证复印件",而传统的命名实体识别模型BiLSTM-CRF对较长实体和嵌套实体的识别性能较低。为了解决因裁判文书中的证据长度较长和嵌套现象而导致证据抽取性能较低的问题,该文提出了一种基于边界识别与组合的证据抽取模型。该模型首先使用BiLSTM-CRF模型识别证据的开始边界和结束边界;然后组合开始边界和结束边界,形成携带大量丰富细粒度边界信息的候选证据;最后使用基于三通道的多核CNN模型,融合细粒度的边界信息特征,对候选证据进行筛选,识别候选证据中正确的证据。实验结果表明,该文提出的模型能有效地抽取裁判文书中的证据。 展开更多
关键词 裁判文书 证据抽取 智慧法院 边界识别与组合
下载PDF
基于视觉和文本的多模态文档图像目标检测 被引量:3
18
作者 李玉腾 史操 +1 位作者 许灿辉 程远志 《计算机应用研究》 CSCD 北大核心 2023年第5期1559-1564,共6页
由于文档图像的布局复杂、目标对象尺寸分布不均匀,现有的检测算法很少考虑多模态信息和全局依赖关系,提出了基于视觉和文本的多模态文档图像目标检测方法。首先探索多模态特征的融合策略,为利用文本特征,将图像中文本序列信息转换为二... 由于文档图像的布局复杂、目标对象尺寸分布不均匀,现有的检测算法很少考虑多模态信息和全局依赖关系,提出了基于视觉和文本的多模态文档图像目标检测方法。首先探索多模态特征的融合策略,为利用文本特征,将图像中文本序列信息转换为二维表征,在文本特征和视觉特征初次融合之后,将其输入到骨干网络提取多尺度特征,并在提取过程中多次融入文本特征实现多模态特征的深度融合;为保证小物体和大物体的检测精度,设计了一个金字塔网络,该网络的横向连接将上采样的特征图与自下而上生成的特征图在通道上连接,实现高层语义信息和低层特征信息的传播。在大型公开数据集PubLayNet上的实验结果表明,该方法的检测精度为95.86%,与其他检测方法相比有更高的准确率。该方法不仅实现了多模态特征的深度融合,还丰富了融合的多模态特征信息,具有良好的检测性能。 展开更多
关键词 多模态 文档图像 目标检测 深度学习
下载PDF
图书馆文献修复中纸张检测技术的应用研究
19
作者 李丹霞 朱晓琴 《造纸科学与技术》 2024年第7期75-77,93,共4页
文献修复工作关系到资料的保护和传承,纸张检测是文献修复的首要工作。随着科学技术手段的不断进步,纸张检测技术不断提升,为文献修复提供了保障。在分析图书馆文献修复与纸张检测技术现状的基础上,多方面、综合性介绍了基于图像识别的... 文献修复工作关系到资料的保护和传承,纸张检测是文献修复的首要工作。随着科学技术手段的不断进步,纸张检测技术不断提升,为文献修复提供了保障。在分析图书馆文献修复与纸张检测技术现状的基础上,多方面、综合性介绍了基于图像识别的纸张检测技术应用要点,并对纸张检测技术的未来研究前景进行了分析,以期提高图书馆文献资料的修复质量。 展开更多
关键词 文献修复 纸张检测 图像处理
下载PDF
基于深度学习识别算法的文件敏感词多维度检测技术研究
20
作者 邓又琦 张明 马敬济 《计算机与数字工程》 2024年第8期2435-2439,共5页
在文件利用环节,采用深度学习智能识别算法,实现对用户上传的待测文件内容进行自动化、智能化检测和分析评估。通过采用面向敏感词专用训练集的OCR检测深度学习算法、基于IF-IDF算法的文件敏感词主题识别算法,实现敏感词多维度智能检测... 在文件利用环节,采用深度学习智能识别算法,实现对用户上传的待测文件内容进行自动化、智能化检测和分析评估。通过采用面向敏感词专用训练集的OCR检测深度学习算法、基于IF-IDF算法的文件敏感词主题识别算法,实现敏感词多维度智能检测,并将检测出来的敏感信息生成检测报告,供用户或审核人进行检查确认,辅助用户对敏感信息进行处理,以大幅提升敏感词检测准确度和检测效率,降低人工核验差错率,从而最大程度地保证企业数据的安全。 展开更多
关键词 深度学习 算法 文件 敏感词 检测
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部