期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
关于文本特征抽取新方法的研究 被引量:78
1
作者 李凡 鲁明羽 陆玉昌 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2001年第7期98-101,共4页
该文研究了已有和最新的各种基于评估函数的特征筛选方法 ,评价了它们的优缺点和适用范围 ,并实现了一种用评估函数代替 TFIDF法中 IDF函数进行分类的新算法。然后进一步从如何放宽特征独立性假设 。
关键词 文本挖掘 词袋法 评估函数 特征独立性假设 等级树 特征抽取 文本分类
原文传递
融合显著特征和互信息熵的SLAM闭环检测算法 被引量:7
2
作者 石祥滨 耿凯 刘翠微 《小型微型计算机系统》 CSCD 北大核心 2020年第1期171-176,共6页
针对移动机器人SLAM闭环检测存在的闭环错误判定问题,提出了一种融合显著特征和互信息熵的闭环检测算法.首先,通过帧间位姿变化和信息熵差异得到关键帧,利用词袋模型逆向索引查询关键帧获取闭环候选帧.然后,引入图像颜色与深度信息计算... 针对移动机器人SLAM闭环检测存在的闭环错误判定问题,提出了一种融合显著特征和互信息熵的闭环检测算法.首先,通过帧间位姿变化和信息熵差异得到关键帧,利用词袋模型逆向索引查询关键帧获取闭环候选帧.然后,引入图像颜色与深度信息计算当前关键帧与闭环候选帧的显著特征生成显著图.最后,将显著图均匀划分四块,计算两匹配关键帧显著图对应块的互信息熵,由每块对应互信息熵生成一个表征两幅图像相似度的四维向量,通过四维向量将满足互信息熵条件的闭环帧进行几何验证,判断是否产生闭环.实验结果表明,该算法能够降低机器人累积误差,生成全局一致的地图,同时满足实时性要求. 展开更多
关键词 SLAM 关键帧 闭环检测 词袋模型 显著特征 互信息熵
下载PDF
面向暴恐音视频的内容检测系统研究与实现 被引量:1
3
作者 黄超 易平 《通信技术》 2018年第1期75-81,共7页
网络上有海量的音视频,其中暴恐音视频不容忽视。对面向暴恐音视频的内容检测系统进行研究,选取音频特征MFCC作为检测特征,采用词袋模型建模,利用支持向量机分类,优化了多个全局参数,过滤了无用镜头,采用欠采样平衡正负样本的数目差距,... 网络上有海量的音视频,其中暴恐音视频不容忽视。对面向暴恐音视频的内容检测系统进行研究,选取音频特征MFCC作为检测特征,采用词袋模型建模,利用支持向量机分类,优化了多个全局参数,过滤了无用镜头,采用欠采样平衡正负样本的数目差距,减少了冗余和训练复杂度,取得了理想的检测效果,且能给出暴恐程度的评估。具体地,提出了词频加权参数c的改进算法和基于距离倍数的词频加权改进算法,能使词袋模型表示更精确,从而提高了准确率。 展开更多
关键词 暴恐检测 词袋模型 支持向量机 词频加权
下载PDF
基于词袋模型与几何不变特征的笔迹鉴别 被引量:1
4
作者 李新德 阿依夏木·力提甫 +1 位作者 杨天 熊闻心 《计算机应用与软件》 北大核心 2022年第7期154-158,180,共6页
针对手写笔迹的高度相似性与随机性提出一种利用几何矩定量表示字符形状特征的笔迹鉴别方法。该算法先搭建文本依存的词袋模型,提取几何矩的八个不变特征。在分类决策层利用因子分离与特征融合方法,实现文本独立的笔迹分类。该算法在IA... 针对手写笔迹的高度相似性与随机性提出一种利用几何矩定量表示字符形状特征的笔迹鉴别方法。该算法先搭建文本依存的词袋模型,提取几何矩的八个不变特征。在分类决策层利用因子分离与特征融合方法,实现文本独立的笔迹分类。该算法在IAM数据集中的首选(Top-1)鉴别率已达到96.7%,取得了同类研究中前四的成绩。实验结果表明,基于词袋模型和矩特征的笔迹鉴别方法在维吾尔文以及英文数据集上具有较好的分类与鉴别能力。 展开更多
关键词 笔迹鉴别 词袋文本 独立特征 融合矩特征
下载PDF
基于朴素贝叶斯的文本情感分类及实现 被引量:14
5
作者 梁柯 李健 +1 位作者 陈颖雪 刘志钢 《智能计算机与应用》 2019年第5期150-153,157,共5页
本文利用Python语言,对25 000条英文影评数据进行文本分类。首先利用词袋模型对文本数据进行分类。在此基础上加入Word2Vec建立新的词向量特征,通过精准率和召回率对比前后2种模型的分类效果;最后通过逻辑回归和朴素贝叶斯分类模型的分... 本文利用Python语言,对25 000条英文影评数据进行文本分类。首先利用词袋模型对文本数据进行分类。在此基础上加入Word2Vec建立新的词向量特征,通过精准率和召回率对比前后2种模型的分类效果;最后通过逻辑回归和朴素贝叶斯分类模型的分类效果对照得出研究结论。结果表明:对于英文影评文本分类,在同等条件下,使用Word2Vec构建词向量模型的精准率和召回率比使用bag of Word词袋模型分别高出0.02个百分点和0.026个百分点;在使用Word2Vec的基础上,朴素贝叶斯分类器的精准率和召回率分别高出逻辑回归分类0.027个百分点和0.028个百分点。 展开更多
关键词 文本分类 词袋模型 word2Vec 逻辑回归 朴素贝叶斯
下载PDF
基于SIFT-SVM的发动机主轴承盖识别与分类 被引量:9
6
作者 石志良 张鹏飞 李晓垚 《图学学报》 CSCD 北大核心 2020年第3期382-389,共8页
机械零部件的识别与分类任务是制造业自动化生产线的关键环节。针对发动机主轴承盖混合清洗后的分类,通过分析发动机主轴承盖零件的实际特征,提出基于SIFT-SVM的主轴承盖分类识别方法。该方法首先提取训练数据集图像的所有尺度不变(SIFT... 机械零部件的识别与分类任务是制造业自动化生产线的关键环节。针对发动机主轴承盖混合清洗后的分类,通过分析发动机主轴承盖零件的实际特征,提出基于SIFT-SVM的主轴承盖分类识别方法。该方法首先提取训练数据集图像的所有尺度不变(SIFT)特征向量,采用K-means聚类方法,将所有的特征向量聚类成K个分类,并将其代入词袋模型(BoW)中,使用K个"词汇"来描述每一张训练图像,从而得到图像的BoW描述。且以每张图像的BoW描述作为训练输入,使用支持向量机(SVM)训练主轴承盖的分类模型。实验结果表明:在标定的照明条件下,主轴承盖零件的识别率可达100%,单个零件识别时间为0.6 s,验证了该算法的有效性和高效性。 展开更多
关键词 零件识别与分类 机器视觉 SIFT 词袋模型 支持向量机分类器
下载PDF
一种基于改进词袋模型的视觉SLAM算法 被引量:7
7
作者 张光耀 倪益华 +2 位作者 吕艳 倪忠进 黄通交 《河南理工大学学报(自然科学版)》 CAS 北大核心 2021年第4期154-161,共8页
针对室内环境中视觉同时定位与建图(simultaneous localization and mapping,SLAM)精度不高和实用性较差等问题,采用深度相机作为传感器,提出一种基于改进词袋模型的视觉SLAM算法。该算法通过增加节点距离的方式,对传统的词袋模型进行改... 针对室内环境中视觉同时定位与建图(simultaneous localization and mapping,SLAM)精度不高和实用性较差等问题,采用深度相机作为传感器,提出一种基于改进词袋模型的视觉SLAM算法。该算法通过增加节点距离的方式,对传统的词袋模型进行改进,采用octree方法转化点云,生成可用于导航的八叉树图,并进行改进前后词袋模型对比实验、数据集精度实验和实验室实测。结果表明,改进后的词袋模型相似度计算能力和区分度更强,SLAM算法在环境有回环和相机运动较慢的情况下,效果较好,可满足室内同时定位与建图及后续导航需求。 展开更多
关键词 视觉SLAM 回环检测 词袋模型 八叉树地图 TUM数据集
下载PDF
基于多传感信息融合的语义词袋SLAM优化算法
8
作者 袁鹏 谷志茹 +2 位作者 刘中伟 焦龙飞 毛麒云 《计算机应用研究》 CSCD 北大核心 2024年第4期1247-1251,共5页
针对室外大范围场景移动机器人建图中,激光雷达里程计位姿计算不准确导致SLAM(simultaneous localization and mapping)算法精度下降的问题,提出一种基于多传感信息融合的SLAM语义词袋优化算法MSW-SLAM(multi-sensor information fusion... 针对室外大范围场景移动机器人建图中,激光雷达里程计位姿计算不准确导致SLAM(simultaneous localization and mapping)算法精度下降的问题,提出一种基于多传感信息融合的SLAM语义词袋优化算法MSW-SLAM(multi-sensor information fusion SLAM based on semantic word bags)。采用视觉惯性系统引入激光雷达原始观测数据,并通过滑动窗口实现了IMU(inertia measurement unit)量测、视觉特征和激光点云特征的多源数据联合非线性优化;最后算法利用视觉与激光雷达的语义词袋互补特性进行闭环优化,进一步提升了多传感器融合SLAM系统的全局定位和建图精度。实验结果显示,相比于传统的紧耦合双目视觉惯性里程计和激光雷达里程计定位,MSW-SLAM算法能够有效探测轨迹中的闭环信息,并实现高精度的全局位姿图优化,闭环检测后的点云地图具有良好的分辨率和全局一致性。 展开更多
关键词 同时定位与实时建图 语义词袋 位姿估计
下载PDF
基于哈希算法的互联网平台数据中台资源检索方法
9
作者 梁艳春 阮宜龙 +1 位作者 李晨阳 张宏俊 《现代传输》 2024年第2期37-40,共4页
由于检索请求数据自身具有高维特征,导致检索输出的查准率和查全率偏低,为此,本文提出基于哈希算法的互联网平台数据中台资源检索方法。以信息跨域检索为导向,借助哈希算法实现对输入互联网平台数据中台资源检索请求的降维处理,在对输... 由于检索请求数据自身具有高维特征,导致检索输出的查准率和查全率偏低,为此,本文提出基于哈希算法的互联网平台数据中台资源检索方法。以信息跨域检索为导向,借助哈希算法实现对输入互联网平台数据中台资源检索请求的降维处理,在对输入数据进行清洗、去重、分词等预处理操作的基础上,使用词袋模型的方法,将文本转化为向量,再借助主成分分析法实现对向量的降维。在检索阶段,将与检索请求相似度最高(欧氏距离最小的)资源作为最终的检索输出结果。在测试结果中,资源检索方法面对不同类型的资源检索请求,对应的查准率稳定在91.0%以上,查全率稳定在90.0%以上。 展开更多
关键词 哈希算法 互联网平台 数据中台 资源检索 信息跨域检索 降维处理 词袋模型 主成分分析法 欧氏距离
下载PDF
基于图文多模态融合的文档片段语义相似度判定算法
10
作者 潘媛 梁国迪 +1 位作者 邵馨叶 李芹 《电子设计工程》 2024年第3期106-109,114,共5页
为使网络主机的差异性赋值能力得到保障,实现对相似性文档片段语义信息的准确判别,提出基于图文多模态融合的文档片段语义相似度判定算法。在多模态融合条件的基础上,联合图像区域检测结果、文本区域检测结果,建立完整的词袋模型,实现... 为使网络主机的差异性赋值能力得到保障,实现对相似性文档片段语义信息的准确判别,提出基于图文多模态融合的文档片段语义相似度判定算法。在多模态融合条件的基础上,联合图像区域检测结果、文本区域检测结果,建立完整的词袋模型,实现基于图文多模态融合的文档片段标注。根据文本数据预处理条件,确定关键词权值指标,联合已知文档片段语义信息,求取相似性度量值的准确计算结果,完成文档片段语义相似度判定算法的设计。对比实验结果可知,在图文多模态融合技术的支持下,差异性赋值指标的平均值达到了1.0,对于网络主机而言,其在准确判别相似性文档片段语义信息方面的应用能力得到了保障。 展开更多
关键词 图文多模态融合 文档片段 语义相似度 词袋模型 关键词权值 差异性赋值
下载PDF
基于改进ORB-SVM的工件识别方法研究
11
作者 仝保国 刘凌云 《包装与食品机械》 CAS 北大核心 2024年第1期60-66,共7页
针对传统的图像识别算法识别多品种工件,存在运行时间长、识别率低等问题,提出基于改进ORB-SVM的工件图像识别方法。在传统ORB算法的特征点检测基础上,采用SIFT算法获得具有旋转尺度不变性的图像特征描述,并利用词袋模型将图像特征转化... 针对传统的图像识别算法识别多品种工件,存在运行时间长、识别率低等问题,提出基于改进ORB-SVM的工件图像识别方法。在传统ORB算法的特征点检测基础上,采用SIFT算法获得具有旋转尺度不变性的图像特征描述,并利用词袋模型将图像特征转化为特征直方图,进而构建支持向量机(SVM)的分类模型,实现对工件的识别分类。试验结果表明:改进的ORB-SVM在应对旋转变换、光照变换、尺度变换时更具鲁棒性,且工件识别准确率高达98.89%,单个工件的识别时间低于0.43 s,具有良好的高效性和实用性。研究为多领域的工件识别提供参考。 展开更多
关键词 工件识别 特征检测 ORB算法 词袋模型 支持向量机
下载PDF
基于多源数据的领域主题演化路径分析 被引量:2
12
作者 张敬 朱相丽 《图书情报工作》 北大核心 2023年第14期94-108,共15页
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词... [目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。 展开更多
关键词 多源数据融合 领域主题演化路径 LDA主题模型 词袋构建 时间窗口划分 有序样本聚类 Louvain社区发现算法
原文传递
基于视觉词袋模型提取胶痕特征的卷烟真伪鉴别 被引量:1
13
作者 李郸 马慧宇 +4 位作者 李海燕 王春琼 张轲 张榆锋 廖泽容 《包装工程》 CAS 北大核心 2023年第15期252-259,共8页
目的为快速准确地鉴别多品牌卷烟真伪,提出一种基于视觉词袋模型提取烟盒胶痕图像特征的鉴别方法。方法首先,利用自主设计的多光源胶痕采集装置获取烟盒内部的胶痕图像,通过图像处理技术去除原始图像的部分背景后得到胶痕图像样本;然后... 目的为快速准确地鉴别多品牌卷烟真伪,提出一种基于视觉词袋模型提取烟盒胶痕图像特征的鉴别方法。方法首先,利用自主设计的多光源胶痕采集装置获取烟盒内部的胶痕图像,通过图像处理技术去除原始图像的部分背景后得到胶痕图像样本;然后,从胶痕图像样本中提取尺度不变特征转换(SIFT)特征,并用K-Means算法对特征聚类生成视觉词典;再依据视觉词典的视觉单词直方图特征集对胶痕图像进行训练分类,从而达到鉴别卷烟真伪的目的。结果以10种真品包装机型生产的烟盒胶痕图像以及假冒烟盒胶痕图像为对象,烟盒样品涉及64个卷烟品牌,对360张胶痕图像分类测试,得到真伪识别率为97.22%,每个样本平均鉴别时间为0.05 s。结论提出的方法采集胶痕图像简便、真伪鉴别效率和准确率高,并适用于多种卷烟品牌。为提高真伪卷烟鉴别效率、准确率和通用性提供了技术支持。 展开更多
关键词 卷烟真伪鉴别 视觉词袋模型 胶痕图像 视觉单词直方图
下载PDF
利用词袋模型估计尺度差异的异源影像匹配方法 被引量:1
14
作者 喻鹏飞 李浩 +2 位作者 何秀凤 洪振华 刘宇宸 《计算机与现代化》 2023年第4期56-61,72,共7页
针对影像匹配中因影像间尺度差异过大导致同名特征点数目不足甚至误匹配的问题,提出一种利用词袋模型估计尺度差异的异源影像SIFT匹配方法(BS-SIFT)。该方法通过提前感知待匹配影像间存在的尺度差异,将异源影像匹配转化为在同一尺度上开... 针对影像匹配中因影像间尺度差异过大导致同名特征点数目不足甚至误匹配的问题,提出一种利用词袋模型估计尺度差异的异源影像SIFT匹配方法(BS-SIFT)。该方法通过提前感知待匹配影像间存在的尺度差异,将异源影像匹配转化为在同一尺度上开始,提高匹配的内点率,进而增加大尺度差异影像的匹配点数量。首先,通过将连续变化的不同尺度影像特征点在特征空间聚类,并将各尺度影像特征重分配到特征中心,得到各尺度下的特征分布关系;然后,结合影像特征中心的空间信息熵定权,得到待匹配影像间尺度描述符;最后,分析尺度描述符距离分布可得到最佳影像尺度差。实验结果表明,本文提出的BS-SIFT算法在超过10倍尺度差的影像匹配上仍能取得较好结果,相较于经典的SIFT算法,本文算法在取得较高效率的同时可得到更多的同名特征点,匹配正确率至少提升9个百分点,最大可达37个百分点。 展开更多
关键词 影像匹配 尺度不变换特征 词袋模型 大尺度差异 特征描述 航空航天影像
下载PDF
基于向量机的体育运动视频自动分类方法设计 被引量:5
15
作者 韩东 《现代电子技术》 北大核心 2019年第7期79-81,共3页
为有效增加分类的准确度及适用性,提出一种基于支持向量机的体育运动视频自动分类方法,能够实现样本复杂的海量体育视频的高效管理。首先构建基于视觉词袋模型的视频分类框架;然后采用类型关键帧建立对应的视频帧训练库;最后通过主成分... 为有效增加分类的准确度及适用性,提出一种基于支持向量机的体育运动视频自动分类方法,能够实现样本复杂的海量体育视频的高效管理。首先构建基于视觉词袋模型的视频分类框架;然后采用类型关键帧建立对应的视频帧训练库;最后通过主成分分析对输入视频帧进行降维处理,以便快速得到输入视频帧的最佳支持向量机分类器参数,从而最终实现自动分类。利用多种类型混合的体育视频数据集进行分类实验。实验结果表明,提出的体育运动视频分类算法能够快速有效地实现分类,并获得较高的分类精度。 展开更多
关键词 支持向量机 运动视频 视频分类 类型关键帧 视觉词袋模型 自动分类
下载PDF
基于粗糙集的在线评论情感分析模型 被引量:3
16
作者 王祖辉 姜维 《计算机工程》 CAS CSCD 2012年第16期1-4,共4页
针对在线评论情感分析的复杂特征抽取问题,提出一种基于粗糙集的在线评论情感分析模型。分析传统词袋性特征,指出固定搭配特征在情感极性判别中的作用,采用粗糙集方法挖掘在线评论中的固定搭配特征,将其融合于SVM与Naive Bayes等情感分... 针对在线评论情感分析的复杂特征抽取问题,提出一种基于粗糙集的在线评论情感分析模型。分析传统词袋性特征,指出固定搭配特征在情感极性判别中的作用,采用粗糙集方法挖掘在线评论中的固定搭配特征,将其融合于SVM与Naive Bayes等情感分析模型中。实际酒店的在线评论情感分析结果表明,增加粗规则后,SVM模型与Naive Bayes模型获得的评论情感判别精度都有所提高。 展开更多
关键词 情感分析 粗糙集 特征提取 词袋特征 固定搭配特征 支持向量机
下载PDF
词袋模型和TF-IDF在文本分类中的比较研究 被引量:3
17
作者 阎亚亚 《电脑知识与技术》 2021年第28期138-140,共3页
电商市场日益完善,网络购物成为更多人的消费方式,用户在电商平台上保留了大量的产品评论信息,通过人工对文本评论情感分类任务愈加艰巨,文本情感的自动分类作为自然语言处理技术的重要一门,近年来受到各界的广泛关注。本文首先对京东... 电商市场日益完善,网络购物成为更多人的消费方式,用户在电商平台上保留了大量的产品评论信息,通过人工对文本评论情感分类任务愈加艰巨,文本情感的自动分类作为自然语言处理技术的重要一门,近年来受到各界的广泛关注。本文首先对京东网页上爬取的某商品评论文本做预处理,重点研究词袋模型和TF-IDF两种文本特征选择方法下不同文本分类算法的分类效果,研究结果表明TF-IDF下的文本分类效果显著优于词袋模型。 展开更多
关键词 词袋模型 TF-IDF 文本分类
下载PDF
长白山野生中草药植物图像检索方法研究 被引量:3
18
作者 王艳 周小平 +1 位作者 王睿 孙冰雪 《中国中医药信息杂志》 CAS CSCD 2018年第2期95-98,共4页
目的研究基于视觉词袋的图像检索方法并应用于长白山中草药植物图像检索领域。方法采用SURF算法提取图像视觉特征,稀疏编码方法构造视觉词典,并提出支持向量机(SVM)和近似最近邻(ANN)相结合的改进方法完成分类器分类训练。结果选取2500... 目的研究基于视觉词袋的图像检索方法并应用于长白山中草药植物图像检索领域。方法采用SURF算法提取图像视觉特征,稀疏编码方法构造视觉词典,并提出支持向量机(SVM)和近似最近邻(ANN)相结合的改进方法完成分类器分类训练。结果选取2500张中草药图像作为检索样本,在视觉单词数量为500的情况下,平均检索时间为481 ms,平均查准率为88.95%。结论本方法能有效提高图像检索效率与准确度,同时表现出较好的鲁棒性。 展开更多
关键词 中草药 图像检索 视觉词袋
下载PDF
基于局部时空模式的体育视频行为识别 被引量:3
19
作者 温长吉 赵珊珊 +1 位作者 申利未 任虹宾 《吉林大学学报(理学版)》 CAS 北大核心 2020年第2期379-387,共9页
针对视频行为识别中由于目标相互遮挡及环境背景的复杂性等因素进行多目标跟踪存在的问题,提出一种将局部模式活跃度判别模型用于视频中活跃个体的检测和定位方法,解决了基于轨迹方法中由于遮挡导致轨迹提取不完整或背景过于复杂等因素... 针对视频行为识别中由于目标相互遮挡及环境背景的复杂性等因素进行多目标跟踪存在的问题,提出一种将局部模式活跃度判别模型用于视频中活跃个体的检测和定位方法,解决了基于轨迹方法中由于遮挡导致轨迹提取不完整或背景过于复杂等因素导致的识别准确度较低的问题。将该模型分别应用在2012年欧洲杯足球赛和2013-2014赛季西班牙甲级足球联赛38场比赛关联进球事件的视频段上,得到平均准确率为91.3%的较好结果。实验结果验证了该方法对视频中目标物行为识别具有较高的准确性和实用性。 展开更多
关键词 视频行为识别 局部时空回归核 特征词袋模型 活跃度判别
下载PDF
日文网络语料信息智能筛选的实现方法研究 被引量:1
20
作者 尚玉叶 郑新超 《数字通信世界》 2019年第5期257-258,共2页
网络检索技术的不断进步,需要搜索引擎向更精准、更高效的方向发展。本文试从文本分析、词共现语义分析、敏感信息过滤三个方面实现网络语料信息的智能筛选,提高检索效率和准确率,增加用户体验。
关键词 网络语料信息 智能筛选 语义分析 文本分析 敏感信息提取
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部