期刊文献+
共找到41篇文章
< 1 2 3 >
每页显示 20 50 100
产品评论挖掘研究综述 被引量:29
1
作者 伍星 何中市 黄永文 《计算机工程与应用》 CSCD 北大核心 2008年第36期37-41,共5页
产品评论挖掘是以Web上用户发表的产品评论为挖掘对象,采用自然语言处理技术,从大量的文本数据中发现关于产品的功能和性能的评价信息的过程。产品评论挖掘是一个新兴的研究领域,是对自然语言描述的无结构数据进行数据挖掘的典型代表。... 产品评论挖掘是以Web上用户发表的产品评论为挖掘对象,采用自然语言处理技术,从大量的文本数据中发现关于产品的功能和性能的评价信息的过程。产品评论挖掘是一个新兴的研究领域,是对自然语言描述的无结构数据进行数据挖掘的典型代表。产品评论中挖掘得到的信息不仅可以帮助生产厂商改进产品,还可以帮助用户合理的购买产品。对产品评论挖掘进行了全面深入地讨论,介绍了产品评论挖掘系统的通用框架,然后对产品特征提取、主观句定位、用户态度提取、态度极性判定、挖掘结果显示这5个子任务进行了详细地阐述,最后介绍了产品评论挖掘的最新方向。 展开更多
关键词 用户评论 主观特征 词语极性
下载PDF
基于图卷积网络的高质量专利自动识别方案研究 被引量:15
2
作者 吴洁 桂亮 刘鹏 《情报杂志》 CSSCI 北大核心 2022年第1期88-95,124,共9页
[研究目的]高质量专利对促进专利转化、技术追踪和战略布局十分重要,面对海量专利数据,如何准确高效自动识别高质量专利,为开展后续专利投资融资、产业转型等专利工作做基础铺垫,成为当前重要研究问题。[研究方法]以国家知识产权局受理... [研究目的]高质量专利对促进专利转化、技术追踪和战略布局十分重要,面对海量专利数据,如何准确高效自动识别高质量专利,为开展后续专利投资融资、产业转型等专利工作做基础铺垫,成为当前重要研究问题。[研究方法]以国家知识产权局受理的申请专利为研究对象,使用专利维持年限表征专利质量,提取专利数字特征并嵌入专利文本特征生成的专利-核心词汇网络,搭建图卷积网络模型自动识别高质量专利。[研究结论]目前针对专利质量的研究专注于挖掘专利数字特征而忽视专利文本特征,该方案在高质量专利自动识别过程中使用专利数字特征与文本特征,对当前专利质量研究做出补充。此外,所提方案可在专家标注少量专利文档情况下完成专利质量识别任务,解决现有专利质量标签标注方案无法全面衡量专利质量的局限。同时,将图卷积网络扩展到专利背景下的质量识别领域,为专利质量研究提供崭新框架,实验结果也显示方案具有较高实践价值。 展开更多
关键词 专利质量 图卷积网络 评价指标 文本特征 自动识别
下载PDF
民航英语的文体与语言特征 被引量:9
3
作者 杨爱荣 《中国民航学院学报》 2005年第5期45-49,共5页
为了清楚和得体地传达信息,需选用各种各样的文体交流。在航空英语中有许多文体及其语言特征,如飞行员与塔台之间的无线电通话、民航专业书籍、民航法律法规和操作手册。无线电通话属于口语文体,其他则属于书面文体。主要讨论这两类文... 为了清楚和得体地传达信息,需选用各种各样的文体交流。在航空英语中有许多文体及其语言特征,如飞行员与塔台之间的无线电通话、民航专业书籍、民航法律法规和操作手册。无线电通话属于口语文体,其他则属于书面文体。主要讨论这两类文体的语言特征,包括词法特征、句法特征和语义特征。通过讨论和分析,更好地理解语篇,避免发生歧义。 展开更多
关键词 语篇文体 语言特征 词法特征 句法特征 语义特征
下载PDF
虚假评论识别研究综述 被引量:10
4
作者 袁禄 朱郑州 任庭玉 《计算机科学》 CSCD 北大核心 2021年第1期111-118,共8页
Web 2.0时代,消费者在在线购物、学习和娱乐时越来越多地依赖在线评论信息,而虚假的评论会误导消费者的决策,影响商家的真实信用,因此有效识别虚假评论具有重要意义。文中首先对虚假评论的范围进行了界定,并从虚假评论识别、形成动机、... Web 2.0时代,消费者在在线购物、学习和娱乐时越来越多地依赖在线评论信息,而虚假的评论会误导消费者的决策,影响商家的真实信用,因此有效识别虚假评论具有重要意义。文中首先对虚假评论的范围进行了界定,并从虚假评论识别、形成动机、对消费者的影响以及治理策略4个方面归纳了虚假评论的研究内容,给出了虚假评论研究框架和一般识别方法的工作流程。然后从评论文本内容和评论者及其群组行为两个角度,对近十年来国内外的相关研究成果进行了综述,介绍了虚假评论效果评估的相关数据集和评价指标,统计分析了在公开数据集上实现的虚假评论有效识别方法,并从特征选取、模型方法、训练数据集、评价指标值等方面进行了对比分析。最后对虚假评论识别领域的有标注语料规模限制等未来研究方向进行了探讨。 展开更多
关键词 虚假评论 虚假评论识别 虚假评论者 文本特征 行为特征
下载PDF
应用遥感影像纹理特征提取线性体的马尔柯夫随机场模型 被引量:5
5
作者 赵书河 贾红燕 《遥感技术与应用》 CSCD 1999年第4期49-52,共4页
分析了遥感影像纹理的统计特征,利用马尔柯夫随机场能够合理地描述图像纹理的随机特征,建立了纹理特征马尔柯夫随机场模型,并且对该模型在提取线性体方面作了初步探讨。研究表明该方法在遥感图像线性体信息提取方面有着广阔的应用前景。
关键词 纹理 特征 线性体 遥感图像 地形学
下载PDF
英语旅游标识语的文本特点与汉英翻译策略 被引量:9
6
作者 蔡专林 《镇江高专学报》 2011年第2期27-30,共4页
英语旅游标识语具有指示、提示、限制、强制和召唤等语用功能。英语旅游标识语作为一种特定的语言形态有其独特的语言风格和文本特点。在英译汉语旅游标识语时,可以采用交际翻译策略、语用翻译策略、反译法和词类转换法翻译策略,翻译时... 英语旅游标识语具有指示、提示、限制、强制和召唤等语用功能。英语旅游标识语作为一种特定的语言形态有其独特的语言风格和文本特点。在英译汉语旅游标识语时,可以采用交际翻译策略、语用翻译策略、反译法和词类转换法翻译策略,翻译时要充分考虑目的语读者的文化习俗、思维方式和语言习惯以及目的语读者对译文的可接受性。 展开更多
关键词 旅游标识语 语用功能 文本特点 翻译策略
下载PDF
英语专业学习者书面语文本特征多维度研究——以自然语言处理软件Coh-Metrix为研究工具 被引量:8
7
作者 李雪莲 《南京工程学院学报(社会科学版)》 2014年第1期41-46,共6页
以全国英语专业四级统测作文为数据,调查学校类型和作文水平对英语专业学习者书面语文本特征的影响。书面语文本特征从词汇复杂性、句法复杂性和语篇连贯性三个层面测量。多元方差分析发现,学校类型和作文水平对词汇复杂性、句法复杂性... 以全国英语专业四级统测作文为数据,调查学校类型和作文水平对英语专业学习者书面语文本特征的影响。书面语文本特征从词汇复杂性、句法复杂性和语篇连贯性三个层面测量。多元方差分析发现,学校类型和作文水平对词汇复杂性、句法复杂性和语篇连贯性均没有显著的主效应,且学校类型和作文水平在词汇复杂性、句法复杂性和语篇连贯性层面上均没有交互作用。 展开更多
关键词 学校类型 作文水平 文本特征 Coh-Metrix
下载PDF
健康知识付费产品描述的文本特征对购买量的影响 被引量:3
8
作者 张薇薇 朱玲 《图书馆论坛》 北大核心 2023年第3期129-140,共12页
互联网医疗平台发布的付费健康知识是专业人员分享高质量知识经验、普通用户提升健康素养的重要途径。而产品描述是知识产品化过程的关键环节,影响用户知识付费行为。对健康知识产品描述的文本特征及其影响展开研究,有助于提高知识产品... 互联网医疗平台发布的付费健康知识是专业人员分享高质量知识经验、普通用户提升健康素养的重要途径。而产品描述是知识产品化过程的关键环节,影响用户知识付费行为。对健康知识产品描述的文本特征及其影响展开研究,有助于提高知识产品质量和购买量。文章以“好大夫在线”付费阅读产品为例,采用内容分析法对网络采集并筛选后的样本记录从知识产品描述的标题、引言、主题等多个维度进行文本特征提取、编码和测量,并基于统计分析探索其对用户购买量的影响和作用。研究发现:健康知识标题语气对购买量没有显著影响;引言文本可读性与购买量之间呈现“M型”关系,引言呈现方式对购买量有显著影响,通常复合型比单一型具有更高购买量;健康知识主题对购买量没有显著影响,但与引言呈现方式的交互效应显著,引言部分保持适度可读性更能吸引用户购买,可读性值过低或者过高都会降低购买量,病例叙事更能激发用户的付费意愿。 展开更多
关键词 知识付费 健康知识 产品描述 购买量 文本特征
下载PDF
基于词向量的中文词汇蕴涵关系识别 被引量:7
9
作者 张志昌 周慧霞 +1 位作者 姚东任 鲁小勇 《计算机工程》 CAS CSCD 北大核心 2016年第2期169-174,共6页
英文词汇蕴涵关系识别已有较多研究,并提出许多识别模型,但针对中文的词汇蕴涵关系获取则鲜有研究。为此,提出一种中文词汇蕴涵关系识别方法。利用词向量技术,在中文维基百科语料上进行训练,将词汇表示为词向量,设计各种基于词向量的分... 英文词汇蕴涵关系识别已有较多研究,并提出许多识别模型,但针对中文的词汇蕴涵关系获取则鲜有研究。为此,提出一种中文词汇蕴涵关系识别方法。利用词向量技术,在中文维基百科语料上进行训练,将词汇表示为词向量,设计各种基于词向量的分类特征,训练得到可用于名词词汇蕴涵关系分类的支持向量机分类模型。实验结果表明,与传统的余弦相似度方法相比,该方法以及设计的各种分类特征在词汇蕴涵关系识别方面具有明显优势。 展开更多
关键词 文本蕴涵 词汇蕴涵 词向量 蕴涵特征 支持向量机
下载PDF
CNN支持下的领域文本自组织映射神经网络聚类算法 被引量:6
10
作者 贾声声 彭敦陆 《小型微型计算机系统》 CSCD 北大核心 2018年第6期1195-1200,共6页
文本中蕴含的信息具有重要的应用价值.如何将文本进行聚类挖掘有价值的信息成为自然语言研究领域当前的热点.针对文本信息的层次聚类问题,提出基于动态词窗口的卷积神经网络(Convolutional Neural Network,CNN)文本特征提取算法和基于... 文本中蕴含的信息具有重要的应用价值.如何将文本进行聚类挖掘有价值的信息成为自然语言研究领域当前的热点.针对文本信息的层次聚类问题,提出基于动态词窗口的卷积神经网络(Convolutional Neural Network,CNN)文本特征提取算法和基于森林结构的自组织映射神经网络聚类算法(Forest Growing Self-Organizing Maps,FGSOM).首先,结合领域词性模板和特征模式对CNN特征提取算法进行改进,实现文本特征向量的自动提取.然后,将文本特征向量作为FGSOM算法的输入层,结合生长阈值和局部最优策略,实现文本分层聚类.通过将所提算法应用于法律案件文本聚类,通过与现有同类算法进行比较表明,所提算法具有较好计算效果. 展开更多
关键词 文本特征 动态词窗口 CNN 层次聚类
下载PDF
浅谈力学英语的词句特征及汉译
11
作者 严巧赟 徐海丽 刘俊丽 《中国科技翻译》 2024年第1期5-8,20,共5页
本文基于对大量力学科技类英语文本的归纳分析,结合翻译实例,从词汇和词法两方面研究了该类文本的特征,提出了相应的翻译策略,并对从事力学科技翻译的译者提供几点建议,以期对科研工作者的阅读和写作提供有益的帮助,并能对学术交流起到... 本文基于对大量力学科技类英语文本的归纳分析,结合翻译实例,从词汇和词法两方面研究了该类文本的特征,提出了相应的翻译策略,并对从事力学科技翻译的译者提供几点建议,以期对科研工作者的阅读和写作提供有益的帮助,并能对学术交流起到积极的作用。 展开更多
关键词 力学学科 专业术语 翻译策略 文本特征
原文传递
公示语汉英翻译研究的新视角——文本类型学理论及其应用 被引量:5
12
作者 舒薇 《广东外语外贸大学学报》 2013年第6期72-75,共4页
过去对公示语汉英翻译的研究大多集中在纠正错误的译文和讨论具体的翻译技巧上,从理论角度对其进行探讨的较少。本文从一个新的视角——运用文本类型学理论来研究公示语及其汉英翻译。选取在旅游景点向游客提供服务的公示语作为研究对象... 过去对公示语汉英翻译的研究大多集中在纠正错误的译文和讨论具体的翻译技巧上,从理论角度对其进行探讨的较少。本文从一个新的视角——运用文本类型学理论来研究公示语及其汉英翻译。选取在旅游景点向游客提供服务的公示语作为研究对象,通过对语料库中语料的文本功能、语言特点和翻译策略的分析和研究,发现文本类型学能够帮助译者分析文本的功能和语言特点,从而采取相应的翻译策略,为翻译实践提供一定的借鉴。 展开更多
关键词 公示语 文本功能 语言特点 翻译策略
下载PDF
花灯戏生态特征论 被引量:5
13
作者 何玉人 《艺术百家》 CSSCI 北大核心 2010年第6期108-112,141,共6页
中国的花灯戏是一个有着自身独特发生、发展形态的剧种。花灯戏的流布区域十分广大,除主要分布在云、贵、川三省外,我国湖南、湖北、甘肃、河南、广东、浙江、广西等地都有花灯戏或者是借鉴了花灯戏的唱腔、表演等形式发展起来的戏曲剧... 中国的花灯戏是一个有着自身独特发生、发展形态的剧种。花灯戏的流布区域十分广大,除主要分布在云、贵、川三省外,我国湖南、湖北、甘肃、河南、广东、浙江、广西等地都有花灯戏或者是借鉴了花灯戏的唱腔、表演等形式发展起来的戏曲剧种。由于特殊的自然、地理和人文生态,花灯戏的发生、发展的途径也各不相同,至今,花灯戏已经形成了一个较大的剧种群落,是中国戏曲昆、梆、弋、高四大声腔之外,表现内容丰富、音乐形式多样、表演风格独特、观众面广的一个重要剧种体系。本文从花灯戏的生成、文本特征、艺术表现等几个方面对其形态特征做了探讨。 展开更多
关键词 中国戏曲 剧种 花灯戏 生成方式 文本特征 艺术表现 文化特征
下载PDF
学术论断句标注与识别方法探索 被引量:4
14
作者 徐健 郭语凡 +4 位作者 喻雪寒 黄雨馨 杨婷婷 王唯一 刘政 《情报学报》 CSSCI CSCD 北大核心 2022年第7期707-719,共13页
学术文本中的论断句包含了学者对研究问题的看法和判断,对其进行识别有助于组织和挖掘其中蕴含的学术观点,以辅助学者更高效地开展科研活动。在对前人研究进行归纳的基础上,提出论断句判断的3个充分条件和3个必要条件,从肯定和否定角度... 学术文本中的论断句包含了学者对研究问题的看法和判断,对其进行识别有助于组织和挖掘其中蕴含的学术观点,以辅助学者更高效地开展科研活动。在对前人研究进行归纳的基础上,提出论断句判断的3个充分条件和3个必要条件,从肯定和否定角度构建论断句判定标准。开发论断句标注系统,选择信息资源管理领域部分论文,开展摘要和全文层面论断句的标注实验。评测最小序列优化、支持向量机、朴素贝叶斯、决策树、k近邻、BERT(bidirectional encoder representations from transformers)+FC(full connection)、BERT+BiLSTM(bidirectional long short-term memory)分类器对论断句的识别效果。研究发现:①使用本文提出的判断标准,标注者在摘要和全文层面对学术文本中论断句和非论断句的标注一致性较高;②仅使用文本特征情况下,BERT+BiLSTM算法识别效果最好,准确率、召回率和F_1值等指标均大于90%;③论断句和非论断句在长度、段内位置、文内位置和TextRank权重上频率分布均存在差异;④在摘要层面,使用序列最小优化算法,加入长度特征后,分类器识别效果提升0.5%;在全文层面,使用支持向量机分类器,加入长度、段内相对位置、文内相对位置特征后,分类器识别效果在F_1值上取得了2%的提升。 展开更多
关键词 序列最小优化算法 朴素贝叶斯 支持向量机分类器 信息资源管理 决策树 序列优化 学术文本 位置特征
下载PDF
基于统计与词汇语义特征的中文文本蕴涵识别 被引量:4
15
作者 刘茂福 李妍 顾进广 《计算机工程与设计》 CSCD 北大核心 2013年第5期1777-1782,共6页
对中文这种意合型语言而言,为了进行文本内容理解和文本语义推理,必须识别文本间的蕴涵关系。针对中文文本,在文本预处理的基础上,提取中文文本的相关统计特征和词汇语义特征;基于获取的统计与词汇语义特征,使用支持向量机设计并实现分... 对中文这种意合型语言而言,为了进行文本内容理解和文本语义推理,必须识别文本间的蕴涵关系。针对中文文本,在文本预处理的基础上,提取中文文本的相关统计特征和词汇语义特征;基于获取的统计与词汇语义特征,使用支持向量机设计并实现分类器对中文文本对间蕴涵关系进行分类。实验结果表明,基于统计与词汇语义特征进行中文文本蕴涵关系识别是可行的。 展开更多
关键词 文本蕴涵 统计特征 词汇语义特征 支持向量机 矛盾
下载PDF
医患暴力事件报道特征与大学生对医务人员态度及医学生就业焦虑的关系
16
作者 阮霄睿 吴清源 +1 位作者 宁佩珊 胡国清 《伤害医学(电子版)》 2023年第1期15-22,共8页
目的了解大学生阅读医患暴力事件报道的频次和文本特征,以及二者与大学生对医务人员态度、医学生就业焦虑的关系,为规范媒体对医患暴力事件的报道、降低其对大学生造成的不良影响提供参考。方法对456名在校大学本科生进行问卷调查,采用... 目的了解大学生阅读医患暴力事件报道的频次和文本特征,以及二者与大学生对医务人员态度、医学生就业焦虑的关系,为规范媒体对医患暴力事件的报道、降低其对大学生造成的不良影响提供参考。方法对456名在校大学本科生进行问卷调查,采用χ^(2)检验和Kruskal-Wallis H检验比较不同性别、专业、年级大学生阅读医患暴力事件报道的文本特征差异(包括报道篇幅、观点呈现和媒体态度),及其与大学生对医务人员态度和医学生就业焦虑之间的关系。结果76.97%的大学生在过去一年中阅读过3次及以上医患暴力事件报道,其主要阅读途径为网络(97.15%)。最近一次阅读的报道篇幅大多为200~800字,且呈现了医患双方的观点,57.02%的医患暴力事件报道中的媒体态度倾向于医方。与阅读仅包含患方观点报道的大学生相比,阅读仅包含医方观点报道的大学生对医务人员的态度明显改观(P<0.02)。82.13%的医学生在阅读医患暴力事件报道后就业焦虑增加,且阅读5次及以上报道的大学生与阅读1~2次报道者的就业焦虑差异具有统计学意义(P<0.05)。结论大学生接触医患暴力事件报道的比例较高,报道中的观点呈现和媒体态度明显影响大学生对医务人员的态度,阅读增加了医学生的就业焦虑。未来媒体在报道医患暴力事件时应尽可能呈现医患双方观点、保持中立态度5次及以上相关报道,减少此类报道对大学生(尤其是医学生)造成的不良影响。 展开更多
关键词 医患暴力 媒体报道 文本特征 大学生 就业焦虑
下载PDF
小学语文童话类文本的基本特征、教学价值与教学策略 被引量:3
17
作者 丁美君 《江苏教育研究(实践)(B版)》 2018年第7期58-60,共3页
童话类文本的基本特征为:故事情节一波三折,人物角色贴近儿童,表现手法形式多样。童话类文本可以培养儿童思维、启发儿童想象、帮助儿童习得语言表达规则。教师可以通过重读略讲"对话情节",引导学生在情境中合作学习;重讲略读... 童话类文本的基本特征为:故事情节一波三折,人物角色贴近儿童,表现手法形式多样。童话类文本可以培养儿童思维、启发儿童想象、帮助儿童习得语言表达规则。教师可以通过重读略讲"对话情节",引导学生在情境中合作学习;重讲略读"知识环节",培养学生提取信息的能力;有意识地引导学生关注文本表达顺序,鼓励学生模仿创编等教学策略,提升学生的语文学科素养。 展开更多
关键词 童话类文本 文本特征 教学价值 教学策略
下载PDF
闽南童谣文本特征与目的论视角下的翻译原则——以《天乌乌》为例 被引量:3
18
作者 蔡恒声 林万源 《山东农业工程学院学报》 2018年第5期138-142,共5页
闽南语系具有浓厚的乡土文化特色,成为传统文化的分支。童谣作为儿童较早接触的文学形式之一,往往保留了方言与地方文化特色。基于闽南童谣独特的文本特征,在英译时可能需要不同的翻译考量,而文献中对闽南童谣翻译的研究,尚未提供较完... 闽南语系具有浓厚的乡土文化特色,成为传统文化的分支。童谣作为儿童较早接触的文学形式之一,往往保留了方言与地方文化特色。基于闽南童谣独特的文本特征,在英译时可能需要不同的翻译考量,而文献中对闽南童谣翻译的研究,尚未提供较完整的答案。透过分析闽南童谣的文本特征与翻译目的论,整理出闽南童谣翻译的五项参考原则,并运用这些原则以实例进行翻译,以验证发现的实用性与有效性。希望经由提高翻译质量,让更多读者了解闽南童谣之美。 展开更多
关键词 闽南童谣翻译 文本特征 翻译目的论 翻译原则
下载PDF
莫里森小说《慈悲》的文本空间叙事研究 被引量:3
19
作者 雷蕾 《外国语文》 北大核心 2017年第4期24-28,共5页
托妮·莫里森是当代美国黑人文学的杰出代表作家,她的作品自60年代以来就引起了西方读者和评论界的广泛关注。空间叙事理论是随着20世纪末人文领域的空间转向,叙事学领域也开始对叙事作品中的时间、空间问题进行重新思考而逐渐形成... 托妮·莫里森是当代美国黑人文学的杰出代表作家,她的作品自60年代以来就引起了西方读者和评论界的广泛关注。空间叙事理论是随着20世纪末人文领域的空间转向,叙事学领域也开始对叙事作品中的时间、空间问题进行重新思考而逐渐形成的新理论。本文拟从文本空间叙事中,以加布里尔·佐伦的叙事空间理论为引导,从叙事视角、篇章结构、语言特色三个方面探讨美国黑人作家托妮·莫里森2008年出版的《慈悲》,重点考察作者是如何利用文本空间参与并影响叙事、构架整个故事结构、体现它的空间叙事艺术的。 展开更多
关键词 《慈悲》 文本空间 叙事视角 篇章结构 语言特色
下载PDF
网络书面实时交流的语篇特征探析:语域理论视角 被引量:2
20
作者 杨慧 《宿州学院学报》 2019年第10期47-50,共4页
为研究网络书面实时交流的语篇特征,以某高校班级QQ交流群中的交流文本为语料自建数据库,从媒介、词汇、语法、语域和语类等层面进行分析。基于语域理论探究了该类交流的语篇特征出现的原因,发现语场、语旨和语式三种因素均具有制约作... 为研究网络书面实时交流的语篇特征,以某高校班级QQ交流群中的交流文本为语料自建数据库,从媒介、词汇、语法、语域和语类等层面进行分析。基于语域理论探究了该类交流的语篇特征出现的原因,发现语场、语旨和语式三种因素均具有制约作用。最后指出:网络书面实时交流的语篇特征在一定程度上会引起误解,但是交际者可以使用多种方式消除障碍,保障交流的顺利进行。 展开更多
关键词 网络书面实时交流 语篇特征 语域理论
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部