期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
语料库驱动的语义序列研究——以搭配框架为例 被引量:12
1
作者 杨素香 《外语教学理论与实践》 CSSCI 北大核心 2012年第4期28-35,共8页
Hunston(2008)提出了语义序列的概念、构成及其研究方法。语义序列指在语料库中有规则地出现的一系列意义成分。本文以Hunston(2008)所论为方法框架,以英语搭配框架"the*of"为研究焦点,以语料库驱动的方法探讨语料库证据显示... Hunston(2008)提出了语义序列的概念、构成及其研究方法。语义序列指在语料库中有规则地出现的一系列意义成分。本文以Hunston(2008)所论为方法框架,以英语搭配框架"the*of"为研究焦点,以语料库驱动的方法探讨语料库证据显示的不同语类如医学英语和传记英语的语义序列。结果显示,医学英语形成与医疗、疾病、变化等有关的语义序列,而传记英语形成与生平、经历、时间等有关的语义序列。因此,语义序列能够反映语篇特征,对语类区分和预测具有重要意义。 展开更多
关键词 语料库驱动 搭配框架 语义序列 医学英语 传记英语
原文传递
一种增量式文本软聚类算法 被引量:3
2
作者 冯中慧 鲍军鹏 沈钧毅 《西安交通大学学报》 EI CAS CSCD 北大核心 2007年第4期398-401,411,共5页
针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,... 针对传统文本聚类算法时间复杂度较高,而与距离无关的算法又不适用于动态、变化的文本集等问题,提出了一种基于语义序列的增量式文本软聚类算法.该算法考虑了长文本的多主题特性,并利用语义序列相似关系计算相似语义序列集合的覆盖度,同时将每次选择的具有最小熵重叠值的候选类作为一个结果聚类,这样在整个聚类的过程中大大减小了文本向量空间的维数,缩短了计算时间.由于所提算法的语义序列只与文本自身相关,所以它适用于增量式聚类.实验结果表明,算法的聚类精度高于同条件下的其他聚类算法,尤其适合于长文本集的软聚类. 展开更多
关键词 语义序列 增量式聚类 软聚类 文本聚类
下载PDF
介词主题词的话语意义分析及语义序列研究 被引量:3
3
作者 张立英 《外国语》 CSSCI 北大核心 2016年第1期55-63,共9页
本文提出了一种介词主题词驱动的话语意义分析方法,旨在通过索引行型式提取特定语篇中的语义序列,并将其应用于自建语料库。结果显示,该方法所提取的语义序列可揭示语篇的宏观特征和历时变化。短语学研究表明,语言中存在大量词汇共选生... 本文提出了一种介词主题词驱动的话语意义分析方法,旨在通过索引行型式提取特定语篇中的语义序列,并将其应用于自建语料库。结果显示,该方法所提取的语义序列可揭示语篇的宏观特征和历时变化。短语学研究表明,语言中存在大量词汇共选生成的多词序列或短语单位。本研究补充了短语学的研究成果,表明特定语篇中同样存在大量由意义共现生成的语义序列,而语义序列是短语单位的又一重要属性。语义序列研究可拓宽语料库短语学研究范围,丰富扩展意义单位研究。 展开更多
关键词 主题性 语义序列 索引行型式 型式-意义 话语分析方法
原文传递
异构社交平台中用户身份解析 被引量:1
4
作者 刘俊岭 刘颖 +3 位作者 马晨旭 赵巧娜 孙焕良 许景科 《数据采集与处理》 CSCD 北大核心 2022年第5期1101-1114,共14页
跨社交平台的用户身份解析是社交网络一个重要的研究方向,其可以有效集成不同平台的同一用户信息。现有的用户身份解析工作大多针对类型相似的社交平台,平台间的信息相对对称,通过用户在不同平台上的档案属性、空间位置、网络关系等信... 跨社交平台的用户身份解析是社交网络一个重要的研究方向,其可以有效集成不同平台的同一用户信息。现有的用户身份解析工作大多针对类型相似的社交平台,平台间的信息相对对称,通过用户在不同平台上的档案属性、空间位置、网络关系等信息的相似度来判别是否为同一用户。然而,在两个异构社交平台中用户信息是不对称的,难以直接获取到用于用户身份解析的相应属性信息。本文研究跨评论类与活动类平台间的用户身份解析方法。为了解决两类社交平台的用户信息属性不对称问题,把用户信息按档案属性、语义序列、特征词序列3类信息组织,从各自的社交平台中抽取相应的信息建立映射关系,提出了综合3类信息的集成匹配算法。考虑了用户活动的时间偏移现象,采用反向传播学习的方法获取时间偏移权重,提出了基于反向传播学习的语义序列与特征词序列相似性度量方法。同时,设计了总体相似度度用于用户身份解析。利用真实数据集进行了充分的实验,实验结果表明了所提出用户身份解析算法的有效性。 展开更多
关键词 社会网络 用户身份解析 特征词序列 语义序列
下载PDF
An Incremental Algorithm of Text Clustering Based on Semantic Sequences 被引量:1
5
作者 FENG Zhonghui SHEN Junyi BAO Junpeng 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1340-1344,共5页
This paper proposed an incremental textclustering algorithm based on semantic sequence. Using similarity relation of semantic sequences and calculating the cover of similarity semantic sequences set, the candidate clu... This paper proposed an incremental textclustering algorithm based on semantic sequence. Using similarity relation of semantic sequences and calculating the cover of similarity semantic sequences set, the candidate cluster with minimum entropy overlap value was selected as a result cluster every time in this algorithm. The comparison of experimental results shows that the precision of the algorithm is higher than other algorithms under same conditions and this is obvious especially on long documents set. 展开更多
关键词 text clustering semantic sequence ENTROPY
下载PDF
医学语篇常见搭配框的语义序列分析 被引量:2
6
作者 张继东 夏梦茹 《厦门理工学院学报》 2015年第6期74-80,共7页
基于Hunston的语义序列分析理论,以上海交大科技英语语料库(JDEST)的医学语料库为源库,对英语医学语篇常见搭配框the*of,a*of和be*to的前后搭配词、中间搭配词进行归类分析,发现医学语篇搭配框的搭配词多涉及医学治疗、诊断、药物使用... 基于Hunston的语义序列分析理论,以上海交大科技英语语料库(JDEST)的医学语料库为源库,对英语医学语篇常见搭配框the*of,a*of和be*to的前后搭配词、中间搭配词进行归类分析,发现医学语篇搭配框的搭配词多涉及医学治疗、诊断、药物使用、医学研究过程、作用、评价等医疗过程和医学研究的词汇,搭配框架的语义是有规律可循的,更是受体裁影响的。英语学习者可以不同的语义序列区分不同的语类特征,以便于掌握医学语篇的语义特点和语篇特征。 展开更多
关键词 医学语篇 语义序列 搭配框架 搭配词 语料库
下载PDF
非语法受定蕴涵命题语义序列的语用作用
7
作者 王宏民 《洛阳理工学院学报(社会科学版)》 1999年第1期70-72,共3页
论述了根据与背景蕴涵命题的逻辑关系。
关键词 非语法 蕴涵命题 语义 序列 语用
下载PDF
复杂中文文本的实体关系抽取研究 被引量:1
8
作者 王苑 徐德智 陈建二 《计算机科学》 CSCD 北大核心 2009年第8期208-211,共4页
实体关系抽取是信息抽取研究领域中的重要研究课题之一。针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法。结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习... 实体关系抽取是信息抽取研究领域中的重要研究课题之一。针对已有方法在处理复杂文本上的不足,提出了复杂中文文本的实体关系抽取方法。结合中文文本的语法特征,提出了7条抽取关系特征序列的启发式规则,并采用语义序列核和KNN机器学习算法结合的方法来分类和标注关系的类型。通过对ACE评测定义下的两个子类的实体关系抽取,关系抽取的平均F值达到了76%,明显高于传统的基于特征向量和最短依存路径核的方法。 展开更多
关键词 实体关系抽取 语法特征 启发式规则 语义序列核
下载PDF
利用语料库驱动方法的程式化语言研究评述
9
作者 李凤华 《北京航空航天大学学报(社会科学版)》 2012年第6期94-98,共5页
对于英语中利用语料库驱动方法进行的程式化语言研究进行评述,对比分析其理论基础、研究角度等方面的异同,发现意义单位、语义序列、语法模式以核心词为中心,揭示程式化词语序列中词与意义、词与语法之间的关系;词束没有核心词,强调语... 对于英语中利用语料库驱动方法进行的程式化语言研究进行评述,对比分析其理论基础、研究角度等方面的异同,发现意义单位、语义序列、语法模式以核心词为中心,揭示程式化词语序列中词与意义、词与语法之间的关系;词束没有核心词,强调语篇功能和语域差异。此外,意义单位重视语义特点和意义的完整性,语义序列和语法模式则强调词汇语法模式,但是语法模式是比语义序列更为抽象的概括。 展开更多
关键词 语料库 程式化语言 核心词 语义序列 语法模式 词束
下载PDF
“四字骈语”的词汇化 被引量:10
10
作者 安华林 《北华大学学报(社会科学版)》 2007年第5期62-67,共6页
"四字骈语"介于四字并列的自由短语和固定短语之间,是研究自由结构词汇化很好的窗口。出现明显的转义是四字骈语词汇化的根本动因,语义等级越低,词汇化的程度越弱,语义等级序列也是词汇化程度序列。四字语音模式、成分的非独... "四字骈语"介于四字并列的自由短语和固定短语之间,是研究自由结构词汇化很好的窗口。出现明显的转义是四字骈语词汇化的根本动因,语义等级越低,词汇化的程度越弱,语义等级序列也是词汇化程度序列。四字语音模式、成分的非独立性、高使用度,以及与成语的类比认同等多种语言内外部因素,共同促成了四字骈语的词汇化。 展开更多
关键词 四字骈语 语法化 词汇化 制约因素 语义等级序列
下载PDF
室内用户语义位置模式挖掘研究--以商场为例 被引量:2
11
作者 张心悦 王光霞 +2 位作者 吴月 马嘉琳 王思 《测绘与空间地理信息》 2016年第2期12-16,共5页
结合室内轨迹数据的特点,研究了室内移动对象语义轨迹序列处理方法,以及利用LDA主题模型与用户历史轨迹进行室内商场用户分类的方法。提出了通过关联规则分析挖掘用户语义位置模式的方法,并以北京某大型商场的实际用户轨迹数据为例,对... 结合室内轨迹数据的特点,研究了室内移动对象语义轨迹序列处理方法,以及利用LDA主题模型与用户历史轨迹进行室内商场用户分类的方法。提出了通过关联规则分析挖掘用户语义位置模式的方法,并以北京某大型商场的实际用户轨迹数据为例,对所提出的方法进行了实验验证。 展开更多
关键词 语义轨迹序列 室内轨迹 主题模型 用户分类 语义模式挖掘
下载PDF
差比序列视角下“不是A但是/只是/而是B”之比较
12
作者 王振 《长春大学学报》 2013年第11期1435-1439,共5页
语言中的某些词或词组可以形成一个差比序列。将不同差比序列项分别嵌入"不是A但是/只是/而是B"框架,对其嵌入条件、语义内涵和否定类别分别加以比较,可从新的视角发现这三个框架深层次的区别与联系。
关键词 差比序列 不是A但是B 不是A只是B 不是A而是B 比较 语用否定
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部