期刊文献+
共找到91篇文章
< 1 2 5 >
每页显示 20 50 100
基于文本语义和表情倾向的微博情感分析方法 被引量:23
1
作者 王文 王树锋 李洪华 《南京理工大学学报》 EI CAS CSCD 北大核心 2014年第6期733-738,749,共7页
针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微... 针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微博情感词的抽取和分类,计算词语语义相似度和倾向性。综合考虑表情、文本情感倾向的加权和正面情感增强等因素。实验结果表明:表情情感倾向对微博情感倾向起着重要作用;在表情和文本情感倾向比值固定的情况下,调整因素和中性区间的选择会对情感倾向判断准确率产生影响;通过与基于How Net语义相似度的计算模型比较,该文方法使得情感倾向判断准确率提高约5%。 展开更多
关键词 文本语义 表情倾向 微博 情感分析 机器学习 微博爬虫 应用程序编程接口 情感词典 语义相似度
下载PDF
基于赋权粗糙隶属度的文本情感分类方法 被引量:19
2
作者 王素格 李德玉 魏英杰 《计算机研究与发展》 EI CSCD 北大核心 2011年第5期855-861,共7页
提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到... 提出了基于赋权粗糙隶属度的文本情感分类方法.该方法将特征倾向强度引入到文本的向量空间表示法中,建立了基于二元组属性(特征,特征倾向强度)的文本表示模型.提出了基于情感倾向强度序的属性离散化方法,将特征选择寓于离散化过程,达到数据降维的目的.利用特征倾向强度,定义了赋权粗糙隶属度,用于新文本的情感分类.在真实汽车评论语料上,与支持向量机分类模型进行比较实验表明,基于赋权粗糙隶属度的文本情感分类方法在对数据进行一定程度的压缩后仍表现出较好的分类性能. 展开更多
关键词 文本情感分类 文本表示 情感倾向强度 离散化 粗糙隶属度
下载PDF
论汉字职用的考察与描写 被引量:19
3
作者 李运富 《上海师范大学学报(哲学社会科学版)》 CSSCI 北大核心 2017年第1期5-12,共8页
汉字职用学是汉字学本体的分支学科之一,以研究汉字本身的职能和人们对汉字的使用为主要内容。汉字职用的考察与描写是建立汉字职用史和完善汉字职用学的事实基础。考察汉字职用的有效材料是时代明确的文本,以及可以反映文本用字原貌的... 汉字职用学是汉字学本体的分支学科之一,以研究汉字本身的职能和人们对汉字的使用为主要内容。汉字职用的考察与描写是建立汉字职用史和完善汉字职用学的事实基础。考察汉字职用的有效材料是时代明确的文本,以及可以反映文本用字原貌的古代注释。考察汉字职用的有效办法是化整为零,从个体、类别、局部入手,同时需要一套独立而系统的指称术语用来描写。通过字符和语符的个体职用及相互关系的考察,进而按人、时、地、集团、文体等分类进行描写和比较,积累材料,汇聚现象,分析特点,揭示规律,解释原因,才有可能获知汉字职用的历史过程和总体面貌。 展开更多
关键词 汉字职用 文本 字符单位 语符单位 考察角度 表述用语
下载PDF
概念语法隐喻与学生英语语篇建构水平关系的实证研究 被引量:14
4
作者 孙承荣 宋德生 《外语学刊》 CSSCI 北大核心 2008年第5期127-129,共3页
本研究依据Halliday的语法隐喻理论提出学生使用语法隐喻的频次与语篇建构水平呈正相关的假设。实证研究以英语专业学生为对象,分层抽样120份作文,进行定量分析,分析结果支持我们的假设。研究还得出结论,语法隐喻除了源于意义发展之外,... 本研究依据Halliday的语法隐喻理论提出学生使用语法隐喻的频次与语篇建构水平呈正相关的假设。实证研究以英语专业学生为对象,分层抽样120份作文,进行定量分析,分析结果支持我们的假设。研究还得出结论,语法隐喻除了源于意义发展之外,还是教育和认知水平提高的产物;语法隐喻的类型与语篇样类之间可能有一定的相关性。本研究的启示是,教学中,教师要引导学生观察和使用语法隐喻表达式,以便提高他们的语言表达水平和语言创造力。 展开更多
关键词 语法隐喻 语篇建构 一致式表达 隐喻式表达
原文传递
面向微博热点事件的话题检测及表述方法研究 被引量:15
5
作者 周炜翔 张仰森 张良 《计算机应用研究》 CSCD 北大核心 2019年第12期3565-3569,3578,共6页
针对微博文本数据稀疏导致热点话题难以检测的问题,提出了一种基于IDLDA-ITextRank的话题检测模型。首先,通过引入微博时间序列特征和词频特征,构建了IDLDA话题文本聚类模型,利用该模型将同一话题的文本聚到一个文本集合TS;然后,通过采... 针对微博文本数据稀疏导致热点话题难以检测的问题,提出了一种基于IDLDA-ITextRank的话题检测模型。首先,通过引入微博时间序列特征和词频特征,构建了IDLDA话题文本聚类模型,利用该模型将同一话题的文本聚到一个文本集合TS;然后,通过采用编辑距离和字向量相结合的相似度计算方法,构建了ITextRank文本摘要和关键词抽取模型,对文本集合TS抽取摘要及其关键词;最后,利用词语互信息和左右信息熵将所抽取的关键词转换成关键主题短语,再将关键主题短语和摘要相结合对话题内容进行表述。通过实验表明,IDLDA模型相较于传统的BTM和LDA模型对话题文本的聚类效果更好,利用关键主题短语和摘要对微博的话题进行表述,比直接利用主题词进行话题表述具有更好的可理解性。 展开更多
关键词 文本聚类 IDLDA-ItextRank模型 话题抽取 话题表述
下载PDF
中文文本中时间信息抽取及规范化方法 被引量:9
6
作者 宋国民 张三强 +1 位作者 贾奋励 姜松言 《测绘科学技术学报》 北大核心 2019年第5期538-544,共7页
时间信息抽取和规范化表达在时空泛在信息处理、关联、聚合和内容服务中具有重要作用。设计并实现了一种基于规则的时间信息抽取和规范化表达的方法。首先,结合中文文本中时间信息描述的特点,定义了基本时间单元和派生时间单元,并由时... 时间信息抽取和规范化表达在时空泛在信息处理、关联、聚合和内容服务中具有重要作用。设计并实现了一种基于规则的时间信息抽取和规范化表达的方法。首先,结合中文文本中时间信息描述的特点,定义了基本时间单元和派生时间单元,并由时间单元组合形成不同的时间表达式;然后,构建了时间词汇词典和时间表达式抽取的正则表达式模板;最后,设计了时间推理和计算的方法,实现了时间信息的规范化表达。基于中文文本语料进行了时间信息抽取测试。实验结果表明,本文方法具有较好的时间信息抽取效果。 展开更多
关键词 中文文本 时间 信息抽取 规范化 时间表达式 正则表达式 时间推理
下载PDF
论出土文本字词关系的考证与表述 被引量:9
7
作者 李运富 《古汉语研究》 CSSCI 北大核心 2005年第2期74-81,共8页
出土文本文字的考释有“完全考释”和“非完全考释”之别,完全考释应该对字的“形、音、义、用”都作出合理解释。考证时会涉及许多相关的字和词,对各种字词关系(含字际关系和词际关系)应该有科学的表述。在非完全考释中,有些字词关系... 出土文本文字的考释有“完全考释”和“非完全考释”之别,完全考释应该对字的“形、音、义、用”都作出合理解释。考证时会涉及许多相关的字和词,对各种字词关系(含字际关系和词际关系)应该有科学的表述。在非完全考释中,有些字词关系不明确,表述时应注意实事求是。常有人仅仅根据异文就断言某字是某字的借字,仅仅根据形体相近就断言某字跟某字读音相同,甚至把出土文本中所有跟后代习用字不同而意义相当的字都看作通假字,这些判断或表述往往是不准确或靠不住的。 展开更多
关键词 表述 字词 文本 出土 考证 字际关系 实事求是 考释 通假字 文字 解释 异文 形体 用字
下载PDF
日语广告语篇的语言特点 被引量:9
8
作者 胡俊 《解放军外国语学院学报》 北大核心 2002年第2期34-37,共4页
日语广告语篇语言特点主要有以下四方面 :一是表现形式多样性 ,如使用汉字、平假名、片假名、罗马字、阿拉伯数字及标点符号 ,这是其他语言望尘莫及的 ;二是日语音韵的特殊性 ;三是修辞丰富多彩 ,本文列举了 12种修辞方式 ;四是日语句... 日语广告语篇语言特点主要有以下四方面 :一是表现形式多样性 ,如使用汉字、平假名、片假名、罗马字、阿拉伯数字及标点符号 ,这是其他语言望尘莫及的 ;二是日语音韵的特殊性 ;三是修辞丰富多彩 ,本文列举了 12种修辞方式 ;四是日语句式特征 ,广告语篇可用祈使句、省略句、疑问句、陈述句、感叹句、句段等句式。 展开更多
关键词 日语广告语篇 语言特点 表达方式
下载PDF
基于规则的中文文本时间表达式识别和规范化方法 被引量:8
9
作者 马雷雷 李宏伟 +2 位作者 魏勇 梁汝鹏 龚竞 《信息工程大学学报》 2017年第5期560-565,共6页
时间信息是事件的基本要素之一,时间信息识别在信息处理中处于基础地位。提出了一种基于规则的时间表达式识别和规范化方法。首先对中文文本时间表达式进行分类,基于正则表达式制定规则,利用模式匹配方法识别时间表达式;然后介绍了基准... 时间信息是事件的基本要素之一,时间信息识别在信息处理中处于基础地位。提出了一种基于规则的时间表达式识别和规范化方法。首先对中文文本时间表达式进行分类,基于正则表达式制定规则,利用模式匹配方法识别时间表达式;然后介绍了基准时间的确定方法,基于推理思想详细分析了时间表达式的规范化过程;最后通过实验进行了测试与分析,结果表明文章的方法具有较高的准确率、召回率和F值。 展开更多
关键词 时间表达式 中文文本 规则 正则表达式 识别 规范化 推理
下载PDF
政治修辞与比喻文本建构 被引量:8
10
作者 吴礼权 《阜阳师范大学学报(社会科学版)》 2020年第3期35-46,共12页
政治人与自然人一样,在语言活动中都要讲究表达效果,为此就需要适应特定的题旨情境而选择恰当的修辞手法,建构有表达力的修辞文本。不过,跟自然人的“日常修辞”不同,政治人的“政治修辞”在选择修辞手法建构相应的修辞文本时更要注意... 政治人与自然人一样,在语言活动中都要讲究表达效果,为此就需要适应特定的题旨情境而选择恰当的修辞手法,建构有表达力的修辞文本。不过,跟自然人的“日常修辞”不同,政治人的“政治修辞”在选择修辞手法建构相应的修辞文本时更要注意使目标预期与文本接受的实际效果趋于一同,从而发挥出政治修辞的最大效益。因为政治修辞的效果好坏,不仅跟表达者的前途命运密切相关,还跟国计民生、政权存亡、国家形象等密切相关。政治修辞的手法很多,其中比喻手法尤为古往今来的政治人所钟爱。运用比喻手法建构的政治修辞文本,不仅表意生动、形象、有力,而且还别具婉约含蓄的韵味与幽默诙谐的机趣,因而在政治场域中不时可以发挥“四两拨千斤”的特殊作用,有效地化解政治对话中可能出现的尴尬,彰显表达者的人格魅力与品德修养。 展开更多
关键词 政治修辞 日常修辞 比喻手法 文本建构 表达效果
下载PDF
《周易》的文本结构及其言说方式 被引量:8
11
作者 周山 《哲学分析》 2013年第5期3-12,197,共10页
《周易》是一部帮助人们决疑解难的思维工具书,卦象爻象、卦名卦辞爻辞是这个类比推理系统的核心构件。卦名主要根据重卦的上、下经卦关系所象征的意义或重卦整体所象征的意义而确定;卦辞是对卦象意义的总体阐释,爻辞是对爻象在卦体中... 《周易》是一部帮助人们决疑解难的思维工具书,卦象爻象、卦名卦辞爻辞是这个类比推理系统的核心构件。卦名主要根据重卦的上、下经卦关系所象征的意义或重卦整体所象征的意义而确定;卦辞是对卦象意义的总体阐释,爻辞是对爻象在卦体中的特定位置所含之义的阐释;卦辞、爻辞以例说方式"明象",一个卦辞或爻辞中往往包含有一、两个甚至三、四个例说,这种以譬喻为主要特点的言说方式,训练、规范着炎黄子孙的思维实践,逐渐形成了注重类比的思维定势。 展开更多
关键词 周易 象辞 文本结构 言说方式 譬喻
下载PDF
语文课程内容的建构:逻辑起点、内容要素和文本表达 被引量:8
12
作者 魏小娜 《课程.教材.教法》 CSSCI 北大核心 2015年第8期43-49,共7页
语文课程内容是语文课程理论研究和教学实践的核心话题。本文基于一些国家新近颁布的母语课程标准的研究,对比分析我国语文课程内容建构在逻辑起点、内容要素和文本表达方面的现状,尝试思考我国语文课程内容建构的努力方向。
关键词 语文课程内容 逻辑起点 内容要素 文本表达
下载PDF
领域内文本褒贬倾向性分类中的特征提取技术 被引量:2
13
作者 熊德兰 柴玉梅 《微计算机信息》 北大核心 2006年第12X期263-264,289,共3页
本文介绍了文本褒贬倾向性分类的方法和技术,重点论述了文本的表示方法和褒贬特征抽取的方法,提出了基于MI特征提取方法的改进办法。实验结果表明,这种改进有利于褒贬特征的抽取,从而提高了分类的精度。
关键词 文本倾向性分类 文本表示 特征提取 向量空间模型
下载PDF
基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配 被引量:3
14
作者 王冠南 郭丽娟 +2 位作者 彭曙蓉 陈慧霞 黄浩宇 《浙江电力》 2024年第1期20-27,共8页
针对220kV及以上电压等级智能变电站双套录波通道同源匹配问题,提出一种基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配方法。首先,针对录波通道命名不规范的问题,使用正则表达式对通道名称文本进行预处理,统一通道名称的表... 针对220kV及以上电压等级智能变电站双套录波通道同源匹配问题,提出一种基于正则表达式和Jaccard系数的智能变电站录波通道同源匹配方法。首先,针对录波通道命名不规范的问题,使用正则表达式对通道名称文本进行预处理,统一通道名称的表达形式;同时,使用jieba分词算法和去停用词操作,去除通道名称文本中可能存在的冗余信息。然后,使用Jaccard相似系数匹配算法计算录波通道名称文本之间的相似度,依据相似度大小筛选出同源通道。最后,基于电网实际的录波文件数据进行仿真分析。仿真结果表明:所提方法可有效实现智能变电站录波通道同源匹配。 展开更多
关键词 录波通道同源匹配 文本匹配 正则表达式 Jaccard相似系数
下载PDF
城市总体规划文本表达技术实践特征与思考——以《上海市城市总体规划(2017—2035年)》为例 被引量:5
15
作者 王新哲 黄建中 《城市规划》 CSSCI CSCD 北大核心 2020年第9期85-92,共8页
制定一份具备高水平的内容与格式、有效地表达和转译各种规划决策的文本,对于总体规划的改革非常重要。本文研究了总体规划文本的制度与表达现状,结合案例研究文本的外部形式、内容结构、文体选择和语言表达。指出文本可以沿用"法... 制定一份具备高水平的内容与格式、有效地表达和转译各种规划决策的文本,对于总体规划的改革非常重要。本文研究了总体规划文本的制度与表达现状,结合案例研究文本的外部形式、内容结构、文体选择和语言表达。指出文本可以沿用"法条化"的形式,有利于彰显总体规划的严肃性,同时应突出其"政策性文件"的性质;应适当丰富文本的内容;改变现行以报批为核心的结构体系,增加文本的逻辑性与阅读体验;采用适应于政策表达的文体与方式。 展开更多
关键词 城市总体规划 文本表达 法条化 政策性文件 逻辑结构
下载PDF
高中生化学书面文字表达不规范问题及其解决策略
16
作者 韦新平 《化学教育(中英文)》 CAS 北大核心 2024年第5期91-95,共5页
规范文字表达是建构学科知识、发展学科素养的基础。列举了高中生化学书面表达当中2类常见的文字表达不规范问题:文字书写不规范、语言表述不规范。在对文字书写分类示错的基础上提出了定向纠错策略:说文解字,厘清差别;创设认知冲突,转... 规范文字表达是建构学科知识、发展学科素养的基础。列举了高中生化学书面表达当中2类常见的文字表达不规范问题:文字书写不规范、语言表述不规范。在对文字书写分类示错的基础上提出了定向纠错策略:说文解字,厘清差别;创设认知冲突,转变认知错误。针对语言表述不明确、不完整问题,从认识思路的结构化、多元表达方式的协同运用2方面提出了解决策略。 展开更多
关键词 化学书面表达 文字书写 语言表述 教学策略
原文传递
科技论文中常见的文字表述与数学公式不一致例解 被引量:4
17
作者 张晓庆 《编辑学报》 CSSCI 北大核心 2021年第3期259-261,共3页
针对科技论文中文字表述与数学公式不一致的现象,给出3类常见的不一致问题:文字表述与公式内容不一致,文字中的符号与公式中的符号表示不一致,文字引用与公式序号不一致。结合实例对这3类错误进行了分析,并给出了编校建议。
关键词 科技论文 文字表述 数学公式 不一致
原文传递
基于注意力机制的结构化文本自动生成 被引量:4
18
作者 王进强 刘金硕 《武汉大学学报(工学版)》 CAS CSCD 北大核心 2022年第2期198-203,共6页
为了解决手工编写招标文件耗时耗力、技术参数和要求覆盖不全面的问题,以及由于设备升级、行业规范修改所带来的范本自动迭代更新问题,提出了一种基于注意力机制Bert模型的招标技术范本自动生成方法。具体包括:建立标的物范本知识语料库... 为了解决手工编写招标文件耗时耗力、技术参数和要求覆盖不全面的问题,以及由于设备升级、行业规范修改所带来的范本自动迭代更新问题,提出了一种基于注意力机制Bert模型的招标技术范本自动生成方法。具体包括:建立标的物范本知识语料库,并使用正则表达式对招标文件进行数据清洗和技术参数提取;然后使用基于注意力机制的Bert模型提取参数文本的语义信息,映射至向量空间;最后通过TextRank算法得到生成的范本内容。以国家能源公司2016—2020年的161种标的物招标材料作为语料,将本方法生成的范本与专家人工编制范本作对比,结果表明,本方法获得了较高的Rouge评分与准确率,验证了其在真实生产环境下的可行性。 展开更多
关键词 结构化文本 注意力机制 正则表达式 自然语言处理
原文传递
基于数学文本和表达式转换的融合检索模型 被引量:4
19
作者 张倩倩 田学东 +1 位作者 杨芳 李新福 《计算机工程》 CAS CSCD 北大核心 2019年第3期175-181,187,共8页
数学信息检索中查询式和检索结果以数学表达式为主,忽略了文档中数学文本语义。为此,提出一种融入数学文本特征的数学表达式检索模型。对中文科技文档进行遍历提取数学文本,利用数学字典将其映射为LaTeX数学表达式,并转化为二叉树结构... 数学信息检索中查询式和检索结果以数学表达式为主,忽略了文档中数学文本语义。为此,提出一种融入数学文本特征的数学表达式检索模型。对中文科技文档进行遍历提取数学文本,利用数学字典将其映射为LaTeX数学表达式,并转化为二叉树结构。在此基础上,构建数学表达式索引,设计匹配算法,从而实现数学文本和表达式检索。实验结果表明,该方法提高了数学检索系统的检索效率。 展开更多
关键词 数学信息检索 数学文本 数学表达式 词典 索引
下载PDF
大别山精神内涵的分析视角及其表达研究
20
作者 崔现强 叶展铸 《湖北成人教育学院学报》 2024年第2期109-114,共6页
探究大别山精神形成的机理,并从中分析和研究大别山精神的科学内涵,旨在拓展和丰富中国共产党的精神谱系,对于阐释和挖掘大别山精神的当代价值具有十分重要的理论意义和现实意义。从历史、空间、主体等三个维度分析大别山精神形成的主... 探究大别山精神形成的机理,并从中分析和研究大别山精神的科学内涵,旨在拓展和丰富中国共产党的精神谱系,对于阐释和挖掘大别山精神的当代价值具有十分重要的理论意义和现实意义。从历史、空间、主体等三个维度分析大别山精神形成的主要脉络及探寻内涵的研究框架。以此为基础,分析了大别山精神文本表达应坚持的原则,即坚持伟大建党精神的主体性、伟大建军精神的补充性和大别山人民革命精神的特色性原则。同时,寻找中国共产党、人民军队、大别山人民等三类主体在大别山地区开展革命斗争所表现出来精神气质的最大公约数,充分尊重现存关于大别山精神表达的文本习惯,将大别山精神内涵概括为“坚守信念、胸怀大局、勇当先锋、紧跟党走”。 展开更多
关键词 大别山精神 主要内涵 分析视角 文本表达
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部