期刊文献+
共找到665篇文章
< 1 2 34 >
每页显示 20 50 100
基于影评数据的在线评论有用性影响因素研究 被引量:238
1
作者 郝媛媛 叶强 李一军 《管理科学学报》 CSSCI 北大核心 2010年第8期78-88,96,共12页
面对互联网上海量的在线客户评论,如何能快速有效地进行识别和选择从而发现和利用其中有用的评论,已经成为人们关注的重要问题.以体验型商品电影的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从文本特征出发探索影响在线评论... 面对互联网上海量的在线客户评论,如何能快速有效地进行识别和选择从而发现和利用其中有用的评论,已经成为人们关注的重要问题.以体验型商品电影的在线评论为研究对象,结合文本挖掘技术和实证研究方法,从文本特征出发探索影响在线评论有用性的因素,建立在线评论有用性影响因素模型,并利用该模型对评论有用性进行分类预测.与现有相关研究相比,提出的模型总体拟合效果显著提高,并发现在线影评中积极的情感倾向、较高的正负情感混杂度、较高的主客观表达混杂度以及较长的平均各句长度,对评论的有用性具有显著的正面影响.最后预测结果表明,该模型对在线影评的有用性具有较强的判别能力. 展开更多
关键词 口碑 在线评论 有用性 文本特征 正负情感 主客观表达形式 文本挖掘
下载PDF
读后续写对二语写作过程影响的多维分析 被引量:68
2
作者 张晓鹏 《外语界》 CSSCI 北大核心 2016年第6期86-94,共9页
本研究考察了读后续写对英语二语写作过程的影响。58名商务英语专业大三学生参加了为期12周的读后续写实验并完成写作日志。Coh-Metrix文本分析结果显示,读后续写对学生作文的词汇、句法结构、语篇连贯等文本特征产生显著影响。写作日... 本研究考察了读后续写对英语二语写作过程的影响。58名商务英语专业大三学生参加了为期12周的读后续写实验并完成写作日志。Coh-Metrix文本分析结果显示,读后续写对学生作文的词汇、句法结构、语篇连贯等文本特征产生显著影响。写作日志表明,读后续写能帮助学生发挥想象力和创造力,有语言样板可模仿的续写有利于减轻写作压力和培养写作成就感。 展开更多
关键词 读后续写 二语写作过程 文本特征 写作压力
原文传递
基于深度信念网络的文本分类算法 被引量:43
3
作者 陈翠平 《计算机系统应用》 2015年第2期121-126,共6页
随着网络的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.目前已经有许多不同类型的神经网络应用于文本分类,并且取得良好的效果.但是,大部分模型仅采用文档的少量特征作为输入,没有考虑到足够的信息量;而当考虑到足够的特征... 随着网络的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.目前已经有许多不同类型的神经网络应用于文本分类,并且取得良好的效果.但是,大部分模型仅采用文档的少量特征作为输入,没有考虑到足够的信息量;而当考虑到足够的特征时,又会发生维数灾难,导致模型难以训练或者训练时间大幅增加.利用深度信念网络从文本中抽取特征,并利用softmax回归分类器对抽取后的特征分类.深度信念网络不仅具有强大的学习能力,同时还能从高维的原始特征中抽取低维度高度可区分的低维特征,因此利用深度信念网络来对文本分类,不仅能够考虑到文档的足够的信息量,而且能够快速的训练.并且实验结果也表明利用深度信念网络实现文本分类的性能很好. 展开更多
关键词 文本分类 受限玻尔兹曼机 深度信念网络 softmax回归分类器 文本特征.
下载PDF
Coh-Metrix工具在外语教学与研究中的应用 被引量:35
4
作者 江进林 《中国外语》 CSSCI 北大核心 2016年第5期58-65,共8页
Coh-Metrix是一个基于网络的文本分析工具,融合了计算语言学和语料库语言学的多种技术,可以对文本的106个词汇语法和语义特征进行自动分析。这些特征涵盖11个模块:描述性统计量、文本易读性主成分得分、指称衔接、潜语义分析、词汇多样... Coh-Metrix是一个基于网络的文本分析工具,融合了计算语言学和语料库语言学的多种技术,可以对文本的106个词汇语法和语义特征进行自动分析。这些特征涵盖11个模块:描述性统计量、文本易读性主成分得分、指称衔接、潜语义分析、词汇多样性、连词、情景模式、句法复杂度、句法型式密度、词汇信息和可读性。该工具已被广泛应用于自动测量文本的衔接性、判断文本的语体和体裁,以及探讨写作语言的特点及其对作文质量的预测力,等等。本文介绍了Coh-Metrix工具的理论基础和相关文献,并使用60篇学生译文对该工具的应用进行了示范,以供外语研究者借鉴。 展开更多
关键词 Coh-Metrix 文本特征 衔接性 阅读难度
原文传递
中国武术英译现状与对策 被引量:30
5
作者 罗永洲 《外语教学理论与实践》 CSSCI 2008年第4期58-63,共6页
现行武术译本中一词多译、死译硬译、望文生义等较为普遍。在翻译指导原则方面,民族化与国际化之争旷日持久。作者根据武术的文本特征,从主体间性视角出发,认为武术翻译中不可避免地会融入跆拳道、柔道、拳击等多种异质成分,这样翻译出... 现行武术译本中一词多译、死译硬译、望文生义等较为普遍。在翻译指导原则方面,民族化与国际化之争旷日持久。作者根据武术的文本特征,从主体间性视角出发,认为武术翻译中不可避免地会融入跆拳道、柔道、拳击等多种异质成分,这样翻译出来的武术文本只能是中西体育文化的"杂合"或"间性文化"。译者的文化使命就是通过平衡翻译使得中国武术在国际化的进程中不断彰显其民族特色,在对话中求生存,在融合中求主宰。 展开更多
关键词 中国武术 现状 英译 文本特征 一词多译 望文生义 主体间性 体育文化
原文传递
作为一种小说类型的家族小说(上) 被引量:26
6
作者 许祖华 《重庆三峡学院学报》 2005年第1期39-44,共6页
家族小说是一种有特殊规范的小说类型。它的题材内容具有特指性,常描写一个或几个家族的生活及家族成员间的关系,并由此折射具有丰富内涵的历史和时代特征。所叙故事,具有相当的时间跨度,往往在历史与现实结合中,形成“编年史”般的格... 家族小说是一种有特殊规范的小说类型。它的题材内容具有特指性,常描写一个或几个家族的生活及家族成员间的关系,并由此折射具有丰富内涵的历史和时代特征。所叙故事,具有相当的时间跨度,往往在历史与现实结合中,形成“编年史”般的格局。其形式主要是长篇小说,有的甚至是多卷本长篇小说。家族小说的叙事模式,有叙写家族由有序无序衰败的主流模式和叙写家族的“兴旺”史的非主流模式。家族小说的情节母题主要包括“家族、历史、性”三个方面。其人物形象主要包括作为家族支柱的男性形象与作为家族附庸的女性形象。家族小说往往蕴涵了伦理文化、制度文化、风俗文化的内容和特征。 展开更多
关键词 家族小说 题材的特指性 艺术体式 文本特征 情节母体 文化内涵
下载PDF
基于规则和统计相结合的中文命名实体识别研究 被引量:27
7
作者 潘正高 《情报科学》 CSSCI 北大核心 2012年第5期708-712,786,共6页
介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基... 介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基于规则和统计相结合的方法。实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性。 展开更多
关键词 命名实体 文本特征 中文命名实体 识别
原文传递
论文本的缺省性、增生性与阐释性——兼论描写翻译学理论研究方法论 被引量:23
8
作者 曾利沙 《外语学刊》 CSSCI 北大核心 2004年第5期77-81,94,共6页
本文就描写翻译学的理论范畴———“文本特征论”所研究的任务之一 ,即语际转换过程中文本的缺省性、增生性与阐释性进行了讨论。作者从实证研究和描述性方法论入手 ,对三者之间的关系及其文本特征进行了概念化表征 ,并就文本缺省的识... 本文就描写翻译学的理论范畴———“文本特征论”所研究的任务之一 ,即语际转换过程中文本的缺省性、增生性与阐释性进行了讨论。作者从实证研究和描述性方法论入手 ,对三者之间的关系及其文本特征进行了概念化表征 ,并就文本缺省的识别性特征及其形态表征与范畴化问题进行了阐释。 展开更多
关键词 描写翻译学 文本特征 缺省性 增生性 阐释性 范畴化
原文传递
政策工具视角下我国全民健身政策文本特征研究 被引量:25
9
作者 常娟 林姝洁 李科 《沈阳体育学院学报》 CSSCI 北大核心 2021年第4期42-49,92,共9页
基于政策工具视角,采用内容分析法对1995年至今颁布的486篇全民健身政策文本进行量化分析,深入剖析不同时期全民健身政策工具的选择,厘清全民健身政策的演变特征,揭示其显性现象及深层的隐性意涵。研究结果表明:我国全民健身政策的文本... 基于政策工具视角,采用内容分析法对1995年至今颁布的486篇全民健身政策文本进行量化分析,深入剖析不同时期全民健身政策工具的选择,厘清全民健身政策的演变特征,揭示其显性现象及深层的隐性意涵。研究结果表明:我国全民健身政策的文本特征在政策工具X维度上,环境型政策工具使用频率最高,需求型政策工具使用比例激增;在全民健身发展要素Y维度上,全民健身发展要素建设纵深化发展,全民健身公共服务体系基本形成,全民健身治理模式呈现多元协同格局,全民智慧化服务水平迅速提升,全民健身活动发展均等化程度显著提高。提升策略:以"优化政策工具搭配"为依托,提高全民健身政策执行力;以"简政放权"为突破口,深化"多元协同"全民健身治理模式;以"均等化"为目标,优化全民健身资源配置;以"智慧化"为契机,助力全民健身精准服务。 展开更多
关键词 政策工具 全民健身政策 文本特征 服务体系 治理模式
下载PDF
国外会计文本信息实证研究述评与展望 被引量:23
10
作者 肖浩 詹雷 王征 《外国经济与管理》 CSSCI 北大核心 2016年第9期93-112,共20页
近年来,文本信息逐渐成为国外会计实证研究的热点,许多学者开始致力于运用文本分析方法来解决会计与财务问题,并取得了众多有价值的研究成果。与之相比,国内的此类研究却相当缺乏。为了弥补国内研究的不足,本文对国外近十年来取得的研... 近年来,文本信息逐渐成为国外会计实证研究的热点,许多学者开始致力于运用文本分析方法来解决会计与财务问题,并取得了众多有价值的研究成果。与之相比,国内的此类研究却相当缺乏。为了弥补国内研究的不足,本文对国外近十年来取得的研究成果进行了系统的梳理和述评。首先,系统阐述了会计文本信息的定义、特征及其测量方法;其次,从不同层面出发,总结并分析了会计文本信息的影响因素及其作用结果;再次,指出了现今国外研究中存在的不足。在此基础上,本文提出了一个未来研究的框架,分别从基础、引入、拓展三个方向来展望国内研究,具体包括如何构建适合中文会计语言的文本分析方法、国外现有理论与问题在我国的本土化检验以及在中国情境下可以拓展的独创性研究。 展开更多
关键词 文本分析方法 文本特征 信息披露 语调 可读性
原文传递
Web文本特征提取方法的研究与发展 被引量:17
11
作者 庞景安 《情报理论与实践》 CSSCI 北大核心 2006年第3期338-340,367,共4页
本文对当前有关Web文本特征提取方法的研究和试验进行了简要的综述和分析,比较了每类方法的优势和不足,指出研究中存在的难点和共同探讨的问题,并在此基础上,对该领域未来研究的发展方向和趋势进行了预测。
关键词 WEB文本 文本特征 特征提取 学习算法
下载PDF
二语写作流利性指标的效度——一项基于文本特征的研究 被引量:20
12
作者 秦晓晴 毕劲 《外语教学与研究》 CSSCI 北大核心 2012年第6期899-911,961,共13页
本研究从频数测量和比率测量这两方面,探讨流利性指标与写作质量和英语水平之间的关系,以考察流利性测量指标的有效性。通过分析240篇英语专业大学生作文的流利性特征,本研究发现:1)作为写作流利性指标,比率测量比频数测量更有效,但当... 本研究从频数测量和比率测量这两方面,探讨流利性指标与写作质量和英语水平之间的关系,以考察流利性测量指标的有效性。通过分析240篇英语专业大学生作文的流利性特征,本研究发现:1)作为写作流利性指标,比率测量比频数测量更有效,但当写作任务、时间限制、参与者态度等外部因素得到控制时,词汇流利性的频数测量也不失为有效的流利性指标;2)作文长度、无错误子句单词总数和子句长度可以预测写作质量;3)除作文长度和写作速度以外,其他流利性指标对于语言水平具有不同程度的区分力。 展开更多
关键词 流利性 二语写作 文本特征 标的 效度 写作质量 学生作文 文献标识码
原文传递
教科书文本内容的构成 被引量:18
13
作者 石鸥 刘学利 《教育学术月刊》 北大核心 2013年第5期77-82,共6页
教科书是一种特殊的文本,它所承载的内容是从浩如烟海的知识中选择来的。这就必然带来内容的选择问题,诸如由谁来选、选什么、为谁选等等。围绕将什么编入教科书中成为"正式知识"或官方知识,以及将什么排除在教科书之外的争论... 教科书是一种特殊的文本,它所承载的内容是从浩如烟海的知识中选择来的。这就必然带来内容的选择问题,诸如由谁来选、选什么、为谁选等等。围绕将什么编入教科书中成为"正式知识"或官方知识,以及将什么排除在教科书之外的争论,事实上体现了更深层次的政治、经济、文化和历史冲突。正是教科书内容的选择,确定了什么才是值得传承下去的精华和合法的文化。一般来讲,人们是根据社会、科学发展和学生发展的需要来编写教科书的。但三者并不统一,冲突时时存在。教科书首先是政治文本,其次才是教学文本。教科书的功能就在于准入、选择并张扬某些观点和思想,使其经典化,同时空无某些观点与思想,使其消失于学生的视野之外。 展开更多
关键词 教科书 文本内容选择 文本特征
下载PDF
基于中文年报管理层讨论与分析文本特征的上市公司财务困境预测研究 被引量:18
14
作者 陈艺云 贺建风 覃福东 《预测》 CSSCI 北大核心 2018年第4期53-59,共7页
本文采用卡方检验的方法通过对财务困境公司和正常公司年报管理层讨论与分析文本内容的比较分析提取了反映财务困境公司和正常公司的特征词,通过对词频-逆向文档频率(TF-IDF)的扩展来设置特征词权重,由此构建公司经理人的违约倾向指标(T... 本文采用卡方检验的方法通过对财务困境公司和正常公司年报管理层讨论与分析文本内容的比较分析提取了反映财务困境公司和正常公司的特征词,通过对词频-逆向文档频率(TF-IDF)的扩展来设置特征词权重,由此构建公司经理人的违约倾向指标(TTD),然后将违约倾向指标与财务变量相结合,分别采用Logistic回归和支持向量机方法对违约倾向指标能否提高财务困境预测的准确性进行实证检验,结果表明由文本内容反映的违约倾向指标确实可以提高财务困境预测模型的拟合度以及预测准确性,降低出现误判的第一类错误率和第二类错误率。 展开更多
关键词 财务困境 文本特征 卡方检验
下载PDF
基于本体论的文本特征提取 被引量:11
15
作者 唐晓文 《电脑与信息技术》 2005年第1期36-38,62,共4页
文章提出了一种基于本体论的文本特征提取方法。通过构建文本结构树来充分利用文本结构分析得到的信息 ,利用本体对领域知识的描述信息来分析特征词之间的关系 ,而且在特征权值的计算中提出了特征词统领长度的概念和计算方法。实验数据... 文章提出了一种基于本体论的文本特征提取方法。通过构建文本结构树来充分利用文本结构分析得到的信息 ,利用本体对领域知识的描述信息来分析特征词之间的关系 ,而且在特征权值的计算中提出了特征词统领长度的概念和计算方法。实验数据表明该方法提高了文本特征提取的准确性。 展开更多
关键词 领域知识 文本结构分析 特征 权值 本体论 描述 信息 文本特征 构建 实验数据
下载PDF
Web文本挖掘技术 被引量:10
16
作者 郭庚麒 《计算机与网络》 2004年第1期114-116,共3页
介绍Web数据挖掘中的核心技术—Web文本挖掘的种类、特点、任务及方法。着重讨论了文本特征的提取、文本分类和群集的算法过程和技术要点。
关键词 数据挖掘 WEB文本 文本特征 文本分类 群集 WEB网页
下载PDF
关于后现代主义小说翻译的一些思考 被引量:12
17
作者 虞建华 《中国翻译》 CSSCI 北大核心 2001年第1期35-38,共4页
后现代主义小说近年来引起了我国读者的极大兴趣,其代表作品也陆续翻译出版。本文作者结合翻译著名美国后现代主义作家库尔特·冯内古特的《时震》,谈一些这类小说文本翻译的思考。文章分两部分。第一部分讨论后现代主义小说这种... 后现代主义小说近年来引起了我国读者的极大兴趣,其代表作品也陆续翻译出版。本文作者结合翻译著名美国后现代主义作家库尔特·冯内古特的《时震》,谈一些这类小说文本翻译的思考。文章分两部分。第一部分讨论后现代主义小说这种“拒绝”被合理“翻译”阐释的小说文本特征。第二部分列举并筒要讨论这类文本对翻译提出的七个方面的新问题。 展开更多
关键词 后现代主义 小说 翻译 文本特征
原文传递
私密话题:当代中国私人话语向大众传媒的扩张 被引量:12
18
作者 郭小平 蔡凯如 《新闻大学》 CSSCI 北大核心 2003年第76期46-50,54,共6页
"私人话语"的大众传播,是指作为私人领域的话语在作为公共领域的大众传媒中的实践.所谓私人领域,是以个体独立人格为基础的私人活动与私人交往的空间.在这一空间内,私人可以按照自己的兴趣、爱好、承诺或者生活习惯等非行政... "私人话语"的大众传播,是指作为私人领域的话语在作为公共领域的大众传媒中的实践.所谓私人领域,是以个体独立人格为基础的私人活动与私人交往的空间.在这一空间内,私人可以按照自己的兴趣、爱好、承诺或者生活习惯等非行政因素进行自由、自主的活动和交往.[1]私人领域本质特征在于私人活动的自由、自在性.对私人领域的理解必须注意两点:其一是私人领域所表示的空间并不是同时间相对应的空间范畴,而是一种生活样式的范畴,即表明个人所可能有的一种自由自在的、不受干扰的生活状态和存在形式;其二,私人领域并不等同于个人领域.[2]发生于私人领域的话题有可能在特定的条件下进入大众传媒而带有公共色彩,同时私人领域的话语实践本身就包含真正意义的公共领域,比如文学公共领域等.[3] 展开更多
关键词 当代 中国 私人话语 大众传媒 私密话题 宣泄方式 文本特征
原文传递
精神接力与叙事蜕变──论“新生代”写作的意义 被引量:9
19
作者 张清华 《小说评论》 CSSCI 北大核心 1998年第4期4-10,共7页
关键词 “新生代”小说 新生代小说 先锋小说 性叙事 邱华栋 解构主义 环境戏剧 寓言 写作姿态 文本特征
下载PDF
基于图卷积网络的高质量专利自动识别方案研究 被引量:16
20
作者 吴洁 桂亮 刘鹏 《情报杂志》 CSSCI 北大核心 2022年第1期88-95,124,共9页
[研究目的]高质量专利对促进专利转化、技术追踪和战略布局十分重要,面对海量专利数据,如何准确高效自动识别高质量专利,为开展后续专利投资融资、产业转型等专利工作做基础铺垫,成为当前重要研究问题。[研究方法]以国家知识产权局受理... [研究目的]高质量专利对促进专利转化、技术追踪和战略布局十分重要,面对海量专利数据,如何准确高效自动识别高质量专利,为开展后续专利投资融资、产业转型等专利工作做基础铺垫,成为当前重要研究问题。[研究方法]以国家知识产权局受理的申请专利为研究对象,使用专利维持年限表征专利质量,提取专利数字特征并嵌入专利文本特征生成的专利-核心词汇网络,搭建图卷积网络模型自动识别高质量专利。[研究结论]目前针对专利质量的研究专注于挖掘专利数字特征而忽视专利文本特征,该方案在高质量专利自动识别过程中使用专利数字特征与文本特征,对当前专利质量研究做出补充。此外,所提方案可在专家标注少量专利文档情况下完成专利质量识别任务,解决现有专利质量标签标注方案无法全面衡量专利质量的局限。同时,将图卷积网络扩展到专利背景下的质量识别领域,为专利质量研究提供崭新框架,实验结果也显示方案具有较高实践价值。 展开更多
关键词 专利质量 图卷积网络 评价指标 文本特征 自动识别
下载PDF
上一页 1 2 34 下一页 到第
使用帮助 返回顶部