-
题名英日语料库语义接受度对比研究
被引量:3
- 1
-
-
作者
杜家利
于屏方
-
机构
鲁东大学外国语学院汉语言文学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第24期146-149,共4页
-
基金
国家社会科学基金项目(No08BYY046)
山东省社会科学规划项目(No07CWXJ03)
-
文摘
基于语料库的语义接受度(SAS)研究是在线衡量文本理解程度的可行性方法。在大规模真实文本语料的基础上,利用赋值限域方法进行英日文本对照研究。并通过分析不同赋值区间对英日小说文本语义接受度进行解读。经过验证的语义接受度公式证明了文本理解与词汇密度(P1,P2)、词长(H)和句长(L)相关,即SAS=P2/[P1×0.4×(L+H)],而且不同的抽取率不会引起评价值的显著差异。此公式为文学研究者借助网络对电子文本进行理解度评价提供了理论支持。
-
关键词
文本
语料库
自然语言
语义接受度
信息检索
-
Keywords
text
corpus
natural language
semantic accessibility scale
information retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名日语文本语义接受度评价研究
被引量:2
- 2
-
-
作者
杜家利
于屏方
-
机构
鲁东大学外国语学院汉语言文学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第23期137-139,148,共4页
-
基金
国家社会科学基金项目(No.08BYY046)
教育部人文社会科学重点研究基地重大项目(No.06JJD740007)
山东省社会科学规划项目(No.07CWXJ03)
-
文摘
基于日语料库的粘着语文本语义接受度(SAS)研究分三步展开。首先提取『ゆきぐに』为分析文本,以等距离系统随机抽样方法取得6对比组。然后在屈折语SAS研究基础上提出适用于粘着语文本的词长定义,即百词所含5音拍及以上词数为超常用词量。最后得出结论:抽取间距由大变小引发抽取率(SR)由小变大的曲线变化;依次攀升的SR与围绕均值波动的SAS组图证明两者的非关联性,以实例验证了屈折语SAS评价公式对粘着语文本研究的可适用性。
-
关键词
粘着语
信息检索
语料库
语义接受度
抽取率
-
Keywords
agglutinative language
information processing
corpus
Semantic Accessibility Scale (SAS)
Sampling Ratio (SR)
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名法语料库文本语义接受度评价研究
被引量:1
- 3
-
-
作者
杜家利
于屏方
-
机构
鲁东大学外国语学院
鲁东大学汉语言文学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第29期125-127,179,共4页
-
基金
国家社会科学项目(No.08BYY046)
山东省社会科学规划项目(No.07CWXJ03)
-
文摘
法文本语义接受度(SAS)研究属于基于语料库的SAS研究分支。以等距离系统随机抽样方法进行对比实验。抽取公式为A+BX≤C,A为起始页码,B为抽取间距,C为文本总页码,X为可取页数集。当以L’Assommoi(r1953版)为语料,B∈(10;5;4;3;2;1)时,词句抽取率(SR)为9.55%,20.29%,25.13%,33.13%,50.36%和100%,SAS为0.0897,0.0841,0.0854,0.0847,0.0848和0.0854。依次攀升SR没有带来SAS显著变化。说明基于英日语料的SAS评价体系也适用于法文本,便于文学评论家对法文本进行量化评析。
-
关键词
文学文本
法语语料库
语义接受度
抽取率
-
Keywords
literary texts
French corpus
semantic accessibility scale
sampling ratio
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名自然语言文本语义接受度的在线系统评价研究
被引量:1
- 4
-
-
作者
杜家利
于屏方
-
机构
鲁东大学外国语学院教育部汉语辞书研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2008年第26期141-143,157,共4页
-
基金
教育部项目(No.06JJD740007)
山东省项目(No.07CWXJ03)
鲁东大学项目(No.W20072602)
-
文摘
语义接受度(SAS)是衡量自然语言文本可理解程度的标尺。通过结合自动文摘系统评价方法和文体学分析方法,提出了可用于在线分析英语文学文本SAS的系统评价公式,并通过诺贝尔文学获奖作品《老人与海》的语料分析验证了公式的可适用性:不同的抽取率不会引起评价值的显著差异。尽管存在域的有限性、域的单一性和在线评价相对性等不足,此公式为文学评论者借助网络进行英语文本SAS在线评价提供了便利。
-
关键词
自然语言文本
语义接受度
系统评价
自动文摘系统
文体
-
Keywords
natural language text
semantic accessibility scale
systematic evaluation
automatic text summarization system
literary style
-
分类号
TP301.2
[自动化与计算机技术—计算机系统结构]
-
-
题名同义并列双音词字序新探
被引量:2
- 5
-
-
作者
茆雅凤
-
机构
南京大学文学院
-
出处
《湖南科技学院学报》
2009年第9期147-149,共3页
-
文摘
在同义并列双音词中,语义可接受度高的语素常常置前。《朱子语类》中,斧斤、寿考、路途、叫呼等词的前置语素都是在该语义场里占据上位的常用词,语义可接受度较高,而后置语素虽然也表相同或相近的概念义,但没有前置语素的语义可接受度高,存在一定的理解障碍,越熟悉的语素越容易理解,人们通常习惯把语义可接受度高的语素置于前,语义可接受度相对较低的语素置于后。这是符合客观认知规律的,也是在语言事实中客观存在的一种现象。
-
关键词
同义并列
双音词
字序
语义可接受度
-
分类号
H195
[语言文字—汉语]
-