期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
字族化与汉语未登录词的自动提取
被引量:
2
1
作者
宋作艳
《北京大学学报(哲学社会科学版)》
CSSCI
北大核心
2007年第2期102-110,共9页
字族是围绕一个核心字组成的所有字组的集合,字组之间具有平行关系。字族化是现代汉语词汇的重要生成途径之一,对汉语的编码机制产生了很大影响。文章探讨了字族的特点及字族化的影响,并在平行规则的基础上提出了新词(未登录词)的自动...
字族是围绕一个核心字组成的所有字组的集合,字组之间具有平行关系。字族化是现代汉语词汇的重要生成途径之一,对汉语的编码机制产生了很大影响。文章探讨了字族的特点及字族化的影响,并在平行规则的基础上提出了新词(未登录词)的自动预测和提取方法。
展开更多
关键词
字族化
类词缀
平行
周遍
未登录词
原文传递
数据库受限汉语自然语言查询的分词研究与实现
被引量:
1
2
作者
胡婕
李跃新
《湖北大学学报(自然科学版)》
CAS
北大核心
2005年第4期331-335,共5页
对数据库受限汉语自然语言查询语句进行分词处理.分词算法分为两个部分,第一部分对最大匹配法进行改进,改进的核心思想是体现整句长词优先的原则,改进后的算法能够减少切分歧义;第二部分根据实例数据库的查询需要处理姓名和不稳定的属...
对数据库受限汉语自然语言查询语句进行分词处理.分词算法分为两个部分,第一部分对最大匹配法进行改进,改进的核心思想是体现整句长词优先的原则,改进后的算法能够减少切分歧义;第二部分根据实例数据库的查询需要处理姓名和不稳定的属性值两类未登录词,未登录词的识别对后续句子的理解起着至关重要的作用.
展开更多
关键词
受限汉语自然语占
分词算法
最大匹配法
长词优先
术登录词
下载PDF
职称材料
唐宋诗之计算机辅助深层研究
被引量:
24
3
作者
胡俊峰
俞士汶
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001年第5期727-733,共7页
介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字 )和宋代部分名家诗 (16 0万字 )组成的语料库为基础 ,运用计算语言学方法对唐宋诗进行分析研究 ,提取了唐宋诗中的词汇 ,计 5万余条目。在对诗...
介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字 )和宋代部分名家诗 (16 0万字 )组成的语料库为基础 ,运用计算语言学方法对唐宋诗进行分析研究 ,提取了唐宋诗中的词汇 ,计 5万余条目。在对诗文进行词语切分的基础上 ,建立了词汇的共现关系、对仗关系以及词汇的作者分布特征信息。系统除了提供面向诗文内容的全文检索功能外 ,还进一步开发了基于词汇的统计分析和诗句相似性检索等功能 。
展开更多
关键词
语料库语言学
未登录词发现
自动注音
唐宋诗计算机辅助研究系统
计算语言学
汉语信息处理
下载PDF
职称材料
题名
字族化与汉语未登录词的自动提取
被引量:
2
1
作者
宋作艳
机构
北京大学中文系
出处
《北京大学学报(哲学社会科学版)》
CSSCI
北大核心
2007年第2期102-110,共9页
文摘
字族是围绕一个核心字组成的所有字组的集合,字组之间具有平行关系。字族化是现代汉语词汇的重要生成途径之一,对汉语的编码机制产生了很大影响。文章探讨了字族的特点及字族化的影响,并在平行规则的基础上提出了新词(未登录词)的自动预测和提取方法。
关键词
字族化
类词缀
平行
周遍
未登录词
Keywords
character-familization
semi-affix
parallel
general
unlisted
word
分类号
H136 [语言文字—汉语]
原文传递
题名
数据库受限汉语自然语言查询的分词研究与实现
被引量:
1
2
作者
胡婕
李跃新
机构
湖北大学数学与计算机科学学院
出处
《湖北大学学报(自然科学版)》
CAS
北大核心
2005年第4期331-335,共5页
文摘
对数据库受限汉语自然语言查询语句进行分词处理.分词算法分为两个部分,第一部分对最大匹配法进行改进,改进的核心思想是体现整句长词优先的原则,改进后的算法能够减少切分歧义;第二部分根据实例数据库的查询需要处理姓名和不稳定的属性值两类未登录词,未登录词的识别对后续句子的理解起着至关重要的作用.
关键词
受限汉语自然语占
分词算法
最大匹配法
长词优先
术登录词
Keywords
natural
language
based
on
restricted
Chinese
word
segmentation
algorithm
maximum
mate
hing
(
MM
)
segmentation
algorithm
priority
of
long
word
unlisted
word
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
唐宋诗之计算机辅助深层研究
被引量:
24
3
作者
胡俊峰
俞士汶
机构
北京大学计算机科学技术系北京大学计算语言学研究所
出处
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001年第5期727-733,共7页
基金
1998-1999国家社会科学基金 (98BYY0 2 2 )
北京大学 985计划资助项目
文摘
介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字 )和宋代部分名家诗 (16 0万字 )组成的语料库为基础 ,运用计算语言学方法对唐宋诗进行分析研究 ,提取了唐宋诗中的词汇 ,计 5万余条目。在对诗文进行词语切分的基础上 ,建立了词汇的共现关系、对仗关系以及词汇的作者分布特征信息。系统除了提供面向诗文内容的全文检索功能外 ,还进一步开发了基于词汇的统计分析和诗句相似性检索等功能 。
关键词
语料库语言学
未登录词发现
自动注音
唐宋诗计算机辅助研究系统
计算语言学
汉语信息处理
Keywords
corpus
linguistic
unlisted
word
discovery
automatic
pinyin
tagging
computer\|aided
analysis
of
Chinese
ancient
poems
分类号
H087 [语言文字—语言学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
字族化与汉语未登录词的自动提取
宋作艳
《北京大学学报(哲学社会科学版)》
CSSCI
北大核心
2007
2
原文传递
2
数据库受限汉语自然语言查询的分词研究与实现
胡婕
李跃新
《湖北大学学报(自然科学版)》
CAS
北大核心
2005
1
下载PDF
职称材料
3
唐宋诗之计算机辅助深层研究
胡俊峰
俞士汶
《北京大学学报(自然科学版)》
CAS
CSCD
北大核心
2001
24
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部