期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于BI_LSTM_CRF神经网络的序列标注中文分词方法
被引量:
14
1
作者
姚
茂
建
李晗静
+1 位作者
吕会华
姚
登峰
《现代电子技术》
北大核心
2019年第1期95-99,共5页
当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上下文依赖信息进...
当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上下文依赖信息进行建模,同时CRF层考虑了句子字符前后的标签信息,对文本信息进行了推理。该分词模型不仅在MSRA,PKU,CTB 6.0数据集上取得了很好的分词结果,而且在新闻数据、微博数据、汽车论坛数据、餐饮点评数据上进行了实验,实验结果表明,BI_LSTM_CRF模型不仅在测试集上有很好的分词性能,同时在跨领域数据测试上也有很好的泛化能力。
展开更多
关键词
自然语言处理
中文分词
神经网络
双向长短时记忆条件随机场
字嵌入
序列标注
下载PDF
职称材料
基于马尔科夫模型的聋生阅读输入分析
被引量:
1
2
作者
姚
茂
建
李晗静
吕会华
《北京联合大学学报》
CAS
2018年第3期86-92,共7页
以不同类型文本阅读输入角度出发,分析聋生的阅读输入规律,以反映聋生阅读时的表现。通过聋生阅读输入的文本与中文分词标准匹配率在不同等级的转移情况建立马尔科夫过程,预测聋生的阅读输入结果。通过阅读实验以验证马尔科夫模型预测...
以不同类型文本阅读输入角度出发,分析聋生的阅读输入规律,以反映聋生阅读时的表现。通过聋生阅读输入的文本与中文分词标准匹配率在不同等级的转移情况建立马尔科夫过程,预测聋生的阅读输入结果。通过阅读实验以验证马尔科夫模型预测的结果,实验结果显示,聋生更习惯于阅读较小的组合词块,单音节词、双音节词、三字及四字多音节词对聋生阅读有较大影响,这与马尔科夫模型预测结果比较符合。
展开更多
关键词
聋生
自然输入标注
阅读输入
马尔科夫模型
下载PDF
职称材料
汉语新词语在聋人中认知度的调查研究
3
作者
田林伟
李晗静
+1 位作者
李飞
姚
茂
建
《北京联合大学学报》
CAS
2016年第2期27-30,共4页
每年教育部、国家语委都会以中国语言绿皮书的形式发布上一年度的汉语新词语,这些汉语新词语被健听人接受并广泛传播,然而这些汉语新词语是否被聋人接受,以及在聋人中的传播形式等,目前却很少有机构进行研究。为了了解汉语新词语在聋人...
每年教育部、国家语委都会以中国语言绿皮书的形式发布上一年度的汉语新词语,这些汉语新词语被健听人接受并广泛传播,然而这些汉语新词语是否被聋人接受,以及在聋人中的传播形式等,目前却很少有机构进行研究。为了了解汉语新词语在聋人中的传播效率、传播广度、传播的准确度等,选取20位在校聋生对随机抽取的20个汉语新词语在Authorware软件帮助下进行了认知度调查,结论表明:认知度高(HH)的占78.75%,认知度较高(LH)的占15%,认知度中等(M)的占6.25%。经分析可知:新词语的认知度与听力损伤程度没有必然联系;与其日常生活以及上网频度和范围有一定关系;同时与针对同一汉语新词语的手语打法不一致有关,也即与汉语新词语的手语传播的精确度有关。
展开更多
关键词
新词语
手语
AUTHORWARE
认知度
下载PDF
职称材料
题名
基于BI_LSTM_CRF神经网络的序列标注中文分词方法
被引量:
14
1
作者
姚
茂
建
李晗静
吕会华
姚
登峰
机构
北京联合大学北京市信息服务工程实验室
北京联合大学特殊教育学院
出处
《现代电子技术》
北大核心
2019年第1期95-99,共5页
基金
国家语委重点项目(ZDI135-31)
北京教育科学规划重点课题(ADA14121)
北京市属高校高水平教师队伍建设创新团队建设提升计划(IDHT20170511)~~
文摘
当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上下文依赖信息进行建模,同时CRF层考虑了句子字符前后的标签信息,对文本信息进行了推理。该分词模型不仅在MSRA,PKU,CTB 6.0数据集上取得了很好的分词结果,而且在新闻数据、微博数据、汽车论坛数据、餐饮点评数据上进行了实验,实验结果表明,BI_LSTM_CRF模型不仅在测试集上有很好的分词性能,同时在跨领域数据测试上也有很好的泛化能力。
关键词
自然语言处理
中文分词
神经网络
双向长短时记忆条件随机场
字嵌入
序列标注
Keywords
natural language processing
Chinese word segmentation
neural network
bidirectional long short-termmemory random field
word embedding
sequence labeling
分类号
TN711-34 [电子电信—电路与系统]
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于马尔科夫模型的聋生阅读输入分析
被引量:
1
2
作者
姚
茂
建
李晗静
吕会华
机构
北京联合大学北京市信息服务工程重点实验室
北京联合大学特殊教育学院
出处
《北京联合大学学报》
CAS
2018年第3期86-92,共7页
基金
国家语委重点项目(ZDI135-31)
北京教育科学规划重点课题(ADA14121)
文摘
以不同类型文本阅读输入角度出发,分析聋生的阅读输入规律,以反映聋生阅读时的表现。通过聋生阅读输入的文本与中文分词标准匹配率在不同等级的转移情况建立马尔科夫过程,预测聋生的阅读输入结果。通过阅读实验以验证马尔科夫模型预测的结果,实验结果显示,聋生更习惯于阅读较小的组合词块,单音节词、双音节词、三字及四字多音节词对聋生阅读有较大影响,这与马尔科夫模型预测结果比较符合。
关键词
聋生
自然输入标注
阅读输入
马尔科夫模型
Keywords
Deaf students
Natural typing annotations
Reading input
Markov model
分类号
G762 [文化科学—特殊教育学]
下载PDF
职称材料
题名
汉语新词语在聋人中认知度的调查研究
3
作者
田林伟
李晗静
李飞
姚
茂
建
机构
北京联合大学北京市信息服务工程重点实验室
北京联合大学特殊教育学院
出处
《北京联合大学学报》
CAS
2016年第2期27-30,共4页
基金
教育部人文社会科学研究规划项目(14YJC740104)
文摘
每年教育部、国家语委都会以中国语言绿皮书的形式发布上一年度的汉语新词语,这些汉语新词语被健听人接受并广泛传播,然而这些汉语新词语是否被聋人接受,以及在聋人中的传播形式等,目前却很少有机构进行研究。为了了解汉语新词语在聋人中的传播效率、传播广度、传播的准确度等,选取20位在校聋生对随机抽取的20个汉语新词语在Authorware软件帮助下进行了认知度调查,结论表明:认知度高(HH)的占78.75%,认知度较高(LH)的占15%,认知度中等(M)的占6.25%。经分析可知:新词语的认知度与听力损伤程度没有必然联系;与其日常生活以及上网频度和范围有一定关系;同时与针对同一汉语新词语的手语打法不一致有关,也即与汉语新词语的手语传播的精确度有关。
关键词
新词语
手语
AUTHORWARE
认知度
Keywords
New words
Sign language
Authorware
Cognition
分类号
H126.3 [语言文字—汉语]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于BI_LSTM_CRF神经网络的序列标注中文分词方法
姚
茂
建
李晗静
吕会华
姚
登峰
《现代电子技术》
北大核心
2019
14
下载PDF
职称材料
2
基于马尔科夫模型的聋生阅读输入分析
姚
茂
建
李晗静
吕会华
《北京联合大学学报》
CAS
2018
1
下载PDF
职称材料
3
汉语新词语在聋人中认知度的调查研究
田林伟
李晗静
李飞
姚
茂
建
《北京联合大学学报》
CAS
2016
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部