期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于BI_LSTM_CRF神经网络的序列标注中文分词方法 被引量:14
1
作者 李晗静 +1 位作者 吕会华 登峰 《现代电子技术》 北大核心 2019年第1期95-99,共5页
当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上下文依赖信息进... 当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上下文依赖信息进行建模,同时CRF层考虑了句子字符前后的标签信息,对文本信息进行了推理。该分词模型不仅在MSRA,PKU,CTB 6.0数据集上取得了很好的分词结果,而且在新闻数据、微博数据、汽车论坛数据、餐饮点评数据上进行了实验,实验结果表明,BI_LSTM_CRF模型不仅在测试集上有很好的分词性能,同时在跨领域数据测试上也有很好的泛化能力。 展开更多
关键词 自然语言处理 中文分词 神经网络 双向长短时记忆条件随机场 字嵌入 序列标注
下载PDF
基于马尔科夫模型的聋生阅读输入分析 被引量:1
2
作者 李晗静 吕会华 《北京联合大学学报》 CAS 2018年第3期86-92,共7页
以不同类型文本阅读输入角度出发,分析聋生的阅读输入规律,以反映聋生阅读时的表现。通过聋生阅读输入的文本与中文分词标准匹配率在不同等级的转移情况建立马尔科夫过程,预测聋生的阅读输入结果。通过阅读实验以验证马尔科夫模型预测... 以不同类型文本阅读输入角度出发,分析聋生的阅读输入规律,以反映聋生阅读时的表现。通过聋生阅读输入的文本与中文分词标准匹配率在不同等级的转移情况建立马尔科夫过程,预测聋生的阅读输入结果。通过阅读实验以验证马尔科夫模型预测的结果,实验结果显示,聋生更习惯于阅读较小的组合词块,单音节词、双音节词、三字及四字多音节词对聋生阅读有较大影响,这与马尔科夫模型预测结果比较符合。 展开更多
关键词 聋生 自然输入标注 阅读输入 马尔科夫模型
下载PDF
汉语新词语在聋人中认知度的调查研究
3
作者 田林伟 李晗静 +1 位作者 李飞 《北京联合大学学报》 CAS 2016年第2期27-30,共4页
每年教育部、国家语委都会以中国语言绿皮书的形式发布上一年度的汉语新词语,这些汉语新词语被健听人接受并广泛传播,然而这些汉语新词语是否被聋人接受,以及在聋人中的传播形式等,目前却很少有机构进行研究。为了了解汉语新词语在聋人... 每年教育部、国家语委都会以中国语言绿皮书的形式发布上一年度的汉语新词语,这些汉语新词语被健听人接受并广泛传播,然而这些汉语新词语是否被聋人接受,以及在聋人中的传播形式等,目前却很少有机构进行研究。为了了解汉语新词语在聋人中的传播效率、传播广度、传播的准确度等,选取20位在校聋生对随机抽取的20个汉语新词语在Authorware软件帮助下进行了认知度调查,结论表明:认知度高(HH)的占78.75%,认知度较高(LH)的占15%,认知度中等(M)的占6.25%。经分析可知:新词语的认知度与听力损伤程度没有必然联系;与其日常生活以及上网频度和范围有一定关系;同时与针对同一汉语新词语的手语打法不一致有关,也即与汉语新词语的手语传播的精确度有关。 展开更多
关键词 新词语 手语 AUTHORWARE 认知度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部