期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
深度学习框架下微博文本情感细粒度研究 被引量:6
1
作者 王儒 王嘉梅 +1 位作者 王伟全 符飞 《计算机系统应用》 2020年第5期19-28,共10页
情感细粒度分析是情感分析的分支,随着社交网络规模的扩大,简单的划分积极或消极的粗粒度情感分析不能满足实际应用的需要,基于评价对象及其属性的细粒度情感分析得到了重视.近几年深度学习在自然语言处理领域的成功应用给情感细粒度分... 情感细粒度分析是情感分析的分支,随着社交网络规模的扩大,简单的划分积极或消极的粗粒度情感分析不能满足实际应用的需要,基于评价对象及其属性的细粒度情感分析得到了重视.近几年深度学习在自然语言处理领域的成功应用给情感细粒度分析提供了新的思路.以NLPCC2013任务二微博数据集为研究对象,探究微博短文本在不同神经网络结构中的情感细粒度分类结果并加入词向量进行优化,最后分析与总结了神经网络微博短文本细粒度情感分析的影响因素及发展方向. 展开更多
关键词 细粒度情感分析 神经网络 微博短文本
下载PDF
傣泐文-汉文互译有声电子词典 被引量:4
2
作者 胡刚 王嘉梅 +2 位作者 李炳泽 林睿 希利补发 《计算机系统应用》 2016年第7期8-16,共9页
软件是基于Visual C++6.0和Access 2003工具来完成的,在Unicode字符集模式下进行软件设计,解决当前民族文字软件开发时的系统使用兼容性以及字符的输出乱码等问题.本开发模式使用简单、操作稳定、接口灵活,在便于用户对词汇和语音数据... 软件是基于Visual C++6.0和Access 2003工具来完成的,在Unicode字符集模式下进行软件设计,解决当前民族文字软件开发时的系统使用兼容性以及字符的输出乱码等问题.本开发模式使用简单、操作稳定、接口灵活,在便于用户对词汇和语音数据库进行统一处理(备份、打印)的同时,也为其它民族文字翻译软件的开发提供了初期技术指导.目前面向傣族地区的翻译辅助工具还尚未推出,"傣泐文-汉文互译有声电子词典"是傣文信息化领域的一个重要"应用创新"成果,是开展少数民族语言文化信息元表示与提取研究的基础支撑,其作用主要是负责傣文的查询、翻译、朗读等工作.傣汉互译电子词典设计实现了傣汉对照互译、傣语真人朗读、傣语音标显示等常用功能,同时还支持对词库进行添加、修改、删除自定义操作,实现了良好的人机交互功能. 展开更多
关键词 傣泐文 西双版纳 电子词典 傣汉互译 UNICODE
下载PDF
面向彝文网页的敏感内容分级系统研究 被引量:4
3
作者 王清 李炳泽 王嘉梅 《云南民族大学学报(自然科学版)》 CAS 2019年第2期177-185,共9页
随着互联网和彝文信息化的快速发展,彝文网络上充斥着大量的敏感信息,极大的影响了我国边疆的舆情信息安全.但彝文信息技术的发展与中英文相比还比较滞后,因彝文语言结构复杂、彝语分布环境广泛等原因,彝文的信息采集和文本分词等技术... 随着互联网和彝文信息化的快速发展,彝文网络上充斥着大量的敏感信息,极大的影响了我国边疆的舆情信息安全.但彝文信息技术的发展与中英文相比还比较滞后,因彝文语言结构复杂、彝语分布环境广泛等原因,彝文的信息采集和文本分词等技术还不够成熟,这对涉外彝文网页的敏感内容监管带来巨大的挑战.为解决彝文网络信息的安全传播和舆情稳定,试图提出彝文敏感内容分级模型,并结合自研的彝文爬虫及分词等技术.构建一种面向彝文网页的敏感内容分级的算法模型和演示系统,相比于同类的民族语言舆情分析系统,不仅可实现敏感词的识别和过滤,还具有敏感内容分级、敏感源地址追踪等功能.通过人工评测与分析,该系统对敏感内容的分级可达到48%的准确率,敏感词的识别率为80%. 展开更多
关键词 彝文网络 敏感信息 内容分级 舆情分析
下载PDF
基于Windows平台的滇南彝文输入法实现 被引量:3
4
作者 胡刚 王嘉梅 +3 位作者 张建营 孙善通 汤雪 赵慧云 《计算机系统应用》 2015年第12期34-43,共10页
彝文古籍数量繁多,但却在迅速减少,亟待运用科学手段进行抢救、整理、规范.为满足考古工作者和出版业界的需要,从排版系统中对中英彝文混合输入的实用性考虑出发,采用Unicode国际编码标准,且字库编码区间实现从自造区间到汉字区间的跨越... 彝文古籍数量繁多,但却在迅速减少,亟待运用科学手段进行抢救、整理、规范.为满足考古工作者和出版业界的需要,从排版系统中对中英彝文混合输入的实用性考虑出发,采用Unicode国际编码标准,且字库编码区间实现从自造区间到汉字区间的跨越.就Windows操作系统中进行滇南彝文字库设计及输入法实现所涉及到的原理及若干问题进行了阐述,并在此基础上利用多多输入法API进行程序开发,在克服了操作系统应用环境、字库编码区间及方式、文字混合显示等技术障碍后,最终开发出"滇南彝文数字化信息处理平台".无论是从可行性和实用性分析,该平台的第三套"滇南彝文自由拆分模式的一对多形态编码输入法"在很大程度上解决了当前彝文输入法所普遍存在的易学性问题,是一款操作稳定、输入快捷、简单易学的彝文输入法,尤其对彝文信息化的推广具有广泛的使用价值和示范价值. 展开更多
关键词 滇南彝文 形似编码 编码区间 字库 排版系统
下载PDF
基于Android平台的汉-英-泰互译有声电子词典 被引量:2
5
作者 刘峰 王嘉梅 +4 位作者 林睿 李新运 张晨阳 石兵坤 杨莹玉 《计算机系统应用》 2018年第4期54-62,共9页
在中泰两国双边往来日益频繁,以及Android App广泛应用的背景下,设计并实现了在Android平台下的汉-英-泰互译有声电子词典软件.该应用软件是以Android Studio为开发环境,利用Java语言及SQLite数据库设计的.以一种特别的方式由泰语语料... 在中泰两国双边往来日益频繁,以及Android App广泛应用的背景下,设计并实现了在Android平台下的汉-英-泰互译有声电子词典软件.该应用软件是以Android Studio为开发环境,利用Java语言及SQLite数据库设计的.以一种特别的方式由泰语语料库创建本地词库,解决了SQLite可视化操作工具处理泰文会出现乱码的问题.系统关键技术是采用SQL语言在创建好的本地词库中查找单词释义.系统具有对话翻译、拍照翻译的特色,还实现了汉-英-泰三语查询互译、泰语真人朗读等功能.测试表明,软件具备一定的便利性和实用性. 展开更多
关键词 ANDROID SQLITE数据库 汉英泰互译 电子词典 ANDROID STUDIO
下载PDF
汉英-泰互译有声语料的数据库研究 被引量:1
6
作者 胡刚 王嘉梅 +2 位作者 李炳泽 林睿 林碧彤 《计算机系统应用》 2016年第9期223-229,共7页
"汉英-泰互译有声语料库"的开发,在泰文舆情分析领域,解决了词典分词算法中训练语料缺乏的问题.本文采用计算机化信息处理技术,对大量的收集来的泰文语料进行整理、规范、加工与存储,统计出泰文词汇8000多个.然后利用词典翻... "汉英-泰互译有声语料库"的开发,在泰文舆情分析领域,解决了词典分词算法中训练语料缺乏的问题.本文采用计算机化信息处理技术,对大量的收集来的泰文语料进行整理、规范、加工与存储,统计出泰文词汇8000多个.然后利用词典翻译和人工校对其进行语料对齐.最后,结合泰文语言语法特征以及句法的语义特点,分类归纳和规范标注泰语语料,构建了5万条左右的的汉英-泰语料数据库. 展开更多
关键词 汉英-泰 语料库 互译有声 舆情 泰文分词
下载PDF
基于语言模型的缺失数据追踪方法与应用分析 被引量:1
7
作者 林睿 陈鲁雁 +2 位作者 王嘉梅 范菁 袁长森 《计算机与数字工程》 2018年第10期2034-2038,共5页
在大多数情况下,语言信息系统是不完备的,或者说存在某种程度的不完备,在各种实用的数据库中,属性值语言数据缺失的情况经常发全甚至是不可避免的。在语言调查与语言收集中,数据的缺失会带来很大的失误率,数据的缺失比例过大会导致数据... 在大多数情况下,语言信息系统是不完备的,或者说存在某种程度的不完备,在各种实用的数据库中,属性值语言数据缺失的情况经常发全甚至是不可避免的。在语言调查与语言收集中,数据的缺失会带来很大的失误率,数据的缺失比例过大会导致数据不具有代表性和真实性,具有较大的估计偏差,甚至导致数据完全失去利用价值,因此对随机缺失的数据处理十分必要,首先,在对缺失语言数据进行处理前,了解语言数据缺失的机制和形式。其次,针对缺失的数据机制,确定追踪数据的方法,使得语言数据得到最大化的完善。 展开更多
关键词 语言模型 追踪研究 缺失数据 数据处理方法
下载PDF
通用彝文信息化输入平台的研究 被引量:1
8
作者 王清 王嘉梅 《红河学院学报》 2019年第4期47-51,共5页
目前,滇、川、黔、桂四省(区)彝文输入法已取得较大进展,但由于彝文的编码标准和编码区间不统一,字库体量不足等原因,目前尚缺乏面向通用彝文的输入软件,且如今彝文输入系统无法输入古彝文生僻字或稀有文字,难以满足彝文古籍的出版需求... 目前,滇、川、黔、桂四省(区)彝文输入法已取得较大进展,但由于彝文的编码标准和编码区间不统一,字库体量不足等原因,目前尚缺乏面向通用彝文的输入软件,且如今彝文输入系统无法输入古彝文生僻字或稀有文字,难以满足彝文古籍的出版需求。为解决Windows系统中彝文输入的通用性和易学性等,文章从字库制作、彝文编码等方面展开深入研究,并基于现有字库的整合和扩充开发通用彝文信息化输入平台,以作为彝文输入的应用示范和标准参考。 展开更多
关键词 通用彝文 输入平台 彝文编码
下载PDF
融合K-means和CFSFDP的聚类算法
9
作者 李新运 王嘉梅 +1 位作者 张晨阳 王儒 《福建电脑》 2019年第3期1-5,共5页
在K-means算法中,初始k值和初始聚类中心对聚类结果都有影响。针对K-means算法存在的问题,提出一种K-means算法与聚类的快速搜索和发现密度峰算法结合的聚类算法(K-CFSFDP)。该算法思想:先采用CFSFDP算法得到每个数据点的ρ_i和δ_i并... 在K-means算法中,初始k值和初始聚类中心对聚类结果都有影响。针对K-means算法存在的问题,提出一种K-means算法与聚类的快速搜索和发现密度峰算法结合的聚类算法(K-CFSFDP)。该算法思想:先采用CFSFDP算法得到每个数据点的ρ_i和δ_i并将其作为数据新的特征向量,再次使用CFSFDP算法,对新的ρ_i进行升序排列,以斜率的变化自动选择聚类中心点;再运用K-means算法进行迭代聚类。该算法在UCI数据集上能够又好又快又稳定的聚类。 展开更多
关键词 聚类 斜率变化 初始聚类中心 K均值算法 快速峰值搜索算法
下载PDF
深度学习在泰文商品识别中的应用
10
作者 王清 王嘉梅 《大理大学学报》 CAS 2019年第12期18-24,共7页
跨境零售是中泰贸易的关键,但传统采用RFID标签识别和人工问询模式的购物体验度并不高。因而运用基于机器视觉的商品识别方法,构建"互联网+跨境贸易"的人工智能化零售电商体系,对推动中泰"一带一路"的区域经济发展... 跨境零售是中泰贸易的关键,但传统采用RFID标签识别和人工问询模式的购物体验度并不高。因而运用基于机器视觉的商品识别方法,构建"互联网+跨境贸易"的人工智能化零售电商体系,对推动中泰"一带一路"的区域经济发展具有重要的应用价值。该文在图像分类识别技术和卷积神经网络研究的基础上,提出一种基于Inception-V3框架参数迁移学习的Inception-Thai神经网络模型来用于泰文商品的识别,可避免在少量样本上出现训练过拟合的现象。在人工标注的7类泰文商品图片数据集上进行测试,实验结果表明,该模型具有较高的图片深层特征提取能力,且在商品识别的分类置信度上可达到83%至98%,取得了较高的准确率。 展开更多
关键词 跨境零售 识别 深度学习 图像分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部