期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
A Survey of LLM Datasets:From Autoregressive Model to AI Chatbot
1
作者 杜非 马新建 +5 位作者 杨婧如 柳熠 罗超然 王学斌 姜海鸥 景翔 《Journal of Computer Science & Technology》 SCIE EI CSCD 2024年第3期542-566,共25页
Since OpenAI opened access to ChatGPT,large language models(LLMs)become an increasingly popular topic attracting researchers’attention from abundant domains.However,public researchers meet some problems when developi... Since OpenAI opened access to ChatGPT,large language models(LLMs)become an increasingly popular topic attracting researchers’attention from abundant domains.However,public researchers meet some problems when developing LLMs given that most of the LLMs are produced by industries and the training details are typically unrevealed.Since datasets are an important setup of LLMs,this paper does a holistic survey on the training datasets used in both the pre-train and fine-tune processes.The paper first summarizes 16 pre-train datasets and 16 fine-tune datasets used in the state-of-the-art LLMs.Secondly,based on the properties of the pre-train and fine-tune processes,it comments on pre-train datasets from quality,quantity,and relation with models,and comments on fine-tune datasets from quality,quantity,and concerns.This study then critically figures out the problems and research trends that exist in current LLM datasets.The study helps public researchers train and investigate LLMs by visual cases and provides useful comments to the research community regarding data development.To the best of our knowledge,this paper is the first to summarize and discuss datasets used in both autoregressive and chat LLMs.The survey offers insights and suggestions to researchers and LLM developers as they build their models,and contributes to the LLM study by pointing out the existing problems of LLM studies from the perspective of data. 展开更多
关键词 large language model(LLM) autoregressive model AI chatbot natural language processing(NLP)corpora OpenAI
原文传递
空气过滤用聚丙烯腈静电纺纤维膜的制备及其性能 被引量:26
2
作者 冯雪 汪滨 +1 位作者 王娇娜 李从举 《纺织学报》 EI CAS CSCD 北大核心 2017年第4期6-11,共6页
为开发用于空气过滤的纳米纤维,采用静电纺丝技术制备了聚丙烯腈(PAN)纳米纤维膜,探讨了其纺丝液质量分数及纺丝电压对所纺纤维微观形貌的影响,同时研究了纤维膜厚度对过滤效率和压降的影响。实验结果表明:PAN纺丝液质量分数为12%,纺丝... 为开发用于空气过滤的纳米纤维,采用静电纺丝技术制备了聚丙烯腈(PAN)纳米纤维膜,探讨了其纺丝液质量分数及纺丝电压对所纺纤维微观形貌的影响,同时研究了纤维膜厚度对过滤效率和压降的影响。实验结果表明:PAN纺丝液质量分数为12%,纺丝电压为20 k V时,所得纤维粗细均匀,平均直径为230 nm;当纤维膜厚度由18μm增至35μm时,过滤压降则由121.93 Pa升至591.75 Pa,而过滤效率由81.78%升至99.24%。对过滤性能较好的纤维膜分别进行力学性能和泡压法滤膜孔径测试,测得此纤维膜的弹性模量为223.67 MPa,断裂伸长率为51.96%,拉伸断裂应力为5.93 MPa,拉伸强度为7.77 MPa,拉伸屈服应力为2.79 MPa,平均孔径为2.064 3μm。 展开更多
关键词 聚丙烯腈 静电纺丝 空气过滤 纳米纤维
下载PDF
急性缺血性卒中后抑郁的相关危险因素分析 被引量:21
3
作者 杨彩梅 李雪斌 +5 位作者 王洁 黄建敏 蒙兰青 李保生 陆皓 吴为民 《临床神经病学杂志》 CAS 北大核心 2016年第6期401-404,共4页
目的探讨急性缺血性卒中后抑郁(PSD)的发生率及其相关危险因素。方法 185例经CT或MRI证实的急性缺血性卒中患者根据精神障碍诊断和统计手册第5版(DSM-V)标准和24项Hamilton抑郁量表(HAMD)评分分为PSD组和non-PSD组;分析PSD社会人口学资... 目的探讨急性缺血性卒中后抑郁(PSD)的发生率及其相关危险因素。方法 185例经CT或MRI证实的急性缺血性卒中患者根据精神障碍诊断和统计手册第5版(DSM-V)标准和24项Hamilton抑郁量表(HAMD)评分分为PSD组和non-PSD组;分析PSD社会人口学资料、血管危险因素、相关生化指标、NIHSS、Barthel指数(BI)、MMSE等相关因素对PSD的影响。结果本组PSD发生率为40.54%(75例),主要以轻、中度抑郁为主;与non-PSD组比较,PSD组患者糖尿病发生率高(P=0.044),神经功能缺损程度重、日常生活活动能力差(P=0.000,P=0.001),MMSE评分降低(P=0.000),而超敏C-反应蛋白(hs-CRP)和同型半胱氨酸(Hcy)水平升高(P=0.000,P=0.006);其中BI、MMSE评分与HAMD评分呈负相关(均P<0.05),而NIHSS评分、hs-CRP和Hcy与HAMD评分呈正相关(均P<0.05);Logistic回归分析提示,低MMSE评分、高NIHSS评分及高hs-CRP和Hcy水平可能是急性缺血性PSD的独立危险因素。结论 PSD主要以轻、中度抑郁为主;PSD与糖尿病病史、认知功能障碍、神经功能缺损程度、hs-CRP和Hcy水平密切相关。 展开更多
关键词 缺血性脑卒中 卒中后抑郁 超敏C-反应蛋白 同型半胱氨酸
下载PDF
范德华体系以外配位化合物的自旋轨道耦合研究:决定^(2)P_(3/2)态进一步裂分的关键因素
4
作者 曹文锦 王学斌 《Chinese Journal of Chemical Physics》 SCIE EI CAS CSCD 2024年第2期295-302,I0002-I0004,I0103,共12页
本文报道了一项联合光电子能谱和理论计算的研究,探索碘原子与氩原子、氢氟酸、甲酸/乙酸、甘氨酸/甲基化甘氨酸衍生物等分子结合形成的配位化合物中的自旋轨道耦合现象.L.I^(-)(L=甲酸/乙酸化合物的低温光电子谱都呈现了三个清晰分辨... 本文报道了一项联合光电子能谱和理论计算的研究,探索碘原子与氩原子、氢氟酸、甲酸/乙酸、甘氨酸/甲基化甘氨酸衍生物等分子结合形成的配位化合物中的自旋轨道耦合现象.L.I^(-)(L=甲酸/乙酸化合物的低温光电子谱都呈现了三个清晰分辨的波峰,标识了三个自旋轨道耦合态的存在:分别为相应中性化合物中的X(1/2)、A(3/2)和B(1/2)态.X和A态的间距△E_(XA)都为0.10eV,而X和B态的间距△E_(XB)则分别为0.98和0.97eV.本文测得的裂分间距值与先前报道的不同的L·I^(·)(L=氩原子、氢氟酸、甘氨酸和甲基化甘氨酸)的值进行了比较,从而得出了涵盖以范德华力和由弱至强的氢键等多样的分子间相互作用为主导的化合物的自旋轨道耦合裂分规律:尽管不同类型化合物的△E_(XB)比较相似,但△E_(XA)对于配体类型和相互作用类型极其敏感,其数值范围涵盖了从5meV到150meV的跨度.总体而言,实验测得的自旋轨道耦合裂分间距与通过量子化学计算所得数值高度吻合,表明了△E_(XA)的大小与中性化合物的分子间相互作用强度成正相关而与键长成反比. 展开更多
关键词 自旋轨道耦合 光电子能谱 氢键配位化合物
下载PDF
PET酯化废水中有机物回收技术开发及应用 被引量:2
5
作者 李红彬 甘胜华 +1 位作者 张学斌 汪少朋 《聚酯工业》 CAS 2017年第5期5-8,共4页
通过对酯化废水的组成及2-甲基-1,3-二氧环戊烷的生成和分解机理研究,并利用反应精馏和多效精馏工艺技术手段,开发出了可以同时回收废水中乙醛和乙二醇的系列化工艺流程技术,并在行业内得到推广应用。结果表明,利用该回收技术后,总有机... 通过对酯化废水的组成及2-甲基-1,3-二氧环戊烷的生成和分解机理研究,并利用反应精馏和多效精馏工艺技术手段,开发出了可以同时回收废水中乙醛和乙二醇的系列化工艺流程技术,并在行业内得到推广应用。结果表明,利用该回收技术后,总有机物回收率可达95%,汽提后废水COD可降至1 450 mg/L,回收乙醛纯度达到99.5%以上,完全满足工业乙醛使用要求,回收乙二醇浓度大于97%,符合聚酯企业自身使用要求,可以直接回用于聚酯车间进行打浆,从而降低企业生产成本。 展开更多
关键词 PET 酯化废水处理 回收乙醛及乙二醇
下载PDF
面向链路比特流的未知帧关联分析 被引量:9
6
作者 薛开平 柳彬 +2 位作者 王劲松 李威 薛颖杰 《电子与信息学报》 EI CSCD 北大核心 2017年第2期374-380,共7页
在电子对抗中,截获到对方的通信比特流序列之后,当链路协议类型未知时,现有的协议解析工具往往无法分析比特流所承载的有用信息。为了获取比特流承载信息,首先需要切分比特流得到链路帧。该文根据链路帧结构的一般规律,提出一种基于数... 在电子对抗中,截获到对方的通信比特流序列之后,当链路协议类型未知时,现有的协议解析工具往往无法分析比特流所承载的有用信息。为了获取比特流承载信息,首先需要切分比特流得到链路帧。该文根据链路帧结构的一般规律,提出一种基于数据挖掘的比特流切分算法。通过频繁序列统计、关联规则分析以及关联规则整合,识别出比特流中标识帧起始的多重关联规则序列。测试结果表明,该算法能够从未知比特流中提取有效的切分标识,正确实现比特流切分。与同类基于数据挖掘的比特流分析方法相比,该算法复杂度低,输出结果唯一且可信度高。 展开更多
关键词 链路比特流 未知帧 频繁统计 关联分析 切分
下载PDF
一种基于共享执行策略的间隔查询优化技术 被引量:3
7
作者 周新 张孝 +1 位作者 薛忠斌 王珊 《软件学报》 EI CSCD 北大核心 2016年第12期3067-3084,共18页
间隔查询作为重要的查询类型,广泛应用在社交网络、信息检索和数据库领域.为了支持高效的间隔查询,涌现出多种优化技术.尽管已有方法能够快速响应单个间隔查询,然而当查询负载超过服务器的处理能力时,70%的查询均不能在期望时间内得到响... 间隔查询作为重要的查询类型,广泛应用在社交网络、信息检索和数据库领域.为了支持高效的间隔查询,涌现出多种优化技术.尽管已有方法能够快速响应单个间隔查询,然而当查询负载超过服务器的处理能力时,70%的查询均不能在期望时间内得到响应.针对这一问题,提出采用共享执行策略优化间隔查询的方法 SESIQ(shared execution strategy for interval queries).SESIQ对间隔查询进行批处理,分析一组间隔查询间可共享的操作,减少重复数据的访问,从而降低磁盘I/O和网络传输代价,提高检索性能.理论分析并实验验证了SESIQ的可行性,基于两种真实数据集的大量实验结果表明,SESIQ是有效的,间隔查询的检索性能可提升数十倍. 展开更多
关键词 间隔查询 优化 共享执行
下载PDF
煤矿服务策略的评估方法研究
8
作者 薛霄 桂彬 王永茂 《系统仿真学报》 CAS CSCD 北大核心 2017年第4期798-807,817,共11页
煤矿服务系统是通过对多个现有信息系统的封装和集成来实现,其中服务策略的运行效果直接决定了服务系统的整体性能。但是,由于煤矿事故的复杂性和煤矿环境的特殊性,难以在实际环境中对服务策略进行测试评估。针对该问题,提出基于计算实... 煤矿服务系统是通过对多个现有信息系统的封装和集成来实现,其中服务策略的运行效果直接决定了服务系统的整体性能。但是,由于煤矿事故的复杂性和煤矿环境的特殊性,难以在实际环境中对服务策略进行测试评估。针对该问题,提出基于计算实验的煤矿服务策略评估方法。该方法分为三个步骤:给出了煤矿服务系统的自适应服务策略;构建出与真实环境相符的实验系统模型;根据模型分析,构建出三维虚拟矿井实验平台,能够对服务策略的正确性进行定量评估。实验结果证明该方法是可行的,能够对服务策略的运行效果提供决策支持。 展开更多
关键词 煤矿服务策略 信息集成 计算实验 评估方法
下载PDF
心脏术后医院感染发生现状及高危因素研究 被引量:13
9
作者 王学斌 姚滨 +2 位作者 张勇 王海曙 张顺业 《中华医院感染学杂志》 CAS CSCD 北大核心 2017年第7期1558-1560,1571,共4页
目的分析心脏手术后医院感染发生现状及高危因素,为感染的预防与控制提供依据。方法选取2014年6月-2016年5月医院的心脏手术患者375例为研究对象,将其术后医院感染率进行统计,分析感染部位、病原菌分布及感染因素。结果共19例患者发生... 目的分析心脏手术后医院感染发生现状及高危因素,为感染的预防与控制提供依据。方法选取2014年6月-2016年5月医院的心脏手术患者375例为研究对象,将其术后医院感染率进行统计,分析感染部位、病原菌分布及感染因素。结果共19例患者发生医院感染,感染率为5.07%,以呼吸道感染为主,共10例占52.63%;共检出23株病原菌,以革兰阴性菌为主,共15株占65.22%;logistic回归分析显示,年龄较高、手术时间较长、抗菌药物联用、呼吸机应用时间较长、导尿管留置时间较长、血糖较高及体外循环手术是发生医院感染的独立危险因素(P<0.05)。结论心脏手术后医院感染率较高,其中呼吸道感染为主,革兰阴性菌仍是主要病原菌,且其高危因素较多,应给予针对性干预。 展开更多
关键词 心脏手术 术后医院感染 感染部位 病原菌分布 高危因素
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部