摘要
自然语言处理建构在“道元(token)”之上,道元是AI算法处理和学习各种文字、图像与声音数据类型的基本元素。道元生成的过程与老子“道生一,一生二,二生三,三生万物”相似。大语言模型利用“间距”产生道元后,转换成位,透过大量数据的学习与计算,进行新的道元生成与意义重组。由于结合概率重组,人工智能出现类似于人类行为的不可预测性和独特性。未来借鉴老子哲学和汉字的多样性,人工智能可以发展出更全面和创新的框架。
and concrete meanings.Tokens are central to AI algorithms,enabling the processing of text,images,video,and audio.Their generation and inference mirror Laozi's principle:“Tao generates One,One generates Two,Two generates Three,Three generates all things.”Large language models use L'écart(间距)to deconstruct tokens into bits,learning from vast data sets to generate new tokens with evolving meanings.By incorporating probabilistic recombination,AI achieves unpredictability and uniqueness,akin to human behavior.Drawing on Laozi's philosophy and the diversity of Chinese characters,AI can develop a more holistic and innovative framework.
作者
张中鸿
张庆瑞
Chung-Hong CHANG;Ching-Ray CHANG
出处
《中国科技术语》
2025年第1期57-63,共7页
CHINA TERMINOLOGY
关键词
道元
位
道元化
间距
人工智能
老子之道
token
bit
tokenization
L'écart
artificial intelligence
Laozi's Tao philosophy