汉字将会是未来的智能技术的核心

现今的人工智能和神经网络的核心是图像处理,这个图像不单指视觉图像,还包括声音、压力信息等,简单就是“点”群组成个具有一定特征的“像”(集合)。

“点”有属性,如一般“视觉点”的属性是(红、绿、蓝),“声点”的属性是“(音调,响度,音色)”,这些点集可以组成具有人类可识别特征的“图”,两者可分别称为“色图”、“声图”

图像有处理方法:图像数字化;图像变换;图像增强;图像恢复;图像压缩编码等。

PhotoShop常用平滑、锐化、模糊等都是其中的方法。这些方法也可以处理非“色图”。

优秀的图像是自然的,比如下图的左图。

原图和填充图

知道上面的基础知识,想象我们能否将汉字变成一个点,一篇诗词或文章就是一个“图”呢?这个图称之为“文图”。

古代总是崇尚五行论,不妨,我们假设,一个汉字对应的点用五行参数(金,木,水,火,土)表示,每个参数取值范围是0~255,即

“金”=(255,0,0,0,0)
“木”=(0,255,0,0,0)
“水”=(0,0,255,0,0)
“火”=(0,0,0,255,0)
“土”=(0,0,0,0,255)

根据常识,“光”生于火,利于木,假设“光”=(0,200,0,200,0).

“钢”是对含碳量质量百分比介于0.02%至2.11%之间的铁碳合金统称,不妨假设“钢”=(100,2,0,0,1)

“力”甲骨文是翻土的农具,不妨假设“力”=(30,10,4,0,20)

“国”古文是兵戈守护城邑,不妨假设“国”=(40,20,12,10,31)

以此类推,制造神经算法的训练集,除"金","木","水","火","土"外,其他预设值都是可以变的。

除此之外,还可以通过意思近似来作训练,比如“拒绝”~“不”,即若“拒”=(12,8,1,40,3),“绝”=(40,20,10,12,0),那么“不”应该在(26,14,6,26,2)附近,融合方法与色彩RGB的融合方式一样。

汉字是多义的,如“后”:

  1. 君主;帝王:商之先~(先王)。
  2. 帝王的正妻:皇~。太~。
  3. 诸候。《書•舜典》:“肆覲東后。”
  4. 指空间在背面,反面的,与“前”相对:~窗户。~面。~学。~缀。~进。
  5. 时间较晚,与“先”相对:日~。~福。~期。
  6. 指次序,与“前”相对:~排。~十名。
  7. 子孙:~辈。~嗣。~裔。~昆。无~(没有子孙)。
  8. 姓。

但“后”只有两个本征含义,即次序意义,和君主义(皇后、后王),而前者义则可以用“後”表示,(后是後的简化字,原本意义就是分开的),这样“后”和“後”就各只有一个含义。(姓,无意义)

一般一个汉字最多三个本征含义,原本都是一个含义的,由于假借、或通假等历史原因产生了一字多义,所以可以从古文中找另外两个其他形式的字借用。输出文章汉字再代回来。

如此,就可以制造训练集,通过神经网络训练,可以得出每个常用汉字的属性值

对于一首诗和一篇文章,我们可以将其中汉字编译成这个五行参数,形成一张“文图”。

分析这些“文图”特征,我们就可以随意用白话文来写诗和文章了。

比如,

“我想你了,而你却不知道” → 五行参数点 → “文图” → 图像处理(磨平、自然化、特征化)→ 优美的“文图” → 反译 → “山有木兮木有枝,心悦君兮君不知。”

五行参数点与色彩点是否有转换关系呢

如果有,是否能利用五行参数点从一个高维的视角去识别图像,就像人一样,而不是像现在这样扫描式识别呢?

一个马的图像转换后其中一个值就是“马”=(*,*,*,*,*)

甚至用一张(动)图自动写文章,而不像现在的人工智能因为一点“噪声”就牛头不对马嘴。

如果可以,汉字就是未来的智能技术的核心,而不像现在这样脱离不了英文

展开阅读全文

页面更新:2024-05-03

标签:汉字   神经网络   英文   含义   属性   图像   特征   意义   核心   参数   未来   智能   方法   技术

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top