人工智能:两面镜子的互相学习
本人并非人工智能科研人员,只是一名对人工智能较感兴趣的诗人,从启发想象力的角度来做一个假设。
一、人类认知:从客观世界到人脑
我们知道,人类不断进化的历史就是人类不断认识世界、改造世界的历史。一是学习,一是改造。比如,先认识自然界中哪些物种可以成为食物,再进行大面积种植养殖来养活人类。认知事物,再让认知造福人类。
人工智能上升了一个维度,在认知的同时(人类已有的知识、经验),还要学习人的认知和改造世界的过程(世界观+方法论),以此促进人类更深入、更科学地对世界进行改造。比如通过大数据的统计,选出最好的种子最佳季节最适合的雨水,种出最好的粮食,通过各要素的最优组合,求得最佳结果。
从这个过程可以看出人与世界的关系:世界是一个客观存在,人对世界的认识在人的大脑中如镜面照出的影像。有时,多变换角度,映像会更全面更完整更立体。
当然,人认识世界时,动用了眼耳鼻舌身意,多种感官和意识加工,绝非镜面所映照出的图像那么简单,而是包括了除暗物质之外的可以达到的一切认知。
如图中示意的一样,人是世界的一面镜子,人类对世界的认知是世界在人脑中的全部映像,可以是二维的,也可以是三维或多维的。这叫“用人脑作一面镜子照见世界”。
二、模仿游戏:从人脑到电脑
电脑学习人脑,已知的知识可以直接输入,人脑的思考过程(世界观和方法论交织的复杂过程)可以用大数据分析和惯性模拟,这个过程我们可以形象地称作“用电脑照见人脑”(包含人的三观、认知)。
这种“照见”,是一个由简单到复杂的过程。简单的问题很好解决,复杂的问题难度极大。
所谓简单的问题,就是通过计算和推导,答案惟一的问题。
比如复杂的加减乘除,大家都会用计算器或计算机,运算快,结果准确。没有人因为自己计算没有计算器快没有计算器准确而认为自己被计算器打败了或是奴役了。工具而己。
复杂一些的问题,答案不止一个,而是多个。起点、路径与结果都不一样,看你选择。比如地图导航,比如审判案件,比如破译密码,比如棋类人机大战。
这时候我们选择的方法是让电脑罗列出一切可能,加上最新及时数据,统计出各种可能性的成功比例,让“人”来选择。选A成功率85%,选B成功率60%,选C成功率30%等等,你会选择A。
当然,根据你个人的价值观或喜好,你也可以选B。比如从甲地到乙地,你赶时间的话选A,速度最快;如果时间没那么紧,你也可以选B,沿路看看风景。但生活在群体里,有时你的选择需要符合群体通识。大家都选择速度优先时,会趋动你也选择速度优先,你在群体活动中每次都直接选择A即可。但开车自驾的朋友都有体会,“天有不测风云”,当你选择A路线上了高速之后,有可能前方出现事故而堵车,你被卡在上面下不来,而选择不走高速的朋友却先到达了目的地。这说明电脑是基于已知和惯性作出的推论,即使加上及时数据更新,也无法预知未知的情况可能带来的颠覆性的结果。
三、人工智能:两面镜子的互相学习
所谓人工智能,其实解决的就是不用“人”来选择“下一步”,而是电脑根据“人”的“三观”和“授权”自动执行“下一步”。比如说“选最快的路线”,“成功率在75%以上自行决定”等,不用“人”操作,电脑会自行选择并自动执行“下一步”,如果每一个“下一步”你都进行了“价值”和“授权”的设定,那电脑会直接执行到最后一步,亮出你想要的结果。
电脑的聪明与否,就看大数据的积累,数据的全面性、针对性、及时性、准确性、新鲜度,及其学习人的各种感知能力的广度、深度,学习思考能力的相似度等等。
我们把人的三观、知识及学习能力都统括到“人”这个箩筐里,把电脑作为一个镜面,电脑对“人”的学习,就是映照出人的影像(包括箩筐里装着的三观、知识、技能、大数据等)。电脑对“人”(人脑)的学习效果,关键要看映像的准确度以及透视的深度。
由于人的认知是基于对无限世界及其规律的有限认知,也可以概括为一种映像——人就是自然的一面镜子(不是惟一的一面,95%的暗物质里就藏着更多的镜子,需要我们进一步发现和认知)。
这样我们就不难理解,人与电脑之间的映照其实是两个镜面之间的映照。
人的已有知识经验及案例被电脑记录,这是第一次映照,电脑告诉“人”根据已有知识经验及案例做出A选择,这是第一次“条件”反射式的给出答案;人在选择A选项之后,又发现了新问题并予以解决,新知识再次被电脑记录,这是第二次映照;人在又一次选择时,电脑根据补充了新经验新案例的知识库再次给出A选项,虽然还是A选项,但这是第二次“条件”反射,水平及成功率比第一次均有所提高;人在选择A之后再次发现新问题并予以解决,新经验新案例又一次被电脑记录,这是第三次映照……
这就如同两面镜子面对面水平放置,互相照见对方,深度不断加深。这是电脑与人脑互相学习互相提高不断迭代的过程。
好了,你如果认同上面的假设,那我们就来做一个试验,让两面镜子面对面平行放置,看看其内部映像的深度。
你从图中可以看到两个现象,一是映像越深越模糊,二是只要两个镜面不平行,镜子中的“手”的映像就会弯曲甚至偏离“航线”。
这个试验中,我能给出的对“映像越深越模糊”的解释是,我们对世界的认知是极其有限的,如果世界上真的95%都是暗物质,假设我们对5%的明物质100%认知,通过大数据积累了解5%暗物质作用结果(尽管并不知道为什么会是这种结果)的认知,我们总共才认知了10%,依旧是相当有限的,那在电脑与人脑的相互学习和不断迭代中,两三层互相映照之后,就彼此看不清了。
我能给出的对“镜面不平行导致映像弯曲”的解释是,因为每个人(群体)所处的阶层、民族、国家、宗教、个体需求不同,三观并不一致,因此,使用人工智能并不能基于全人类全地球全宇宙去做出一个绝对客观公平公正的观察思考与选择,每种选择都带有各自的主观性,这就带来了不同角度。两个镜面互相映照的试验可以看出,最深的角度只有一个,稍有偏移就无法看到更深的“远方”。
在一个问题几个答案面前,我们要让电脑学会像人一样分析和选择,已经是很难的一件事了,何况,我们对“人的学习”了解得并不充分,对人类有目的的学习我们会清楚些,但一些本能的、应激的学习,就不一定清楚,比如眼耳鼻舌身意的日常感知、记忆、条件反射等,这种潜意识的学习,每时每刻都在学习和记忆。如果再涉及遗传与本能,学习起来就更复杂了。
从惟一答案到多个答案,难度是几何极数的递增,这里面的难点在于,一是人的学习过程本身我们并不一定清楚,至少对遗传和潜意识部分不甚了解;二是对物质世界的认知极其有限,甚至很多在“暗物质”层面的认知因为是“暗物质”,被错划为“意识”,从而忽略了对其规律和原理的探知;意识是否是物质?如果是物质,将会对客观世界的认知产生颠覆性的影响;人的三观直到国家、民族、宗教的三观难以统一,电脑的三观如何设定?在世界消除不平等与差异之前,不同三观主导的人工智能是否需要设定共同价值遵守还是任其继续让“丛林规则”插上科技的翅膀?
四、感性艺术:人工智能的死亡地带
而更难以逾越的是,从多个答案到无数个答案,问题只有一个,答案千差万别,各有其合理性,这就到了感性、想象力、艺术的领域。比如,以“悲伤”为主题,写一首诗,画一幅画,谱一首曲。成千上万个人就可以成千上万个答案,甚至同一个人也可以写出好多个答案,这在文学艺术创作中已经屡见不鲜。科学是在总结规律,艺术是在激发想象。多对一时,合并同类项,提取公因式就可以,答案一收敛,就有了公式或是规律;而一对多时,它的魅力恰恰在于其不确定性所蕴含的突出其来、眼前一亮、峰回路转、醍醐灌顶。试想,如果给人工智能电脑出一道艺术范畴的题?它该怎么应答?它有情商吗?它有细致的感情刻度和多向性吗?它能够瞬间模拟出各种喜怒哀乐并触景生情吗?
说得更直白一点,电脑可以替人爱、替人恨、替人表达情感、进行充满激情而非模仿抄袭式的艺术创作吗?
从“两个镜面互相学习”的试验中,我们已经感觉到知识的有限性和角度的不一致性对两个镜面中的映像带来的清晰度的限制和观察深度的限制,如果再加上三观、情感、暗物质、想象力这些不确定因素,我们就很难得出人工智能一定能战胜人类的结论了。
人类对人工智能的探索,可能像坐标轴上的双曲线一样,无限接近,却无法达到。也正因为无法接近,也才增加了人类无限接近的探知欲望。
基于此,我们可以放下人工智能一定能战胜人类的恐惧,而是要像当年发明计算器一样,将人工智能发展成一种工具,更好地服务于人类,服务于世界。