alphago为什么能战胜人类?AlphaGo到底为我们带来了什么人工智能

人气:357 ℃/2023-11-06 19:17:48

2016年3月,AlphaGo横空出世对战围棋九段棋手李世石,这对人工智能的社会影响非常大。AlphaGo到底为我们带来了什么?

在AlphaGo的搜索中,谷歌DeepMind团队引入了一个新概念---用深度学习和强化学习的结合来做两种任务的判别,即来判别现在所在的棋盘是好是坏,同时来预测未来有利的走向。由此可以看出AlphaGo的算法和未来商业模式的关联,即通过对大数据的分析,让我们对“现在状态”有了一个清晰的理解。这个状态可以是棋盘,可以是足球运动中两队交锋的状态,也可以是当前营销的一个状态。围棋中的一步,可以理解成对未来走向的预判,在商业活动中,是营销活动中的下步。商业行为中对现实的判断和对商业未来走向的预估这两个任务同样重要,都需要大数据的支持。围棋是一个封闭式的游戏,没有外界因素的干扰,为了得到更多的数据,AlphaGo引入了自我博弈。所谓自我博弈就是自己玩游戏,你会不断得到反馈,然后来更新策略。经过无数次这样的比赛,最后会得到一个好的策略,最终输出是一个行为的策略。所以 AlphaGo告诉我们,在一个封闭场景中,可以用自我博弈的模拟方法得到更多的数据。

从AlphaGo到人工智能的应用流程,如果沿着下围棋的步骤走,就会面临一些问题:人工智能算法的目标是什么?有没有数据?数据在哪里?问题的边界是否清晰?什么叫合理的走法?什么叫犯规的走法?特征在哪里?如何得到这些特征?是否可以得到一个持续的反馈?这样的流程是AlphaGo设计团队所走过的路。不妨把这些步骤记下来,变成一个工作流,看看其他领域是否可以重复AlphaGo的成功。比如,如果用AlphaGo治疗癌症,该如何治疗呢?一般方法是用放射线杀死癌细胞,而每一个癌症患者需要的剂量、角度、频次可能都不一样,如果把所有信息和经过一段时间的治疗结果都记录下来,就有了数据、特征和问题持续的反馈,并且有了非常清晰的目标,即在副作用最小的情况下杀死癌细胞。并且这个工作流是可以重复的。

人工智能前30年的历史积累也很有用,我们对人工智能的理解不应该片面地认为就是机器学习。人工智能前30年的发展历史是从20世纪50年代中期到80年代中期。这30年间人工智能在干什么呢?在做人工输入的规则型的知识表达研究,以及基于这些规则的符号空间的推理和搜索。笔者认为,人工规则型的知识表达在人工智能的应用中是必不可少的,因为在众多领域中会碰到冷启动问题,以及如何规范一个领域的边界问题。逻辑推理、逻辑知识表达以及在符号空间搜索的人工智能分支,在今后几年会和统计学习相结合,并有较大发展。这种发展也会涉及技术和商业两个层面。

百科

More+
首页/电脑版/网名
© 2025 NiBaKu.Com All Rights Reserved.