阿尔法元(AlphaGo Zero)能够完全自主学习并超越人类,会对人类产生威胁吗?

先看下这次的AlphaGo Zero相较此前的版本有以下5点提升:
1.AlphaGo Zero通过与自己不断挑战来进行提升,不依赖人类数据。此前版本则是通过分析海量棋谱数据进行学习。AlphaGo

本文最后更新时间:  2023-05-07 07:11:17

先看下这次的AlphaGo Zero相较此前的版本有以下5点提升:

1.AlphaGo Zero通过与自己不断挑战来进行提升,不依赖人类数据。此前版本则是通过分析海量棋谱数据进行学习。AlphaGo打败李世石用了3000万盘比赛作为训练数据,而AlphaGo Zero仅用了490万盘比赛数据。经过3天的训练,AlphaGo Zero以100:0的战绩完胜AlphaGo。并且只用了1台机器和4个TPU,而李世石版AlphaGo则用了48个TPU。

2.AlphaGo Zero只使用围棋棋盘上的黑子和白子作为输入,而上一版本的AlphaGo的输入包含了少量人工设计的特征。

3.AlphaGo Zero 不使用“走子演算”,它依赖于高质量的神经网络来评估落子位置。其它围棋程序使用的快速、随机游戏,用来预测哪一方将从当前的棋局中获胜。

4.在训练过程中,AlphaGo Zero每下一步需要思考的时间是0.4秒。相比之前的版本,仅使用了单一的神经网络。

5.AlphaGo Zero采用的是人工神经网络。这种网络可以计算出下一步走棋的可能性,估算出下棋选手赢的概率。随后根据计算,AlphaGo Zero会选择最大概率赢的一步去下。

面对这些提升,曾与AlphaGo有过交战的柯洁表示,“对于AlphaGo的自我进步来讲...人类太多余了”。

可以看出,令大家真正感到恐惧的,是AlphaGo Zero强大的自我学习能力。然而这强大的自我学习能力如何带来实际收益,实现行业应用,并带来商业价值,才是DeepMind团队的最终目标。

其实早在2016年,DeepMind团队也尝试利用AlphaGo的学习能力进行了行业应用的探索。

DeepMind接管了谷歌数据中心的一些控制单元,包括风扇、空调、窗户和服务器等,通过机器学习,帮助谷歌数据中心的冷却系统节约用电40%,并提高了15%的能源使用效率。目前,DeepMind的部分研发项目已经开始用于能源基础设施管理、医疗系统和洁净水源的改进等方面,公司也已经从中获得收益。

对于AlphaGo Zero的学习能力是否会威胁人类,从目标来看,暂时是不会的。

温馨提示:内容均由网友自行发布提供,仅用于学习交流,如有版权问题,请联系我们。