返回

穿越:2014

首页
关灯
护眼
字体:
第181章 AlphaGo/AlphaZero(2/5)
   存书签 书架管理 返回目录
    阅读提示:为防止内容获取不全,请勿使用浏览器阅读模式。

能的爆点。

    那么这个时空林灰也完全可以将阿法狗AlphaGo类似的程序搞出来然后想办法促成人机对战。

    之后再适当加以运作使这次事件成为人工智能的爆点。

    涉及到阿法狗AlphaGo。

    前世阿法狗AlphaGo是deepnd这家嘤國公司推出的。

    虽然这个时空也存在deepnd这家公司。

    但林灰也不用担心撞车什么的。

    前世阿法狗AlphaGo的诞生虽然跟deepnd这家公司有着千丝万缕的联系。

    但涉及到阿法狗AlphaGo这个项目其实是deepnd这家公司被谷/歌收购之后他们才开始搞的。

    总之前世阿法狗AlphaGo之所以能够诞生跟deepnd和谷/歌之间的py交易有着很大的关系。

    可是现在这个时空里谷/歌和deepnd并没有进行该项目的合作。

    而且大概率在将来也不会有合作的机会了。

    林灰先前就了解过。

    这个时空名为deepnd的公司确实存在。

    但因为这个时空在人工智能上研究的整体性滞后。

    deepnd这家公司虽然也从事人工智能方面的研究。

    但进展什么的寥寥无几。

    而且deepnd这家公司并不是很好过。

    前不久该公司还试图申请破产保护。

    这样的公司想获得前世的成就基本不大可能。

    在这个时空人工智能方面的研究整体滞后的情况下。

    林灰要搬运阿法狗AlphaGo的话基本不用担心有什么技术撞车风险的。

    虽然没什么风险,但涉及到阿法狗AlphaGo的搬运却稍稍有点麻烦。

    倒不是技术理论方面有什么麻烦。

    虽然这个时空的人们还没搞定相应的技术。

    但对林灰来说技术理论道路什么的却很清晰。

    像阿法狗AlphaGo这样的经典人工智能应用。

    基本上十个搞人工智能的九个都专门钻研过阿法狗AlphaGo是怎么一回事。

    涉及到阿法狗AlphaGo的技术:

    无非就是蒙特卡洛树搜索与两个深度神经网络相结合的一个简单应用。

    蒙特卡洛树搜索是一种用于某些决策过程的启发式搜索算法,最引人注目的是在游戏中的使用。

    在棋类游戏中尤为常见。

    具体的两个深度神经网络,其中一个是估值网络,另一个则是走棋网络。

    前者是用来评估比较合适的落点的,走棋网络是用来调整最佳落子位置的。

    为什么要采用这种设计呢?

    很大程度上是受人类下棋的启发。

    人类下棋的时候,首先棋手会通过过去的经验、棋谱先大致判断出下哪里不吃亏。

    缩小搜索范围之后,棋手会对某一局部位置进行详细的推演。

    至于推演时候,棋手主要思考的是自己如何落子、落子之后对手又会如何反应。

    一般来说,优秀的棋手都应该具备这种的推演能力。

    走一步看十几步甚至几十步,才能成为围棋高手。

    至于推演的目的则是是为了找出对自己最有利的落点。

    总结一下,优秀棋手要具有一下能力:

    首先通过局势判断大概可行走法;

    然后判断局势是否对自己有利;

    再之后推演局势找出最佳落点。

    人工智能虽然看起来是机器方面的学问。

    但实际上是科研人员在试图让机器像人那样去思维。

    阿法狗AlphaGo在运行的逻辑本质上很接近人类棋手
本章未完,请点击下一页继续阅读》》
上一页 目录 下一页