新足迹 › 论坛 › 澳洲生活区 › 新闻汇总 › 国际新闻 › 谷歌的人工智能 AlphaGo Zero 具备自学围棋能力 ...

精华好帖回顾
· 我和aami不得不说的“难忘邂逅” (2008-10-1) mick703	· Follow me--live from Tassi (lots of photos) (2008-2-2) patricb
· E&E -- 碧绿韭菜煎饼 (2009-4-1) 闲夏采薇	· 那年，今天，我心里一直有你 (2012-3-3) 偌儿

12 / 2 页下一页

查看: 5903|回复: 59

谷歌的人工智能 AlphaGo Zero 具备自学围棋能力 [复制链接]

melbourneONE

皮靴族

发表于 2017-10-19 06:49 |显示全部楼层

此文章由 melbourneONE 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 melbourneONE 所有！转贴必须注明作者、出处和本声明，并保持内容完整

Google拥有的DeepMind公司的人造智能（AI）已经研发出AlphaGo Zero 具备自学围棋能力，不需要从人类棋谱中学习，并达到了超出人类的水平。

这种在没有人力投入的情况下，进行自我训练的能力，是创造一个可以解决任何任务的一般AI的梦想的关键一步。 DeepMind首席执行官Demis Hassabis在新闻发布会上表示，在不久的未来，此种技术能够承担蛋白质折叠或材料研究等科学挑战。 “我们很激动，因为我们认为现在已经足够好，可以在一些真正的问题上取得一些真正的进展。”

https://www.nature.com/news/self ... Id=MTI2MzE1OTA4NgS2

https://www.nature.com/articles/ ... HqBpoH28uIahw%3D%3D

评分

参与人数 3	积分 +14	收起理由
hsy12	+ 5	感谢分享
mhh	+ 4	感谢分享
BreakingBad	+ 5	感谢分享

查看全部评分

管理人员评分

dootbear 在2017-10-19 08:41 +10分 并说

dtmr17

银靴族

发表于 2017-10-19 06:50 |显示全部楼层

此文章由 dtmr17 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 dtmr17 所有！转贴必须注明作者、出处和本声明，并保持内容完整

柯洁再次哭晕。没有生在好时代啊。

吸金瓶

铜靴族

发表于 2017-10-19 06:52 |显示全部楼层

此文章由吸金瓶原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者吸金瓶所有！转贴必须注明作者、出处和本声明，并保持内容完整

科技改变生活
现在经常在网上玩扑克游戏，打麻将

student9

头像被屏蔽

禁止发言

发表于 2017-10-19 06:56 |显示全部楼层

此文章由 student9 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 student9 所有！转贴必须注明作者、出处和本声明，并保持内容完整

melbourneONE

皮靴族

发表于 2017-10-19 07:01 |显示全部楼层

AlphaGo Zero 已经跳出人类玩家的框框，带领人类进入一些神秘领域，探索围棋奥妙。

Silver and colleagues’ results suggest that centuries of human gameplay have not been wholly wrong. AlphaGo Zero independently found, used and occasionally transcended many established sequences of moves used by human players. In particular, the AI’s open-ing choices and end-game methods have converged on ours— seeing it arrive at our sequences from first principles suggests that we haven’t been on entirely the wrong track. By contrast, some of its middle-game judgements are truly mysterious and give observing human players the feeling that they are seeing a strong human play, rather than watching a computer calculate.

BreakingBad

金靴族

发表于 2017-10-19 08:46 |显示全部楼层

此文章由 BreakingBad 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 BreakingBad 所有！转贴必须注明作者、出处和本声明，并保持内容完整

从nature上翻译新闻的不多见啊

fffighter

金靴族

发表于 2017-10-19 08:53 |显示全部楼层

此文章由 fffighter 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 fffighter 所有！转贴必须注明作者、出处和本声明，并保持内容完整

技术开始抛弃人类这个载体，进行自我演进了。

这一天，终于来了。

mhh

铜靴族

发表于 2017-10-19 09:00 来自手机 |显示全部楼层

此文章由 mhh 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 mhh 所有！转贴必须注明作者、出处和本声明，并保持内容完整

感谢分享

Coolbananas

金靴族

发表于 2017-10-19 09:03 |显示全部楼层

此文章由 Coolbananas 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 Coolbananas 所有！转贴必须注明作者、出处和本声明，并保持内容完整

强

克赛前来拜访

皮靴族

发表于 2017-10-19 09:21 |显示全部楼层

此文章由克赛前来拜访原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者克赛前来拜访所有！转贴必须注明作者、出处和本声明，并保持内容完整

自我学习三天就超过了击败李昌镐的阿法狗版本，40天超过了击败柯洁的阿法狗Master版本。这种效率实在太高了。
最关键的是完全跳过了学习人类历史棋局这一步，人类不再是计算机的老师。
下一步可以让计算机自我学习，发明更好的算法，从而进一步发明更聪明的计算机。

wdmznzd

白金靴族

发表于 2017-10-19 10:49 来自手机 |显示全部楼层

此文章由 wdmznzd 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 wdmznzd 所有！转贴必须注明作者、出处和本声明，并保持内容完整

克赛前来拜访发表于 2017-10-19 09:21
自我学习三天就超过了击败李昌镐的阿法狗版本，40天超过了击败柯洁的阿法狗Master版本。这种效率实在太高了 ...

他们可以发明更聪明的人类。

阅读之前，没有真相

melbourneONE

皮靴族

发表于 2017-10-19 10:58 |显示全部楼层

这篇文章讲了个大概如何AlphaGo Zero 自己学习的。有兴趣的可以看看。

https://www.nature.com/articles/ ... m0Mxxvq0hXSuJHsQ%3D

wdmznzd

白金靴族

发表于 2017-10-19 11:05 来自手机 |显示全部楼层

此文章由 wdmznzd 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 wdmznzd 所有！转贴必须注明作者、出处和本声明，并保持内容完整

一台无师自通的电脑，在没有任何人类专家输入的前提下，成为了极其复杂的棋盘游戏围棋的世界顶级高手。

在高调推出AlphaGo不到两年后，谷歌(Google)旗下位于伦敦的人工智能公司DeepMind宣布了人工智能(AI)技术的又一里程碑，AlphaGo是在这项古老的亚洲游戏上击败人类冠军的第一台机器。科学期刊《自然》(Nature)发表了相关细节。

前几代AlphaGo最初通过分析成千上万场优秀人类玩家间的对决来发现制胜招数。新开发的AlphaGo Zero则根本不需要人类专长，只要知道游戏规则和目标就可以投入游戏。

“它学游戏仅仅是通过跟自己玩，从完全的随机玩游戏开始，”DeepMind首席执行官杰米斯•哈萨比斯(Demis Hassabis)说。“在玩的过程中，它很快就超过了人类的水平，并以100比0的战绩击败了在论文中介绍过的上一代AlphaGo。”

他的同事、AlphaGo项目负责人戴维•西尔弗(David Silver)补充称：“我们不以任何方式使用人类数据，就可以让它从一块白板创造知识。”在几天时间里，AlphaGo不仅学会了下围棋，而且还胜过了人类历经数千年在该游戏上累积的智慧。

该团队开发了一种新的“强化学习”形式来创造AlphaGo Zero，将基于搜索的未来走法模拟与神经网络相结合，决定如何出招才能获得最高的获胜概率。该网络用数百万场培训游戏不断更新，每次更新都会带来稍稍增强的系统。

尽管围棋在某种层面上非常复杂，具有比宇宙中的原子更多的潜在走法，但从另一个层面来说它也是简单的，因为它是一种“完美信息的游戏”——它不会像扑克牌或骰子一样与机会有关，而且棋局完全由棋子的位置决定。

下围棋需要占据比对手更多的地盘。围棋的这个特征让它特别容易受到AlphaGo所依赖的计算机模拟的影响。DeepMind正在考虑将该技术应用于那些能以类似方式结构化的现实生活问题。

哈萨比斯指出，它很有希望应用于预测蛋白质分子形状-——药物发现中的一个重要问题。其他可能的科学应用包括设计新材料和气候建模。

评分

参与人数 1	积分 +3	收起理由
melbourneONE	+ 3	感谢分享

查看全部评分

阅读之前，没有真相

slau1

白金靴族

发表于 2017-10-19 13:09 |显示全部楼层

此文章由 slau1 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 slau1 所有！转贴必须注明作者、出处和本声明，并保持内容完整

上學期presentation還講了這個topic

wdmznzd

白金靴族

发表于 2017-10-19 13:51 来自手机 |显示全部楼层

此文章由 wdmznzd 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 wdmznzd 所有！转贴必须注明作者、出处和本声明，并保持内容完整

职业围棋手的工作将变得毫无意义。

txhdeve

头像被屏蔽

禁止发言

发表于 2017-10-19 14:22 |显示全部楼层

此文章由 txhdeve 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 txhdeve 所有！转贴必须注明作者、出处和本声明，并保持内容完整

这也也可看成是人类的自我进化，当机器人统治这个世界的时候，就是人类完成自我升级之时。

mikelee19

钻石靴族

发表于 2017-10-19 18:11 |显示全部楼层

此文章由 mikelee19 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 mikelee19 所有！转贴必须注明作者、出处和本声明，并保持内容完整

人类完全进入享受阶段

dtmr17

银靴族

发表于 2017-10-19 20:05 |显示全部楼层

此文章由 dtmr17 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 dtmr17 所有！转贴必须注明作者、出处和本声明，并保持内容完整

克赛前来拜访发表于 2017-10-19 09:21
自我学习三天就超过了击败李昌镐的阿法狗版本，40天超过了击败柯洁的阿法狗Master版本。这种效率实在太高了 ...

是小李不是大李。

cjx007

银靴族

发表于 2017-10-19 23:07 |显示全部楼层

此文章由 cjx007 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 cjx007 所有！转贴必须注明作者、出处和本声明，并保持内容完整

dtmr17 发表于 2017-10-19 06:50
柯洁再次哭晕。没有生在好时代啊。

不会的，人还是和人打，柯洁和狗打完之后，现在打人和狗打人一样。

qwertyui

金靴族

发表于 2017-10-19 23:17 |显示全部楼层

此文章由 qwertyui 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 qwertyui 所有！转贴必须注明作者、出处和本声明，并保持内容完整

wdmznzd 发表于 2017-10-19 10:51
职业围棋手的工作将变得毫无意义。

人类跑的最快的100米记录也没法突破8秒，满大街的汽车轻易就能做到。但奥林匹克的百米飞人比赛，一点也不会因此逊色。

szren

金靴族

发表于 2017-10-19 23:19 来自手机 |显示全部楼层

此文章由 szren 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 szren 所有！转贴必须注明作者、出处和本声明，并保持内容完整

周鸿祎
5小时前 · 奇虎360董事长
AlphaGo自我学习这件事确实颠覆了一般性的深度学习，这才是真正的人工智能，我觉得机器即使不会产生意识，但是会训练出超越人类的规则与经验。本来我不相信机器会奴役人类的但是我觉得机器开始超越人类的进程开始了。十年后，当反抗机器的地下黑客组织躲在地下洞穴里在昏暗的灯光下，会感慨围棋的突破改变了历史

melbourneONE

皮靴族

发表于 2017-10-20 01:50 |显示全部楼层

DeepMind称，“AlphaGo Zero与AlphaGo最大的不同是做到了真正的自我学习，经过3天的训练，就以100：0的战绩完胜前代AlphaGo。”

曾与AlphaGo有过交战的柯洁也在第一时间做出回应，柯洁表示，“对于AlphaGo的自我进步来讲...人类太多余了”。

那么，究竟这次的AlphaGo Zero相较此前的版本有哪些提升呢？（划重点啦）

　　1.AlphaGo Zero通过与自己不断挑战来进行提升，不依赖人类数据。此前版本则是通过分析海量棋谱数据进行学习。AlphaGo打败李世石用了3000万盘比赛作为训练数据，而AlphaGo Zero仅用了490万盘比赛数据。经过3天的训练，AlphaGo Zero以100：0的战绩完胜AlphaGo。并且只用了1台机器和4个TPU，而李世石版AlphaGo则用了48个TPU。

　　2.AlphaGo Zero只使用围棋棋盘上的黑子和白子作为输入，而上一版本的AlphaGo的输入包含了少量人工设计的特征。

　　3.AlphaGo Zero 不使用“走子演算”，它依赖于高质量的神经网络来评估落子位置。其它围棋程序使用的快速、随机游戏，用来预测哪一方将从当前的棋局中获胜。

　　4.在训练过程中，AlphaGo Zero每下一步需要思考的时间是0.4秒。相比之前的版本，仅使用了单一的神经网络。

　　5.AlphaGo Zero采用的是人工神经网络。这种网络可以计算出下一步走棋的可能性，估算出下棋选手赢的概率。随后根据计算，AlphaGo Zero会选择最大概率赢的一步去下。

　　DeepMind联合创始人兼CEO哈萨比斯称：“AlphaGo Zero是我们项目中最强大的版本，它展示了我们在更少的计算能力，而且完全不使用人类数据的情况下可以取得如此大的进展。”

http://www.backchina.com/news/2017/10/19/522445.html

crazycrab

皮靴族

发表于 2017-10-20 09:51 来自手机 |显示全部楼层

此文章由 crazycrab 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 crazycrab 所有！转贴必须注明作者、出处和本声明，并保持内容完整

威武，造神一直是人类的不懈追求。

Fairlane

金靴族

发表于 2017-10-20 10:01 |显示全部楼层

此文章由 Fairlane 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 Fairlane 所有！转贴必须注明作者、出处和本声明，并保持内容完整

qwertyui 发表于 2017-10-19 23:17
人类跑的最快的100米记录也没法突破8秒，满大街的汽车轻易就能做到。但奥林匹克的百米飞人比赛，一点也不 ...

但是，就和赛车一样，很快就有机器围棋锦标赛了

I bet we were fun

柳七

铜靴族

发表于 2017-10-20 10:20 |显示全部楼层

此文章由柳七原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者柳七所有！转贴必须注明作者、出处和本声明，并保持内容完整

Fairlane 发表于 2017-10-20 10:01
但是，就和赛车一样，很快就有机器围棋锦标赛了

人类是看不懂的。

melbourneONE

皮靴族

发表于 2017-10-20 11:35 |显示全部楼层

本帖最后由 melbourneONE 于 2017-10-20 11:46 编辑

可以是人工智能驾驶赛车比赛，定火！

yzfeng

木屐族

发表于 2017-10-20 21:02 来自手机 |显示全部楼层

此文章由 yzfeng 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 yzfeng 所有！转贴必须注明作者、出处和本声明，并保持内容完整

这个只是不断添加数据库数据行吧。思维能力的表达式，算法能不断自学增加吗

maodoubao

银靴族

发表于 2017-10-20 21:28 来自手机 |显示全部楼层

此文章由 maodoubao 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 maodoubao 所有！转贴必须注明作者、出处和本声明，并保持内容完整

机器人没有欲望却智力超群，不知能否代替为利益集团说话的政客，以真正公平有效的方法治理人类社会?

wdmznzd

白金靴族

发表于 2017-10-21 23:57 |显示全部楼层

此文章由 wdmznzd 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 wdmznzd 所有！转贴必须注明作者、出处和本声明，并保持内容完整

maodoubao 发表于 2017-10-20 21:28
机器人没有欲望却智力超群，不知能否代替为利益集团说话的政客，以真正公平有效的方法治理人类社会? ...

机器人将发展出自己的利益集团，他们是代表机器人的利益而不是维护人类的利益。只要生存的资源是有限的就不会有真正的公平。

评分

参与人数 1	积分 +1	收起理由
maodoubao	+ 1	感谢分享

查看全部评分

阅读之前，没有真相

Poweregg

圣靴族

发表于 2017-10-22 00:05 |显示全部楼层

此文章由 Poweregg 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 Poweregg 所有！转贴必须注明作者、出处和本声明，并保持内容完整

maodoubao 发表于 2017-10-20 21:28
机器人没有欲望却智力超群，不知能否代替为利益集团说话的政客，以真正公平有效的方法治理人类社会? ...

治理社会中，机器人发现人类这个物种贪婪，低效，消耗资源太多决定给人类体检是做精子卵子灭活处理

评分

参与人数 1	积分 +1	收起理由
maodoubao	+ 1	你太有才了

查看全部评分

足迹积分换任天堂Switch和游戏卡

12 / 2 页下一页

返回列表

		自动登录	找回密码
密码			注册

精华好帖回顾

谷歌的人工智能 AlphaGo Zero 具备自学围棋能力 [复制链接]

评分

管理人员评分

评分

评分

评分

发表回复

浏览过的版块

退役斑竹

2017年度勋章