板块导航【各分论坛一览表】

《班组天地》投稿通道	企业党政	班组	社区服务	平台明星专页	互动企业分论坛	班组安全建设	科技时代	问题反馈
企业事评	职教	宣传	企业图书馆	班组长联谊会	保健、养生	工会、半边天、共青团	8小时之外	订阅杂志

企业党政
政工交流
产业经济
职业道德
观点思路
企业新闻
领导力提升
绩效管理
员工管理
管理咨询
党建思路
老总话题
企业文化
将帅风采

班组
问题讨论区
管理案例区
我谈治班之策
新时代农民工
师徒论坛
班组团队
蓝领精英
兵头将尾
经验交流
实话实说
创新成果
能工巧匠
小家建设
事故教训
工作生产
凡人风采
国外班组
班组之声
班组MV快乐展示

社区服务
论坛管理
版主交流
论坛回收站
“中企互动”家内新闻
疑难解答
电脑运用小窍门
平台宠物与股票市场
企业市场
跳蚤市场

平台明星专页
王克礼专页
滕富生专页
孙建文专页
杨晓莹专页
老哥专页
庄柏新专页
周长好专页
王新平专页
张喜亮专页
乔东专页
安红昌专页
王昌峰专页
陈新寰专页
陈计存专页

互动企业分论坛
华北制药集团
宁波港集团有限公司
沧州供电调度
松藻煤电公司
北京燕山石化公司
中航工业北京航空制造工程研究所
深圳企业员工论坛
冀中能源邢台矿

班组安全建设
班组工作宣传
班组信息交流
安全文化展示
隐患事故调查
班组长培训
班组专栏
专家工作教室
准能班组
社区

企业事评
企业事评
企业热点

8小时之外
员工收藏
职工天下游
诗联墨苑
原创天地
娱乐爱好
生活浪花
员工鹊桥
恋爱·婚姻·家庭
人生感悟
家庭教育
精品桌布
企业微视

职教
名企思想
职场内外
求职就业
培训论坛
员工夜校
练兵比武
视频播报
英语加油站
技师人才库
职场提醒

宣传
活动策划
编采互动
摄影乐园
《班组天地》
互动明星
国际新闻
企业文案
企业职工创新平台
企业员工评“媒”广场
企业报之家
品牌、产品、活动宣传推广

企业图书馆
漫画天地
书斋寻悟
图书资讯
长篇连载
电子图书下载

班组长联谊会
最新动态
活动内容
会员交流

保健、养生
生活常识
健康养生
主流健身

工会、半边天、共青团
企业夕阳红
工会信息
工会工作交流
工会主席
维权阵地
民主管理
劳动竞赛
半边天
团组织活动
劳动保护

科技时代
创新发明
科学技术
科学奥秘
生活科技

上一主题下一主题

最近图片

“三三一”管理法安全运行突破8000天

最新帖子

最热帖子

最新回复

主题推荐

今日发帖排行

主题 : 今日Nature: 人工智能从0到1, 无师自通完爆阿法狗100-0

使用道具┊复制链接┊浏览器收藏┊打印

登高的温石离线

静守己心，看淡浮华。

级别: 钻石会员

UID: 4610
精华: 89
发帖: 124450
财富: 7412413 鼎币
威望: 168 点
贡献值: 162 点
会员币: 10 个
好评度: 2967 点
在线时间: 11784(时)
注册时间: 2008-07-03
最后登录: 2021-04-19

楼主发表于: 2017-10-19

倒序阅读 ┊ 只看楼主 ┊ 小中大

今日Nature: 人工智能从0到1, 无师自通完爆阿法狗100-0

今日Nature: 人工智能从0到1, 无师自通完爆阿法狗100-0

去年，有个小孩读遍人世所有的棋谱，辛勤打谱，苦思冥想，棋艺精进，4-1打败世界冠军李世石，从此人间无敌手。他的名字叫阿法狗。

今年，他的弟弟只靠一副棋盘和黑白两子，没看过一个棋谱，也没有一个人指点，从零开始，自娱自乐，自己参悟，100-0打败哥哥阿法狗。他的名字叫阿法元。

DeepMind这项伟大的突破，今天以Mastering the game of Go without human knowledge为题，发表于Nature，引起轰动。知社特邀国内外几位人工智能专家，给予深度解析和点评。文末有DeepMind David Silver博士专访视频。特别致谢Nature和DeepMind提供讯息和资料授权。

Nature今天上线的这篇重磅论文，详细介绍了谷歌DeepMind团队最新的研究成果。人工智能的一项重要目标，是在没有任何先验知识的前提下，通过完全的自学，在极具挑战的领域，达到超人的境地。去年，阿法狗（AlphaGo）代表人工智能在围棋领域首次战胜了人类的世界冠军，但其棋艺的精进，是建立在计算机通过海量的历史棋谱学习参悟人类棋艺的基础之上，进而自我训练，实现超越。

可是今天，我们发现，人类其实把阿法狗教坏了！新一代的阿法元(AlphaGo Zero), 完全从零开始，不需要任何历史棋谱的指引，更不需要参考人类任何的先验知识，完全靠自己一个人强化学习（reinforcement learning）和参悟,  棋艺增长远超阿法狗，百战百胜，击溃阿法狗100-0。

达到这样一个水准，阿法元只需要在4个TPU上，花三天时间，自己左右互搏490万棋局。而它的哥哥阿法狗，需要在48个TPU上，花几个月的时间，学习三千万棋局，才打败人类。

这篇论文的第一和通讯作者是DeepMind的David Silver博士,  阿法狗项目负责人。他介绍说阿法元远比阿法狗强大，因为它不再被人类认知所局限，而能够发现新知识，发展新策略：

This technique is more powerful than previous versions of AlphaGo because it is no longer constrained by the limits of human knowledge. Instead, it is able to learn tabula rasa  from the strongest player in the world: AlphaGo itself. AlphaGo Zero also discovered new knowledge, developing unconventional strategies and creative new moves that echoed and surpassed the novel techniques it played in the games against Lee Sedol and Ke Jie.

DeepMind联合创始人和CEO则说这一新技术能够用于解决诸如蛋白质折叠和新材料开发这样的重要问题：

AlphaGo Zero is now the strongest version of our program and shows how much progress we can make even with less computing power and zero use of human data. Ultimately we want to harness algorithmic breakthroughs like this to help solve all sorts of pressing real world problems like protein folding or designing new materials.

美国的两位棋手在Nature对阿法元的棋局做了点评：它的开局和收官和专业棋手的下法并无区别，人类几千年的智慧结晶，看起来并非全错。但是中盘看起来则非常诡异：

the AI’s open¬ing choices and end-game methods have converged on ours — seeing it arrive at our sequences from first principles suggests that we haven’t been on entirely the wrong track. By contrast, some of its middle-game judgements are truly mysterious.

为更深入了解阿法元的技术细节，知社采访了美国杜克大学人工智能专家陈怡然教授。他向知社介绍说：

DeepMind最新推出的AlphaGo Zero降低了训练复杂度，摆脱了对人类标注样本(人类历史棋局)的依赖，让深度学习用于复杂决策更加方便可行。我个人觉得最有趣的是证明了人类经验由于样本空间大小的限制，往往都收敛于局部最优而不自知（或无法发现），而机器学习可以突破这个限制。之前大家隐隐约约觉得应该如此，而现在是铁的量化事实摆在面前！

他进一步解释道：

这篇论文数据显示学习人类选手的下法虽然能在训练之初获得较好的棋力，但在训练后期所能达到的棋力却只能与原版的AlphaGo相近，而不学习人类下法的AlphaGo Zero最终却能表现得更好。这或许说明人类的下棋数据将算法导向了局部最优(local optima)，而实际更优或者最优的下法与人类的下法存在一些本质的不同，人类实际’误导’了AlphaGo。有趣的是如果AlphaGo Zero放弃学习人类而使用完全随机的初始下法，训练过程也一直朝着收敛的方向进行，而没有产生难以收敛的现象。

阿法元是如何实现无师自通的呢？杜克大学博士研究生吴春鹏向知社介绍了技术细节：

之前战胜李世石的AlphaGo基本采用了传统增强学习技术再加上深度神经网络DNN完成搭建，而AlphaGo Zero吸取了最新成果做出了重大改进。

评价一下你浏览此帖子的感受

待到山花烂漫时，她在丛中笑~_~

回复引用

举报顶端

上一主题下一主题

中国企业员工互动论坛 » 科学技术

http://bbs.bztdxxl.com
访问内容超出本站范围，不能确定是否安全
继续访问	取消访问

“三三一”管理法安全运行突破8000天

“四微”管理法构建智慧型班组

以相互包容和尊重共建双赢

安徽铜陵有色冬瓜山铜矿：用科技力量

放风筝

今日Nature: 人工智能从0到1, 无师自通完爆阿法狗100-0

快速回复
	限 200 字节谢谢，别忘了来看看都是谁回帖哦？恢复数据进入高级模式加粗字体颜色背景颜色插入链接图片验证问题: 正确答案:许振超按"Ctrl+Enter"直接提交	上一个下一个

“三三一”管理法安全运行突破8000天

“四微”管理法构建智慧型班组

以相互包容和尊重共建双赢

安徽铜陵有色冬瓜山铜矿： 用科技力量

放风筝

今日Nature: 人工智能从0到1, 无师自通完爆阿法狗100-0

安徽铜陵有色冬瓜山铜矿：用科技力量