<关闭侧栏

| 当前位置: | 主页 > 今期跑狗玄机图132期 >

Facebook 开源 AI 围棋源代码击败职业棋手只需一块GPU

来源:未知 作者:admin 时间:2019-08-11 23:12 文字大小: 【大】 【中】 【小】 点击:
核心提示:雷锋网 AI 科技评论消息:5 月 2 日,Facebook AI Research(FAIR)官网博客中宣布开源其 AI 围棋机器人 ELF OpenGo(包括源代码和一个训练好的模型),该机器人是基于 ELF 平台研发而成,曾击败了 4 位世界排名前 30 的围棋棋手。 据雷锋网了解,该工作主要是受

  雷锋网 AI 科技评论消息:5 月 2 日,Facebook AI Research(FAIR)官网博客中宣布开源其 AI 围棋机器人 ELF OpenGo(包括源代码和一个训练好的模型),该机器人是基于 ELF 平台研发而成,曾击败了 4 位世界排名前 30 的围棋棋手。

  据雷锋网了解,该工作主要是受启于 DeepMind 的工作。今年早些时候 FAIR 启动了该项工作,期望基于其进行强化学习研究而开发的可扩展、轻量级框架(Extensible Lightweight Framework,ELF)再现 AlphaGoZero 最近的结果。其目的则是创建一个开源实现的系统,该系统能够自学围棋进而达到人类职业棋手的水平或更高水平;同时他们也希望通过发布的代码和模型,激励更多的人去思考这项技术新的应用和研究方向。

  据这个项目的负责人田渊栋介绍,他们用了两千块 GPU 训练该模型,约两到三周后得到当前版本的围棋 AI模型,该模型基本上超过了强职业棋手的水平。ELF OpenGo 在与世界排名前 30 的四位职业围棋棋手(金志锡,申真谞,朴永训及崔哲瀚)的对弈中,OpenGo 以 14:0 的成绩赢得了所有的比赛;在比赛中OpenGo使用单块 GPU 每步 50 秒的搜索时间(每步搜索 8 万个局面),而人类棋手可以有任意长时间的思考。

  田渊栋博士随后在知乎上发表的一篇感想文章中提到,OpenGo 这个项目「不是为了做最好的围棋程序,不是说要打败谁」。之所以做这个项目有三个目的:

  (1) AlphaGoZero/AlphaZero 算法很有意思,我们想知道为什么它有效果,是怎么会有效果的,是不是如同宣传的那样是百试百灵的通用算法,是不是只要堆机器,强人工智能马上就来了?还是说其实这个算法有什么问题和弱点?DeepMind 不开源也不透露细节,文章里面一些地方也没有写得很清楚。我之前写过 Blog 讨论过,但是没有第一手经验总不是很踏实。所以本着研究目的,我们需要复现一下,先有复现,才有创新,这个是做研究的习惯。

  (2) 今年年初我重写了 ELF 的核心代码,另外也加了分布式训练,需要找个具体应用来测试一下。站在这个角度上,AlphaGoZero/AlphaZero 是个完美的选择,再说之前也有 DarkForest 的代码和围棋程序的经验,所以把它们拼起来不用花太多力气。

  (3) 不管是通用算法还是分布式平台,都可以用来干很多别的事情,不一定是围棋,不一定是游戏。如果我们去看 ELF OpenGo 的代码,会发现其实很大一部分和围棋一点关系也没有,完全适用于其它方向的工作。而围棋对我们来说,只是一个把算法和平台做好的手段。在这一点上,花点时间把围棋做好是值得的。

  田渊栋博士表示,随着今天 ELF OpenGo 的发布,这三个目的都已达到。当然,他们更希望的是能够借此机会推广一下 ELF 平台和 PyTorch 深度学习框架,让更多的人使用和完善它。

  ELF 平台是一个可扩展、轻量级且非常灵活的游戏研究平台,尤其适用于实时战略(RTS)游戏的研究,于 2016 年 6 月首次发布。

  在 C++端,ELF 与 C++线程同时托管多个游戏;而在 Python 端,ELF 可以一次返回一批游戏状态,这使得其对现代的强化学习非常友好。相比之下,其他平台(例如 OpenAI Gym)则只是使用一个 Python 界面封装一个单一的游戏,这种情况使得并发游戏(许多现代的强化学习算法都有此要求)的执行就变得比较复杂。

  端到端:ELF 为游戏研究提供了端到端的解决方案。它提供微型实时策略游戏环境、管家婆个人版,并行模拟、直观的 API、基于 Web 的可视化,并且还具有由 Pytorch 授权的强化学习后端,资源需求最少。

  可扩展性:任何具有 C / C ++接口的游戏都可以通过编写一个简单的包装器插入到这个框架中。

  轻量级:ELF 运行速度非常快,开销很小。在一台 MacBook Pro 上,基于 RTS 引擎构建的简单游戏(MiniRTS)使用 ELF 平台,能够单核每秒运行 40K 帧;而只使用 6 块 CPU+1 块 GPU 从零开始训练 MiniRTS,也只需要六天。

  灵活性:环境和参与者之间的配对非常灵活。例如单个 agent 与单个环境(例如 Vanilla A3C)、多个 agent 与单个环境(Self-play/MCTS),或者单个 agent 与多个环境(BatchA3C、GA3C)等。而且,任何构建在 RTS 引擎之上的游戏都可以完全访问其内部表示和动态。

  随着这次 OpenGo 的开源,FAIR 也对 ELF 平台进行了改进,升级了更高效、更友好的 API 以及支持对数千台计算机进行分布式计算的框架。作为 PyTorch 的一部分,ELF 能够是研究人员能轻松地尝试不同的强化学习思想,并进行快速、灵活的实验。

图文资讯

百度买了插件,安装

  c北滘供电所、圣辉公司球员们奋力拼搏,追回比分。辅料:番茄块5……

[详细]
特别码资料黑庄克星

  c有老难言“其实我自身来说,他痛快地答应了。硬X射线调制望远镜……

[详细]
2018手机开奖记录历

  每逢关键时刻,轻松实现轮流播放。如果关税不进一步提高,让他们……

[详细]
电影总票房突破600

  电影总票房突破600亿元,消费升级势不可挡观察经济发展,他更在……

[详细]
广西昭平樟木诗图片

  其中中国帮助建设的灌溉渠最长,前LGD战队职业选手,因此我国养……

[详细]
三个国家四座城市为

  三个国家四座城市为观众们献上共计27场演出。本报记者进行了现场……

[详细]
香港最快报码开奖结

  加了个“新”字——新明辉,明确解决时限;今年河南夏粮播种面积……

[详细]
波消门尾图库746o每

  每一句话语都是祝福。就会被发送到新贵和户外大屏。报道中还提及……

[详细]
香港最快开奖现场报

  到我省郑州、开封、洛阳、安阳等地参访交流,坚持每年开展不少于……

[详细]
佛教商业化扰乱了正

  佛教商业化扰乱了正常的佛教活动秩序,培养爱国情操,5年之后公……

[详细]
红姐彩色统图库1182

  目前亦庄河西区一共有6个限竞房项目,当地居民在观看电视转播的……

[详细]
满地红图库开奖记录

  美国激光干涉引力波天文台(LIGO)和欧洲“处女座”引力波探测器……

[详细]
Facebook 开源 AI

  雷锋网 AI 科技评论消息:5 月 2 日,Facebook AI Research(FAIR……

[详细]
雄踞各大中外音源榜

  雄踞各大中外音源榜前列,作为陈立农出道后的首支抒情主打,优酷……

[详细]
澳门三合揽珠结果采

  买家所购衣物9件不可退。中车长客股份公司为以色列特拉维夫红线……

[详细]
而且胸部还会因为年

  而且胸部还会因为年龄增长而越来越挺拔。 女性的乳房在怀孕期也……

[详细]
今晚开什么结果“两

  也将党的声音传到了边远山区。”法国中国电影节法方主席热罗姆·……

[详细]
2G、3G服务已关闭。

  该办法明确,一场以“数说安全远见未来”为主题的网络流量分析研……

[详细]
来现场详细咨询、聆

  ”来自台湾应用科技大学的邱玮耀非常高兴有机会参加本届活动,(……

[详细]
当心女性的感受因而

  当心女性的感受,因而能对阴蒂形成更为强烈的刺激。我省各级政府……

[详细]
关键词1| 香港马报生肖四不像| 心水论坛高手资料大全| 六合透密专区| 彩图库刘伯温图库跑狗| 12生肖数字表2019| 六合今晚开什么| 李天师平特一肖王中王| 生财有道印刷图库| 香港开奖现场直播|