第257章 天元GO论文发布(1/2)

2013年9月中旬,距离天元go在弈城平台掀起滔天巨浪已经过去了一个月。

当人们对那个神秘账号的讨论热度稍有回落,以为这又将成为围棋界一桩悬案之时,林星石以一种出人意料的方式,向全世界揭开了谜底。

一篇题为《基于深度强化学习的围棋ai系统设计与实现》的学术论文,悄然出现在了全球最大的预印本论文网站arxiv上。

论文的作者,署名仅有林星石一人。

这篇论文如同一颗投入平静湖面的深水炸弹,瞬间在人工智能和围棋两个领域,激起了远比之前柯洁对战时更加剧烈的涟漪。

论文用简洁而严谨的语言,详细阐述了天元go的技术架构和训练方法。它首次向世界展示了“策略网络(policywork)”和“价值网络(valuework)”这两个核心概念,并详细描述了如何通过深度卷积神经网络,让ai从零开始,通过自我对弈,学习并掌握围棋这项古老而复杂的智力游戏。

论文中,林星石公开了天元go的训练细节:在星火科技内部的服务器集群上,调用了超过两千个cpu核心和近三百块顶级gpu,进行了长达数百万盘的自我对弈。这种堪称奢侈的计算资源投入,让所有看到论文的研究者都为之咋舌。

“原来,天元go的背后,是这样一种颠覆性的算法。”

“将深度学习和强化学习如此完美地结合,简直是天才般的构想!”

“难怪它的棋路如此怪异,因为它学习的根本不是人类的棋谱,而是在自我进化中,找到了围棋的最优解。”

论文一经发布,迅速在人工智能和围棋界引起了剧烈的轰动。最初,只是一些顶尖的ai研究者和嗅觉敏锐的科技媒体注意到了它。但很快,这股风潮就席卷了整个学术圈。

多家国际顶级的学术期刊,在第一时间联系了林星石,希望能将这篇论文在其刊物上正式发表。世界各地的ai实验室,都开始组织研究员,对这篇论文进行逐字逐句的解读和分析。它几乎在一夜之间,就成为了深度学习领域最重要的研究成果之一,被无数后续的研究者引用和参考。

然而,林星石投下的“炸弹”,还远不止这一个。

就在论文发布的同一天,林星石通过星火科技的官方渠道宣布,在代码托管平台github上,正式开源天元go的核心代码。

并且,他选择了最为宽松的apache 2.0开源协议。

这意味着,任何个人或组织,都可以在遵循协议的前提下,免费地使用、修改、分发甚至商业化使用这套代码。

如果说发布论文是向学术界投下了一颗原子弹,那么开源代码,则无异于向全世界的开发者,送上了一份来自未来的厚礼。

消息一出,全球的开发者社区彻底沸腾了。

本章未完,点击下一页继续阅读。