Category Archives: Science

AlphaGo 简单介绍

读了下2016年的 Mastering the game of Go with deep neural networks and tree search,本来想写个读后感,不过发现 Google DeepMind’s AlphaGo: How it works 其实已经做了相当全面的介绍了。 围棋在博弈论上其实算是个非常简单的问题,非胜即负的零和游戏,同时也没有任何随机因素,和简单的井字棋游戏没什么大差。如果棋手是全知全能的话,5a 将只显示0或100,每步只需要在标明100的任何一个位置落子即可(下一步,在对手看来所有位置都将显示0)。 AlphaGo 首先利用的是已有的围棋知识库。如果对于一个棋局,已经有围棋大师如此落子的话,那这至少是个不错的选择。于是由 KSG Go 的数据训练了一个高准确率(57%)的策略网络,用来模拟大师的围棋策略;同时也训练了一个更快速(但较低准确率 24%)的策略网络,用来实时快速推演整个棋局。 策略网络的输出是一个落子的概率分布。因此可以将两个策略网络重复相互对弈,每次会得到有所不同的棋局进程。 接下来 AlphaGo 令高准确率的策略网络相互对弈,用 reinforcement learning 的方法继续优化策略网络。这时,优化的策略网络已经能够大概率战胜已有的围棋程序了。 最后,AlphaGo 利用策略网络对弈的棋局来训练价值网络。简单来说,对于任何棋局,有一个最优的价值(如前所述的0或100,但这需要不现实的完整树状搜索),这个最优的价值可以用反复用策略网络对弈的结果来近似(如果策略网络从该棋局开始对弈100局,80胜20败的话,可以近似认为其价值为80),然后这个近似的价值可以用价值网络的输出来近似。而显然价值网络在实时计算上优势明显。 在这些非实时的策略网络和价值网络训练完成之后,在和人类对弈中,AlphaGo 用基于 Monte … Continue reading

Posted in Computer and Internet, Machine Learning, Science | Tagged , | Leave a comment

A Short History of Nearly Everything

一本相当有趣的科普书。 本书非常大的特色是关于某个发现,Bryson 一定会告诉你是谁,在何时,以及如何做出这个发现的。如果 Bryson 曾经访谈过相关人士那自然也不妨碍他加上一段第一手谈话记录。而对于古人来说也可以来一段轶事,比如 Halley(就是哈雷彗星的那个哈雷)是如何花言巧语说服 Newton 写出 Principia Mathematica 的故事,或者 Darwin 对蚯蚓的专著卖得远比 On the Origin of Species 要好。 发人深思的一点是我们几乎无法理解在人类或是其它现存生物的历史中,究竟有多少归结于纯粹的偶然因素:太阳系的构造,地球的位置,月球的大小,生命的起源,大气的历史,植物的作用,地核与磁场,火山活动,陨石,冰川期,等等。我们能做的只有尽可能珍惜自己和其它与人类共存的物种了。

Posted in Book, Science | Tagged | Leave a comment

The Third Chimpanzee

Jared Diamond 第一本通俗著作,也许也是涉及领域最为宽泛的。 第一部分主要介绍人类和黑猩猩的微小基因差异,人类从古猿到智人的演化过程。作者认为语言是人类文明的关键因素。 第二部分关于性择演化和衰老的演化因素。 第三部分关于人类文明的进步,涉及语言和艺术的演化,农业的推广,信息理论与缺陷原理。 第四部分关于先进文明对落后文明的征服。这部分内容在作者后续的著作 Guns, Germs and Steel 中有更详尽的阐述。 第五部分关于人类对自然的破坏,以及枯竭的环境对人类社会的反作用。 需要注意的是本书中作者的主观论断比较明显,某些论据可能略失偏颇。 PS:接下去继续普利策非小说类别的选择性遍历吧。Ernest Becker 的 The Denial of Death 看起来值得一读。

Posted in Book, Science | Tagged , | Leave a comment

The Making of the Atomic Bomb

1988年的普利策非小说类奖。 主要叙述线索是19世纪末和20世纪初的核物理发展,第二次世界战争,以及美国曼哈顿计划研制核弹的进程,和最终广岛和长崎的核弹轰炸。 一条主要的支线是随着战争的扩大,无差别的战略轰炸也在逐步升级,平民的死伤则更加惨重。1943年7月的汉堡大轰炸造成4万平民丧生,1945年3月的东京大轰炸的死亡人数达到10万,最后8月广岛和长崎的核弹轰炸导致10万至20万平民丧生。 另一条重要的支线是了解曼哈顿计划的科学家对战后政治秩序和核威慑的先见和担忧。Bohr 和 Szilard 是其中的代表。Bohr 曾先后会晤 Churchill 和 Roosevelt 以期在美苏两国形成核军备竞赛之前通过开放和可核查的机制来形成一定程度的相互信任(Bohr的 Open Letter to the United Nations)。对于科学家来说,核弹所需要的理论基础早已是公开知识了,最后的关键因素只是工业技术和国家级别的大规模投资。而对于政治家和军人来说,严格的保密机制和数年程度的军事与政治优势才是重点。

Posted in Book, Science | Tagged | Leave a comment

Deep learning in H2O

I did not find an easy-to-use native deep neural network package on R. IMO darch is actually a good one. But it still takes some effort to pre-process data, tune the parameters, etc. On the other hand, H2O platform is very easy … Continue reading

Posted in Computer and Internet, Machine Learning, Science | Tagged | Leave a comment

caret package for R

R is one of the best tool to do data science (for prototype, and for data fit in memory). And caret is one of the best package to create common machine learning models in R. As described in packages introduction, caret … Continue reading

Posted in Computer and Internet, Machine Learning, Science | Tagged | 1 Comment

Objective metrics on a subject issue

This is the first time I take a non-technical online course — Conditions of War and Peace by Kiichi Fujiwara of Tokyo University. It is always intriguing to see what a Japanese lecturer has to say on the topic of war … Continue reading

Posted in Science | Leave a comment