Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

雷锋网(公众号:雷锋网)按:元宵节也过去了,是该挥手告别鸡年的春节了。继AlphaGo在围棋界横扫人类顶尖高手后,在德州扑克的战场上,一个叫Libratus的AI又以很大的优势赢得了与职业玩家的比赛, 这个AI又有什么来头,它究竟用的是何种算法?

近期,赵雷和他的民谣红遍了各种社交媒体,这本来和科技没什么关系,然而一个年轻人写了个爬虫,对民谣歌曲进行了有模有样的数据分析……

更多精彩解读,请点击文章链接阅读全文。


1、Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法?| 解析(点我阅读全文

最近听说我的母校卡耐基梅隆大学德州扑克的AI Libratus以很大的优势赢得了与职业玩家的比赛,非常兴奋。

当然有AlphaGo的先例,这个对广大吃瓜群众的冲击可能没有那么大。但我个人觉得非对称信息博弈的实用价值更大些。因为非对称信息博弈的应用范围非常广泛,涵括我们每天遇到的所有决策,上至国家战略,下至日常琐事,全都可以以同样的方法建模。

这次的游戏是Head-up unlimited Texas Hold'em,直译过来是两人无限注德州扑克。CMU和Alberta用的方法,也和之前的类似,都是Counterfactual regret minimization (CFR)的变种……

【作者】田渊栋,卡耐基梅隆大学机器人系博士学位、上海交通大学硕士学位和学士学位,前谷歌无人车项目组成员,现任Facebook人工智能组研究员,主要负责Facebook的智能围棋项目Dark Forest。

Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

2、我分析了42万字歌词,就为了搞清楚民谣歌手们在唱些什么(点我阅读全文

听了这么多年民谣,我有一种感觉,就是很多歌都似曾相识,但是仔细一想,又哪一首都想不起来,为了搞清楚这群流浪在祖国大地的现代游吟诗人们都在唱些什么,我做了一些数据分析的工作。

我首先写了一个爬虫,它可以根据歌手或乐队的名字来自动抓取这个歌手的所有歌,为了保证平衡,我最多只抓取前50首歌,老实说,大多数歌手被人熟知的歌并不会超过这个数字。

在我的统计中,出现最多的几个意象是:再见,姑娘,夜空,孤独,快乐。

【作者】王登科

Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

3、横评 | 业内专家:工业机器人四大家族的技术哪家强?(点我阅读全文

在工业机器人领域,ABB,发那科,库卡,安川常被人并称“四大家族”,那么它们的技术到底孰优孰劣?

要评判这么多家产品之间的技术差距,并给出具有说服力的结论,至少需要两个前提:

  • 对几家机器人的典型产品都深入使用和分析过,这需要大量资源支持和长时间的实践;

  • 需要人员自身具备非常深厚的技术积累,才能给出基本正确的分析结果,这样的人员在国内非常稀有。

我只用过其中3家的产品,较为深入的分析过其中2家的技术,因此结合以上两点结论,本文主要作用是为想了解工业机器人四大厂家基本信息的小伙伴提供一些参考。

【作者】韩峰涛,珞石科技(工业机器人供应商)产品总监。

Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

4、汽车工程师:BMS若未准确定义SOC又何来高精度

本文为系列文章:汽车工程师:BMS若未准确定义SOC又何来高精度?(上)

                         汽车工程师:BMS若未准确定义SOC又何来高精度?(下)

SOC(state of charge)算法一直是BMS开发应用的关键技术之一。因此讨论SOC算法的技术文章很常见,企业对SOC估算的高精度也往往是宣传的亮点。而关于SOC详尽的解释和定义却不常被考虑,从而导致了SOC算法结果的参考价值大打折扣。

显而易见若SOC的概念都是模糊的,又何来精确的SOC呢?因此作者希望通过本文分析几种维度下的SOC值,以及这些SOC值的作用。

【作者】叶磊Ray,演技派工程师。

Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

5、Airbnb技术大牛桑立锋解析:数据加密都有哪些套路?(点我阅读全文

数据加密是一个古老的问题,但又是一个无法做到完美的问题,尤其在一个复杂的大型系统中需要考虑方方面面的问题,包括 security, availability, usability, consistentcy, performance,extensibility 等等。

除了那些完全不做的,大部分公司都会根据自身的需求、环境、资源以及工程师的能力等,设计和开发适合公司实际情况的解决方案。有做得好的,也有坦诚做得不好的,还有自己认为做得好的但其实经不起真正考验的。

【作者】桑立锋,Airbnb的数据加密大牛。

Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

6、阿里云道哥自述:重回阿里的29个月(点我阅读全文

回到阿里已经29个月了,算上此前在阿里的七年时间,已经为这家公司服役了将近十年。这十年的时光,加上2012年到2014年期间参与到安全宝创业的那两年,组成了迄今为止我的职业生涯。这些年经历的所有事情,吃过的所有苦头,所有的酸甜苦辣,都像刻刀一样雕琢了我的生命。过去的2016年,对我来说是非常难忘的一年,也是非常重要的一年。

这29个月里的每一天,对我来说,都过得非常的充实。我的性格变得比以往更加的锋利,正如我的网名「刺」一样,我比以往任何时候都更加带刺,也自然会伤到很多人。会不会得罪人永远不是我优先考虑的,因为根本没有时间去顾及别人是不是开心,时间紧迫,要做的事情却很多、很难。我常自嘲在团队内部我就像一个暴君,也因此我需要感谢所有能忍受我脾气的同事。创业不是一将功成万骨枯,创业是一个团队的成功。我很高兴我在一个值得信赖的团队,共同奋斗,建设更安全的互联网。

【作者】吴翰清,阿里云首席安全研究员。

Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

7、冯·诺依曼辞世60周年纪念(点我阅读全文

今年的2月8日是冯·诺依曼逝世60周年的日子。他在数学、理论物理和逻辑领域贡献良多,也影响、改变了许多人,比如图灵、纳什。今天我们热烈讨论的AlphaGo、人工智能,与冯·诺依曼同样分不开。

冯·诺依曼留下了无数的继承者。他的助手伯克斯(Burks)培养了第一位计算机科学的博士霍兰德(Holland),冯·诺依曼在细胞自动机和DNA的工作间接影响到霍兰德,他的博士论文发明了遗传算法,霍兰德的大弟子巴托尔(Barto)和巴托尔的大弟子萨顿(Sutton)发明了强化学习,强化学习被用在谷歌的AlphaGo击败了几乎所有围棋超级大师、被用在卡内基梅隆大学的Libratu赢得了德州扑克大赛。

冯·诺依曼被引用最多的话是:“我们应该预测所有稳定的过程,控制不稳定的过程。”(All stable processes we shall predict. All unstable processes we shall control.)其实这并非是老冯的原话,而是弗里曼·戴森转述老冯1950年在普林斯顿的讲座的精神,那时他是多么自信啊。

【作者】尼克

Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

雷锋网特约稿件,未经授权禁止转载。详情见。


Facebook田渊栋:德州扑克上战胜人类的AI究竟用的是什么算法? | 本周专栏精选

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/69690.html

(0)
上一篇 2021年8月11日 14:45
下一篇 2021年8月11日

相关推荐

发表回复

登录后才能评论