最新更新|新闻大全|热门排行|资讯大全

泉江巨甲网

当前位置:泉江巨甲网>观点>文章内容

第三代AI赌神诞生:可在六人桌德扑中胜过5个人类顶尖高手

字体大小:【 | |

2019-10-09 18:18:34

Pluribus也验证了一些牌桌上广为流传的智慧。例如“平跟”(limping)这种在翻牌之前,选择跟平大盲注而不加注的策略对绝大多数玩家而言都是欠佳的选择,只有“小盲注”玩家除外,因其已经在池中下了等同于一半大盲注的筹码。

中国证券网讯(记者 费天元)周二早盘,A股三大股指再现分化,上证指数失守3300点,创业板指则大涨接近1%。截至午间收盘,上证指数报3299.23点,下跌0.91%;深证成指报10835.49点,下跌0.55%;创业板指报1745.68点,上涨0.96%。

应急管理部火灾防治管理司副司长崔洪浩当天则介绍了森林火灾发生情况。据介绍,去年11月至今年2月底,全国共发生森林火灾354起,受害森林面积约731公顷,与近三年同期相比,火灾次数和受害森林面积均有所下降,总体上保持了平稳态势。但崔洪浩强调,今年春防形势依旧严峻,森林草原防灭火工作还存在不少风险隐患:“从总体看,今年春防特别是东北、内蒙古重点林区形势极其严峻。一是自然条件不利。据气象部门预测,今年春季东北、内蒙古等地温度偏高、降雨偏少、大风天数多,大小兴安岭、长白山林区部分区域可燃物载量每公顷达60吨,高出国际公认易发特大火灾临界值的两倍。二是火险隐患较多。清明节是祭祀用火高峰,‘五一’期间踏青旅游人员增多,叠加春耕生产等因素,火源管控难度大,违规野外用火多,容易引发森林草原火灾。”

此后还有一个小插曲。李开复曾经邀请桑德霍姆带着Libratus前来中国举办表演赛,并取了一个中文名“冷扑大师”。

2015年4月到5月,Claudico在匹兹堡的河流赌场轮流与包括当时世界排名第一的道格•波尔克(DougPolk)在内的四名人类顶尖高手过招。那次比赛历时13天,共计2万局牌。为降低运气成分,比赛使用的是镜像牌局的玩法,即在不同房间的两张牌桌上使用完全相同、但人机对调的两副牌。

统筹全局的“众”

据几名被抓回的囚犯说,他们逃跑是因为得不到应有的待遇及不堪忍受非法收费。

拼颜值拼实力都不如拼健康,不看对不起自己!

学会了纳什均衡的Libratus善于诈唬及不被诈唬。比如其中一盘,人类高中JasonLee起手牌是一对10(非梅花),前三张公共牌为K、9、4(其中有两张梅花),第四张和第五张都开出了非梅花牌。此时,AI突然压上所有筹码,Lee选择不跟。通过隔壁的镜像局,我们发现AI当时的起手牌确实是两张梅花,也就是,AI最后在赌同花失败的情况下,成功通过诈唬赢下了一局。而在镜像局中,AI早早为手上一对10下了重注,最后人类玩家同样选择弃牌。

无论是一个Pluribus对战5个顶级人类玩家,还是五个Pluribus混战一个顶级人类玩家,经过1万手牌后,它的表现都会明显优于人类。

第50届世界扑克系列赛(WSOP)的六人桌无限德扑即将在7月13日开赛,但AI偏偏选在这个节骨眼上踢馆。

新华社/美联

这些顶级高手包括拥有职业冠军头衔最多的达尔文•埃利亚斯(DarrenElias)、6次世界扑克系列赛冠军得主“耶稣”克里斯•弗格森(ChrisFerguson)和在职业生涯中赚了将近200万美元的麦克•加利亚诺(Michael"Gags"Gagliano)。

美国卡内基梅隆大学和Facebook公司7月12日在《科学》上发表论文称,他们联合开发的德扑人工智能Pluribus能在六人桌无限德扑中击败顶级人类玩家。

标签:小S

同样是匹兹堡的河流赌场,同样是无限注德扑,人机大战的剧情截然不同。Libratus从比赛第一天就全面压制,一路领先。最终,Libratus赢得的筹码数量达到惊人的176.6万美元。

世界各地都在重视中华文化史的今天,蔡英文当局逆历史潮流而动,把台湾高中语文科必读古文由20篇降为10至15篇,重点删减了历代名家经典之作,令人不能容忍的是将日本人写的文言文变成了必修。课纲加入日本人文章一旦在台湾学校施行,受到伤害的学生,不仅语文程度下降,还必将使台湾年轻世代对中华文化淡忘、疏远。难怪有台湾学者、专家批评,台湾年轻人没有“天然独”,只有“人工独”,而“人工独”最大推手非蔡英文莫属。

两会是民主政治的殿堂,也是凝聚共识的平台。两会能不能凝聚共识,能不能统筹兼顾各方面的利益,决定着能否把党的主张、人民的意愿转化为国家意志和共同行动。今年的政府工作报告令人振奋,让人们从中看到更加美好的未来。

特朗普在飞行期间发布推特称,他对此次与金正恩会面表示乐观,期待峰会取得成功。“我正在前往新加坡的途中,在那里我们将有机会为朝鲜和世界带来好的消息。这将是令人兴奋的一天。金正恩会非常努力地去实现一些以前从未实现的事情,为朝鲜创造和平和繁荣。我期待着与他见面,并相信这种难得一遇的机会将不会浪费!”

主要职责是,协调拟订移民政策并组织实施,负责出入境管理、口岸证件查验和边民往来管理,负责外国人停留居留和永久居留管理、难民管理、国籍管理,牵头协调非法入境、非法居留、非法就业外国人治理和非法移民遣返,负责中国公民因私出入国(境)服务管理,承担移民领域国际合作等。

 “西伯阴行善”之我见

东南大学“18条新政”从激励政策上引导老师注重成果转移转化工作,积极鼓励以增加知识价值为导向的收益分配政策。方案规定:以技术转让或者许可方式转移转化职务科技成果的,学校从技术转让或者许可所取得的净收益中提取70%的比例用于奖励技术团队和发明人,学校、学院(系)分别按20%、10%的比例对净收益进行分配。据了解, 70%的奖励额度在全国部属高校中排在前列。

王晨雨所说的“家庭体育活动”,是邯山区在全区中小学开创性增设的一项锻炼活动。就是要求每名学生每天参加体育锻炼,尽量由家长陪同完成,签字、打卡,再由专人跟踪问效和专业指导。旨在增强青少年体质,带动全民健身,增进亲子感情。

视频加载中...

初出茅庐的“平跟”

南昌市规定,民办培训教育机构应当根据所开设的培训项目及规模,配备结构合理、数量充足的专兼职教师队伍,且专职教师数不得少于教师总数的1/2,培训机构分支场所(含教学点)的专职教师不得少于3人。

IBM的“深蓝”经过了两次才战胜国际象棋传奇卡斯帕罗夫,德扑AI也在2年后实现了完美复仇。2017年1月,桑德霍姆和布朗带着一个名为Libratus的德扑程序卷土重来。

扑克对于AI来说为什么这么难?原来,扑克和跳棋、国际象棋和围棋有本质上的区别,是一种“不完美信息”的游戏,对手手中的牌面全程未知。在无限注局中,对手又可以任意下注。

著名深度学习专家吴恩达(AndrewNg)曾说道,“扑克是人工智能最难攻克的游戏之一。每一步没有所谓的最优解,人工智能要采取随机的策略,这样它诈唬的时候对方才会吃不准。”

在过去的20年里,我们见证了西洋双陆棋、跳棋、国际象棋和围棋等游戏在人工智能面前纷纷沦陷。人机大战往往成为AI发展史上的里程碑事件,例如卡斯帕罗夫与“深蓝”、李世石与“阿尔法狗”的巅峰对弈。不过,这些事件无一例外局限于机器和一人对决,而扑克在传统上是个多人游戏。

12月23日(周日)

据介绍,除了营收百强的入围门槛提升外,纳税百强的入围门槛由上年的6873万元提高到9966万元。进出口百强的入围门槛由上年的1662万美元提高到1725万美元。

“Pluribus”是一个拉丁语词汇,意为“众”,美国国徽上就印有“Epluribusunum”(合众为一)的字样。起这个名字,无疑彰显这是世界上首个在多人德扑中超越人类专业选手的AI。

飞絮难治,但杨树柳树一直是北京的绿化功臣。杨柳飞絮,一年里拢共也不过月余。在更长的时间里,它们扮演着不可或缺的角色,被称为城市的生态卫士也毫不为过,市民们真不能忘掉杨柳树为北京生态所作的贡献。专家介绍,一株胸径20厘米的杨树,一年可以吸收二氧化碳172公斤,释放氧气125公斤,滞尘16公斤;一株胸径20厘米的柳树,一年可吸收二氧化碳281公斤,释放氧气204公斤,滞尘36公斤。有人提议把杨柳雌株全部砍伐,更换其他树种。但这种做法,并不现实。十年树木,即便各个城市承受得起砍伐雌株的经济成本,可动辄几十万、上百万株正值壮年的大树突然消失后的生态损失,是不可估量的。5月5日,北京市园林绿化局政务微博发帖《杨柳飞絮又来了,一砍了之?》,解释不能“一砍了之”的理由,随即不少网友挺身为杨柳树站台,称绝不能对绿化功臣“卸磨杀驴”。

国融证券IPO对赌协议东窗事发后,监管层针对国融证券的处罚仍未完结,此次处罚则落在了相关负责人头上。

诈唬(bluff)是德州扑克的一种经典策略,它生动地体现了扑克游戏的“心理博弈”特征:即在手上的牌不够大的时候,依然虚张声势地加注,以吓退对手。为了达到好的诈唬效果,玩家的下注策略需要具备足够的随机性,以避免被对手摸清套路。总是诈唬的人和从不诈唬的人都不是一个好的德扑玩家。

5、注意防御冰雹天气伴随的雷电灾害。

纳什均衡虽然对双人游戏很有利,但并不适用于多人游戏。Pluribus需要一种更为统筹全局的玩法。它首先通过6个“自己”混战,计算出了一种“蓝图”策略,足以应对首轮的下注。接着,它建立起一个精细度非常高的游戏沙盘,分析所有可能的走法。为了节省算力,Pluribus不会推演到终盘,而只是推演接下去的数步。

其他用品和服务类同比上涨1.4%。其中金饰品价格上涨6.9%,旅馆住宿价格上涨1.9%,美容美发洗浴价格上涨3.2%。

从这个意义上来说,扑克是一种更接近真实人类社会的游戏,涉及到推理和欺骗。人工智能能学会诈唬吗?

卷土重来的“均衡”

更多内容请下载21财经APP

据介绍,本次华为所提出的意图驱动的智简网络解决方案,基于智慧、极简、超宽、安全、开放的理念,不仅能够准确识别用户意图,实现网络的端到端自动化配置,还可实时感知用户体验,进行预测性分析和主动优化。

他说:“那样的结果绝对可能发生。我们一直说,现在依托伦敦支持就业和金融活动的资本和流动性不能搬去纽约,这颇为重要。”

新华社广州11月14日电(记者孙少龙)第二届世界警察手枪射击比赛14日在广东佛山开赛。

本公司董事会及全体董事保证本公告内容不存在任何虚假记载、误导性陈述或者重大遗漏,并对其内容的真实性、准确性和完整性承担个别及连带责任。

Pluribus也变得更加狡猾。如果手上持有场上可能有的最好的牌,那加注是一个理性的选择。但如果每次都在持有好牌时才加注,就可能被对手识破规律。Pluribus会计算在对手来看,自己手上所有可能有的牌型,以及与之相对应的表现,最终选定一种均衡的方案。

从两人到多人,不仅只是量变,还对人工智能增加了许多根本性的挑战。Pluribus通过“行动抽象”和“信息抽象”等方式来解决这些挑战。在与5个“自己”博弈的过程中,Pluribus学会了六人局无限注德扑的玩法。

初出茅庐的德扑AI在赛程过半时,就已落后人类约46万个筹码,最终以大约73万个筹码的劣势铩羽而归。

4月1日起,增值税改革再发力,在将制造业等行业16%增值税税率降至13%、交通运输和建筑等行业10%增值税税率降至9%的基础上,进一步扩大进项税抵扣范围,将国内旅客运输服务纳入其中。也就是说,4月1日起,纳税人取得的火车票、飞机票、汽车票等客票也可以作为增值税进项税抵扣凭证了。那么,可以作为进项税抵扣凭证的有哪些?进项税额又如何计算?12366纳税服务热线近日就相关问题作了解答。

这看上去是游戏类AI的常规路径,但在非完美信息游戏中进行前瞻性推演格外具有挑战性。在每一个决策点的分叉上,AI要考虑每个对手的可能举动,也要分析自己可采取的应对,形成的决策树就会十分庞大。不过,桑德霍姆团队这次开发出了一种新算法,保证AI只需要计算每个对手接下去的5种可能性,就能在大战略上形成制衡。

根据日本气象厅的消息,东京时间14日21时32分,熊本县发生6.4级地震,震源深度约10千米。无海啸警报。日本20多个县有不同程度震感,当地超市货物散落满地。目前没有人员伤亡的消息。

最后,Pluribus也在计算效率上进行了改进。前一代Libratus用了1500万个核心小时计算出策略,并在1V1现场对决中占用了1400个CPU核数。这一代的Pluribus仅用12400个核心小时就形成蓝图策略,并在现场博弈时占用28个CPU核数。

美国卡内基梅隆大学计算机系教授托马斯•桑德霍姆(TuomasSandholm)已经钻研德扑程序16年。为了缔造AI赌神,他带着博士生诺姆•布朗(NoamBrown)先从1V1无限注德扑做起。他们开发的第一款德扑程序名为Claudico,在拉丁语中对应着“平跟”。

布朗认为,Pluribus的许多创新性的大法可能会在根本上改变这项游戏。例如,绝大多数人类玩家都不会在一个回合末平跟,却在下一回合开始时加注。传统上认为这是一种没有任何战略意义的举动。但是,Pluribus经常会这么做,也许这背后有值得深思的地方。

麦克•加利亚诺(Michael"Gags"Gagliano)说道:“与德扑AI对战,观察它做选择的策略是非常令人激动的。我看到它做了一些人类根本不会去做的下注举动。”

这个新名字对应着“均衡”,从纳什均衡的博弈模型里脱胎而来。桑德霍姆解释说:“在两名玩家的零和游戏中,如果双方都遵从纳什均衡,那就无人能以独自改变策略的方式来获益。在此类游戏中,以纳什均衡的方式思考是最安全的。AI会严格遵从纳什均衡,保证一个起码是平局的局面,若对手计算失误,均衡被打破,AI就能一击必杀。”

科学预报为生活添彩

埃利亚斯的感受是,德扑AI最大的优势在于混合运用多种策略,这也是人类高手想要达到的境界。然而,绝大数人都无法持续性地随机调整策略。

上一篇: 求是网评:进一步加强党对全面依法治国的领导 下一篇: (新华时评)“老饭桌”乾坤大