上一题下一题
跳转到
 
 
  世界如此多姿,发展如此迅速,窥一斑未必还能知全豹。但正如万花筒一样,每一个管窥都色彩斑斓。  
 
 
  知识通道 | 学习首页 | 教师首页 | PK首页 | 知识创造首页 | 企业首页 | 登录
 
本文对应知识领域
“人机大战”的评论精选:谷歌的电脑不能学经济学
作者:fangxia 申领版权
2017年04月26日 共有 599 次访问 【添加到收藏夹】 【我要附加题目
受欢迎度:

谷歌的电脑能学经济学吗?


我的回答是,不能!


在回答这个问题之前,我想先介绍西西河的牛人“陈经”的一个帖子《人工智能挑战围棋即将成功》。这是我看到过最有水平的分析。强烈建议去看原文:www.cchere.co m/article/4176770


我这里仅仅非常简略粗糙的说明一下他的观点:


AlphaGo和以前的人工智能(AI)相比有如下的相同点和三大改进。


相同点:


按照陈经的介绍,无论是AlphaGo还是以前的ZenAI都是“用蒙特卡洛树形搜索(MCTS)”下的。这种算法的特点是模拟棋局一直到下完算子判断胜负,模拟多次后看哪个选点的“获胜概率”最高。模拟时会利用“棋形”等经验减少选点,一直模拟下去直至终局。时间不够或者电脑计算能力不足,模拟的“局面数”就少,棋力就低。因此,才会有电脑在开局阶段依然和人类顶尖高手有差距,然后会随着棋局进展电脑会越来越强悍的情况出现。


主要改进有三:


1AlphaGo用一个深度神经网络(policy network,“策略网络”)减少搜索的选点,象人类高手一样,只考虑少数几个可能的选点。


2、他们还建立了另一个深度神经网络(value network,“值网络”),象人类高手一样,思考到某个局面就有了结论,不必象之前的蒙特卡洛模拟那样下到终局,极大地减小了搜索的深度。


3、让围棋人工智能自己和自己下,总结经验,自我不断提高!从Nature的文章看,DeepMindAlphaGo的开发小组)的绝招是,用50台电脑让AlphaGo不断和自己对弈,下了3000万盘棋!然后每盘棋选取一个局面(不多选,以避免同一盘棋中不同局面之间的相关性),根据这盘棋的最终结果判断局势优劣。这样获得了3000万个训练数据,用于训练生成“值网络”。


有了这三大改进,才使得AlphaGo能够以很高的胜率打败之前的各种算法,并且可以向人类顶尖高手发起挑战。


在陈经看来,这次电脑是真的有可能在围棋上战胜人类顶尖棋手的。不过这个是建立在顶尖棋手的心理波动上面。


根据新浪对第一局比赛的报道:“总体而言,电脑在局部战斗中不落下风甚至更强,但在布局和大局判断上不如人类顶级棋手。李世石今天输在中后盘的松懈上,如果后面李世石能够乘胜追击的话,胜负很有悬念。”。


陈经这个帖子发出的时间是2016年的一月底。现在看来,他的看法还是非常有参考价值的。


介绍这个帖子是为了让大家对连胜两局的AlphaGo有一定的了解,方便下面的讨论。


回到李师的问题,谷歌的电脑能学经济学吗?


在该帖的结尾中写道:“当然正如深度学习技术的发明人、DeepMind小组的Hassabis所言,人工智能真正的挑战是“泛化”的能力。人工智能在围棋上达到的超高能力,并不能转移到其它任务上去”。其对AlphaGo的判断可以说是最权威的。可见AlphaGo还远未到能够学习经济学的程度。


AlphaGo具备泛化的能力么?即,在围棋上达到的超高能力能不能转移到其他任务上?

答案显然是不能。要转移到其他任务上,理论上有两种可能。


其一,将某一经济学任务转换成围棋任务,用现有的训练出来的AlphaGo去得到最优解后再转换成该经济学任务的解。这个做法很明显行不通。


其二,采用AlphaGo类似的算法去针对经济学任务进行训练,以得到针对该任务的AlphaGo。这个办法则需要面对一个如何训练策略网络和值网络的问题。经济学任务中可不像围棋任务中有那么简单明了的规则和海量的高水准的棋谱来进行训练。即便AlphaGo此类算法发展的再强大,没有合适的训练集也是白搭。


所以,我的回答是:不能!





 

相关新闻

为什么英超联赛“差劲”却商业价值最高?
与张五常教授就中国未来经济增长潜力的一席谈——维持8%的高速增长是不可能的吗?
我在《南方都市报》发表的文章:通缩下的货币政策选择
解读张五常所定义的“非均衡”
驳柴静的“雾霾调查”(之二):“先污染后治理”的经济解释,勿要神化“环保”
驳柴静的“雾霾调查”(之一):反对环保部门强力治理污染的其实是……民众!
一道作业题:柴静的“雾霾调查”将雾霾治理不力的成因归咎于石油企业的垄断是对的吗?
再论“套套逻辑”与“特殊理论”
“使用价值”与“效用”的区别——兼谈“奥克姆法则”
优秀学生论文展示:复印机里的经济学

您可能对这些感兴趣  

为什么英超联赛“差劲”却商业价值最高?
与张五常教授就中国未来经济增长潜力的一席谈——维持8%的高速增长是不可能的吗?
我在《南方都市报》发表的文章:通缩下的货币政策选择
解读张五常所定义的“非均衡”
驳柴静的“雾霾调查”(之二):“先污染后治理”的经济解释,勿要神化“环保”
驳柴静的“雾霾调查”(之一):反对环保部门强力治理污染的其实是……民众!
一道作业题:柴静的“雾霾调查”将雾霾治理不力的成因归咎于石油企业的垄断是对的吗?
再论“套套逻辑”与“特殊理论”
“使用价值”与“效用”的区别——兼谈“奥克姆法则”
优秀学生论文展示:复印机里的经济学

题目筛选器
日期:
类型:
状态:
得分: <=
分类:
作者:
职业:
关键字:
搜索

 
 
 
  焦点事件
 
  知识体系
 
  职业列表
 
 
  最热文章
 
 
  最多引用文章
 
 
  最新文章
 
 
 
 
网站介绍 | 广告服务 | 招聘信息 | 保护隐私权 | 免责条款 | 法律顾问 | 意见反馈
版权所有 不得转载
沪ICP备 10203777 号 联系电话:021-54428255
  帮助提示    
《我的太学》是一种全新的应用,您在操作中遇到疑问或者问题,请拨打电话13564659895,15921448526。
《我的太学》