他还想着能在吃饭上节省点时间,再看看自己的围棋训练程序怎么优化。
吃完午饭,他背上电脑,准备在会展中心找个没人的小会议室,独自研究一下。
路过一处沙发的时候,他正好看到瑞秋和一男一女两位教授坐在会展中心走廊的沙发上,愉快地讨论着。
看到江铭路过,瑞秋招了招手,往旁边让开了点位置,示意江铭坐过去。
江铭有些不好意思,但在众人期待的目光下,也不便拒绝,只好坐了过去。
瑞秋身着比较正式的衬衫,搭配着一套黑色裙子,勾勒出性感的曲线。
江铭微微侧身,稍微躲开了一丝距离,才不至于和瑞秋贴上,鼻尖传来一丝柑橘味香水的清新气息。
他有点脸红,忙装作镇定地岔开话题:“你提出来的生成式对抗网络真的很有意思。”
“哈哈,你过奖了,我只是一个业余的信息学研究员。”,瑞秋谦虚道:“倒是你,开会之前我问你最近到底在研究什么,你还没告诉我呢。”
江铭挠了挠头:“不是我不说,是其中有一些难题没有解决。”
瑞秋则更好奇了,她和旁边的教授确认了一下眼神,道:“还有能难住你的问题吗,没事你说出来,我们帮你想想。”
周围的两位教授也友好地点点头。
他们都对江铭的研究很感兴趣,短短两个月内解决了机器翻译问题,又提出策略梯度的研究天才,竟然也会有被难住的时候?
两位教授眼中闪过一丝兴奋,他们最喜欢有挑战性的话题了。
“好吧,哎,其实也没什么,是我想训练出一个超越人类的围棋程序。”,江铭叹了口气:“就还是用策略梯度算法来让围棋自我对弈,不过,我昨天试了一下,这个训练实在太难收敛了。”
众人眼睛一亮,这个课题有意思!
围棋一直被誉为人类智力的最高峰,其复杂程度远远超过其他智力游戏的总和,如果真能挑战成功,将是一个里程碑式的大事件。
“嗯...这的确难以收敛。”,那位男教授率先道:“我研究过你的策略梯度算法,这个通过试错和探索来收集数据实际上是一种蒙特卡洛法,也就是需要完整下完一整局才算作收集一次有效数据。”
“但是围棋的每一步,都有可能让最终的胜负翻转。这样上百步叠加在一起,方差几乎是个天文数字,当然难以收敛了。”,他咋舌感叹,这个难题的确棘手。
“那有没有可能,先学习人类的下法啊,或者让人类来指导训练?”,瑞秋问道。
“感觉似乎也不太走得通,人类还是太渺小了,人类的下法可能是误导也说不定呢?况且让人类指导,人类也判断不出一步棋的好坏吧。”,另一位女教师反驳道。
江铭眉头微皱,听着面前三人的对话,突然感觉有了一点点的灵感。
人类指导不了,那机器呢?
江铭冥冥之中有了一点知觉,但灵感就像在空气浮动的杨絮,想要抓却又扰动了气流,怎么都抓不住。
就差一点点了!
不行,他感到灵感快要消失了,于是立刻在心中默念:“系统,我要使用顿悟因子。”
呼!一股热流涌入了他的大脑,江铭终于在最后一刻把灵感化成了领悟。
“我...我好像明白了!”