“虽然听不懂,但感觉好牛啊!”
她脸上写着与周野同款的骄傲,但眼底深处掠过一丝心虚,不等周野看过来,赶紧把目光重新投向舞台。
王憷然双手紧紧交握放在膝上,内心澎湃如海啸,脸上却努力维持着得体的微笑。
她的目光近乎贪婪地追随着江倾的一举一动,强烈的崇拜感让她几乎战栗。
李一彤弯着月牙眼,看着台上游刃有余侃侃而谈的江倾,嘴角止不住的向上翘。
她姿态放松地靠着椅背,琢磨着今天这身衣服一定要让他留下来做个纪念,下次……
想到某些不可描述的画面,她有些心虚的左右看看,不自觉地的摩挲了下膝盖,姿势别扭。
弟弟这该死的魅力啊!
刘皓存悄悄调整了一下坐姿,让自己在人群中显得更加优美一些。
毕竟在直播,万一让人拍到了呢。
赵妗麦乖巧地坐的笔直,小手放在膝盖上,像认真听课的小学生。
她努力想理解江倾的话,但很快就放弃了。
太难了,完全听不懂……
章若南笑容灿烂,要不是场合不对,她已经忍不住拿出手机来拍照了。
热芭裹在厚厚的伪装下,眼神却亮得惊人,只觉得台上的男人帅的无以复加!
至于景恬,她想去下洗手间……
台上,江倾已经开始了他的分享,语气随意的像在唠家常。
“大家可能都知道,训练一个大模型,就像教一个特别聪明但有点轴的学生。”
他打了个生动的比方,引来台下一阵会意的轻笑。
“按照传统的方法,可能恨不得把解题的每一步思路都掰开揉碎喂给它,告诉它这一步该这样,下一步该那样。”
江倾模仿着严师的样子,逗得大家又笑了起来。
“但我们无问的团队觉得,有时候管的太细,反而会扼杀创造力。所以呢……”
他话锋一转,眼神变得锐利。
“我们换了个思路。我们用了一种叫做grpo,嗯,大家可以理解为小组相对策略优化的方法。”
江倾故意放慢了语速,确保即使是非专业人士也能跟上他的思路。
“简单说,我们不太关心它中间是怎么想的,是用了九九乘法表还是列了一堆方程式,我们只在乎最后答案对不对。答案对了,就给吃,答案错了,就没。”
他摊摊手,语气诙谐。
“就这么简单粗暴。”
台下许多技术专家露出了深思的表情。
这种只以最终结果为导向的强化学习方式,听起来简单,但实际操作起来难度极高,需要对奖励信号的设计与优化有极其深刻的理解。
“我们发现,当你只告诉它目标,而不限制路径时,这个学生为了吃到,反而会自己琢磨出各种各样,有时甚至我们都没想到的奇妙解题思路。”
江倾笑着指了指自己的脑袋。
“它自我演化出了更高级的推理能力。这叫……嗯,不管黑猫白猫,抓到老鼠就是好猫。”
一句接地气的俗语,引得全场爆发出大笑声。
无论是听懂的技术宅,还是没完全听懂的普通观众,都被这个巧妙的比喻逗乐,同时也理解了核心思想。
姚启智院士边笑边对旁边的黄铁軍低声感叹。
“化繁为简,大道至简啊!这个思路,妙!”
“没错,这个思路太惊艳了!”
黄铁軍满脸赞同,说话时眼睛也未曾从台上移开过,令姚启智不禁摇头失笑。
江倾等笑声稍歇,继续分享。
“当然,光有思路还不够,还得有个好身板。我们给万象设计了一个新的大脑结构,名为,即多维层级注意力机制。”
他点了点自己的太阳穴。
“这个新结构,效率更高,相当于用更小的脑容量,即参数,干更多的活儿,表现还更好。我们并没有一味地去堆砌参数,追求那个吓人的数字。”
李彦弘闻言,身体微微前倾,眼神认真。