返回

华娱2021:他不是搞科技的吗

报错
关灯
护眼
第394章 化繁为简,尽在掌控(第2/3页)
书签 上一页 目录 下一页 书架
方法,可能恨不得把解题的每一步思路都掰开揉碎喂给它,告诉它这一步该这样,下一步该那样。”
    江倾模仿着严师的样子,逗得大家又笑了起来。
    “但我们无问的团队觉得,有时候管的太细,反而会扼杀创造力。所以呢……”
    他话锋一转,眼神变得锐利。
    “我们换了个思路。我们用了一种叫做GRPO,嗯,大家可以理解为小组相对策略优化的方法。”
    江倾故意放慢了语速,确保即使是非专业人士也能跟上他的思路。
    “简单说,我们不太关心它中间是怎么想的,是用了九九乘法表还是列了一堆方程式,我们只在乎最后答案对不对。答案对了,就给糖吃,答案错了,就没糖。”
    他摊摊手,语气诙谐。
    “就这么简单粗暴。”
    台下许多技术专家露出了深思的表情。
    这种只以最终结果为导向的强化学习方式,听起来简单,但实际操作起来难度极高,需要对奖励信号的设计与优化有极其深刻的理解。
    “我们发现,当你只告诉它目标,而不限制路径时,这个学生为了吃到糖,反而会自己琢磨出各种各样,有时甚至我们都没想到的奇妙解题思路。”
    江倾笑着指了指自己的脑袋。
    “它自我演化出了更高级的推理能力。这叫……嗯,不管黑猫白猫,抓到老鼠就是好猫。”
    一句接地气的俗语,引得全场爆发出大笑声。
    无论是听懂的技术宅,还是没完全听懂的普通观众,都被这个巧妙的比喻逗乐,同时也理解了核心思想。
    姚启智院士边笑边对旁边的黄铁军低声感叹。
    “化繁为简,大道至简啊!这个思路,妙!”
    “没错,这个思路太惊艳了!”
    黄铁军满脸赞同,说话时眼睛也未曾从台上移开过,令姚启智不禁摇头失笑。
    江倾等笑声稍歇,继续分享。
    “当然,光有思路还不够,还得有个好身板。我们给万象设计了一个新的大脑结构,名为MLA,即多维层级注意力机制。”
    他点了点自己的太阳穴。
    “这个新结构,效率更高,相当于用更小的脑容量,即参数,干更多的活儿,表现还更好。我们并没有一味地去堆砌参数,追求那个吓人的数字。”
    李彦弘闻言,身体微微前倾,眼神认真。
    参数规模一直是衡量大模型能力的关键指标之一,无问科技另辟蹊径,在算法与架构优化上取得突破,这意味着更低的训练推理成本,以及更广阔的应用前景。
    他低声对身边的马化藤惊叹。
    “如果这是真的,商业化的潜力太大了!”
    马化藤面色凝重地点点头,手指无意识地在扶手上敲击,快速计算着这其中的影响。
    “还有数据。”
    江倾的分享并没有停下。
    “大家都知道,训练AI需要海量的数据,但不是所有数据都是优质营养。我们的方法呢,更像是炼数据而不是堆数据。”
    他做了一个提炼的动作。
    “我们有一套技术,能自动从数据的海洋里,把那些最有价值、最精华的片段像淘金一样筛出来,专门喂给模型。这样训练效率自然就大大提升了。”
    张一铭听到这里,忍不住深吸了一口气。
    数据清洗与标注一直是AI训练中耗时耗力最大的环节之一,无问科技的方法如果真能高效自动化这个过程,价值不可估量。
    “最后是工程实现。”
    江倾的语气里透着自豪。
    “我们的团队搞了个超级工厂流水线,用了诸如3D并行、INT4量化这些技术……”
    他看到台下有不少人露出迷茫的表情,立刻笑着摆手。
    “好吧,说人话就是,我们想办法让成千上万的显卡更高效地协同工作,减少浪费,让计算速度更快,同时还能省电省成本。这样最终出来的产品,大家用起来才会觉得又快又便宜嘛。”
    他用最朴素的语言解释了极其复杂的工程优化,让非专业观众也能理解其带来的好处。
    更低的延迟,更低的成本。
    台下,来自全球顶尖科技公司与研究机构的工程师、专家学者,已经听得如痴如醉,不时发出低声的惊叹。
    “只以最终答案正确性作为奖励……这太大胆了!”
    “MLA架构?从来没听过,看来是他们自研的!”
    “数据蒸馏……自动识别高价值数据……这思路太清晰了!”
    “3D并行和INT4结合还能保持这种精度?他们的工程优化能力太恐怖了!”
    “不可思议……这简直是系统性的全面创新!”
    Yann LeCun飞快地在本子上记录着,眉头紧锁,时而恍然大悟,时而又陷入新的困惑。
    Yoshua Bengio则和旁边的同伴低声交换着意见,两人脸上都是如同发现了新大陆一般的表情。
    姚启智院士更是红光满面,连连对身旁的人赞叹。
    “后生可畏!后生可畏啊!这是我们在AI领域的巨大突破!”
    周野看着台下那些平时严肃古板的专家们此刻像看到新奇玩具的孩子一样激动,虽然她还是不太明白江倾具体说了什么,但一种“我男人搞出了超级厉害的东西”的自豪感几乎要溢出来。
    她忍不住拿出手机,偷偷拍了一张台下专家们认真听讲的照片,又飞快地拍了一张江倾在台上侃侃而谈的侧影,心里甜滋滋的,感觉整个人像是要飘起来了似的。
    陈嘟灵望着台上那个妙语连珠,将复杂技术讲得通俗易懂又引人入胜的男人,眼
(本章未完,请点击下一页继续阅读)
书签 上一页 目录 下一页 书架