by KaiQu
你好,我是曲凯,42章经的创始人。 小的时候我不太舍得花钱,记得当年一毛钱一袋的牛肉干真的很好吃,但如果偶尔遇到一个很有趣的人,我会欣然花几十、上百块请他吃个饭,还觉得自己赚到了。 后来长大了一些,开始刷人人网、豆瓣、知乎、再到现在的即刻…… 你有没有偶尔在这些平台刷到过一个很有缘的人,然后在一个夏日的午后,把他的发言、转载和收藏全都看了一遍,并觉得心有戚戚焉。 再后来工作和创业以后,每天就是聊各种各样的投资人、创业者。 如果能聊到一个优秀的人,真的会有一种如沐春风的感觉,并真心觉得很幸福。 而同行们见面经常会聊到的问题也是:最近有没有遇到什么有意思的人? 所以,这个播客就是要努力把这些人带到你的身边。 我们只专注和有趣、有独到认知、又愿意坦诚分享的聪明人聊天。 希望你听完每一期都能回到小时候,回到那个因为认识了有趣的人、收获了新知,而感到单纯美好幸福的时刻。 如果听完以后,你还能暗自感慨一句, “我也好想认识这个人啊。” 或者, “哇靠,有被启发到。” 那这个播客也就值了。
Language
🇨🇳
Publishing Since
7/29/2023
Email Addresses
1 available
Phone Numbers
0 available
April 19, 2025
Sheet0 Founder and CEO Wang Wenfeng discusses Agent definitions, the differences between current and past Agents, and various concepts like Function Call and AI Coding with host Qu Kai, founder of 42章经, in an interview.
April 5, 2025
<p>当 AI 预训练的 scaling law 开始放缓,强化学习 (RL) 接过接力棒,拉出了一条漂亮的第二曲线。</p><p>在当下的 Agent 热里,有 RL 能力的团队,也是最被看好和押注的。</p><p>但很多人对 RL 都没有一个足够清晰的理解,包括我自己。</p><p>所以这期我们请到了国内 RL 领域的专家、清华大学交叉信息研究院助理教授吴翼,来讲讲 RL 的原理到底是啥、RL+LLM 的路径是怎么发展起来的、目前存在哪些非共识、未来还会怎么演变等等(聊完感觉像上了一堂免费大师课)。</p><p>而且聊着聊着,我们发现,人生就是一个 RL 的过程,区别是 RL 有明确的奖励函数,但是人生没有。可能如吴翼教授所说,我们首先都要以一种「最大熵」的方式去主动和不确定的世界交互,才能找到自己的奖励函数,优化自己的人生曲线。</p><p>最后,吴翼教授的团队最近开源了一个 RL 框架 <a href="https://github.com/inclusionAI/AReaL/releases/tag/v0.2.0">AReaL-boba</a>,在 SOTA 7B 上跑出了 AIME24 61.9 的分数,也欢迎大家去 GitHub 关注。</p><p>【<strong>人类博物馆】</strong></p><p><strong>导游:</strong>曲凯,42章经创始人</p><p><strong>32 号珍藏:</strong>吴翼,清华大学交叉信息研究院助理教授,蚂蚁集团强化学习实验室首席科学家,前 OpenAI 研究员。</p><p>【<strong>时光机】</strong></p><ul> <li>1:51 到底什么是 RL?</li> <li>4:25 人生就是一个强化学习的过程</li> <li>6:22 RL 和 LLM 是怎么结合起来的? <ul> <li>7:01 强强联手第一步:InstructGPT,实现指令遵从</li> <li>10:07 过程中衍生出了 RLHF</li> <li>11:41「慢思考」的需求催生了 RL 的应用</li> </ul> </li> <li>16:10 为什么说 Anthropic RL 做得特别好?</li> <li>21:17 行业对 RL+LLM 的最优路径形成共识了吗?</li> <li>25:11 RL 起来之后,对 Agent 的影响是什么?</li> <li>32:11 Intelligence = LLM (理解) × RL (决策),二者缺一不可</li> <li>34:14 Scaling law 的未来 <ul> <li>34:33 Pretraining 的两个发展方向</li> <li>36:43 RL 还处于早期,进入深水区后可能会走向分化</li> </ul> </li> <li>40:02 大模型团队的组织架构要如何设计?</li> <li>43:21 一个反常识:对 AI 来说,理解比生成更难,token 消耗更大</li> <li>47:38 现在做 Agent 一定需要一个懂 RL 的人吗?</li> <li>49:32 为什么 RL 人才这么稀缺?</li> <li>56:10 RL 目前三大分支:泛化 (DeepSeek)、代码 (Anthropic)、Agent (OpenAI)</li> <li>58:55 框架对 RL 意味着什么?</li> <li>1:02:51 RL 在海内外进展还有明显差距</li> <li>1:04:42 想做好 RL,基建≫数据>算法</li> <li>1:06:05 研究 RL 收获的一些人生启发</li></ul><p><strong>【Reference】</strong></p><ul> <li>吴翼的 PhD 毕业论文:<a href="https://www2.eecs.berkeley.edu/Pubs/TechRpts/2020/EECS-2020-9.html">On Building Generalizable Learning Agents</a></li> <li>吴翼获机器学习顶级会议 NIPS2016 最佳论文奖的论文:<a href="https://proceedings.neurips.cc/paper_files/paper/2016/file/c21002f464c5fc5bee3b98ced83963b8-Paper.pdf"> Value Iteration Network</a></li> <li>吴翼提到的他非常喜欢的一篇论文:<a href="https://arxiv.org/abs/1802.04564">Diversity-Driven Exploration Strategy for Deep Reinforcement Learning</a></li> <li>吴翼团队和蚂蚁研究院开源的强化学习训练框架:<a href="https://github.com/inclusionAI/AReaL/releases/tag/v0.2.0">AReaL-boba</a></li></ul><p>【<strong>The gang that made this happen】</strong></p><ul> <li>制作人:陈皮、Celia</li> <li>剪辑:陈皮</li> <li>Bgm:Mondo Bongo - Joe Strummer & The Mescaleros</li></ul>
March 22, 2025
<p>我又来美国了。</p><p>这次来,我发现市场真的变化太快,这边很多人都开始相信一个所谓「东升西落」的叙事。于是我再次请来了莫傑麟,和他聊聊二级市场自 DeepSeek 发布以来有哪些新变化、新趋势。</p><p>在这期播客里,我们推演了「东升西落」的演绎过程和底层逻辑,谈了我们各自对 DeepSeek 和 Manus 这两个热门产品的感受,也聊了宏观的市场环境和股市的未来。</p><p>最近两年很多人都在说,这波 AI 中的最赚钱的方式是炒股。</p><p>但真的是这样吗?</p><p>二级市场真的才是大家最终的归宿吗?</p><p>【<strong>人类博物馆】</strong></p><p><strong>导游:</strong>曲凯,42章经创始人</p><p><strong>九号珍藏:</strong>莫傑麟,家族办公室资深从业者</p><p>【<strong>时光机】</strong></p><p><strong>Part1 「东升西落」的叙事</strong></p><ul> <li>00:30 为什么二级市场突然流行「东升西落」的叙事? <ul> <li>1:00 推演一下演绎过程和底层逻辑</li> <li>5:19 之前大家过于低估国内 AI 了</li> </ul> </li> <li>6:47 中美对 AI 的叙事重点完全不同</li> <li>7:27 简评 DeepSeek</li> <li>9:48 简评 Manus <ul> <li>10:15 Manus 是最典型的中国式 AI 产品</li> <li>11:58 Manus 爆火背后的两个核心原因</li> <li>14:35 为什么后来风评急转直下?</li> <li>16:01 未来的 AI 产品可能要先在海外宣发,再杀回国内</li> </ul> </li></ul><p><strong>Part2 二级市场的宏观环境</strong></p><ul> <li>22:04 二级市场 = 预期 + 趋势</li> <li>23:12 关于预期——大家对中国的预期是什么?</li> <li>24:39 为什么阿里加大对 AI 的 Capex 投入后,股价大涨?</li> <li>26:17 腾讯是 DeepSeek 这波的最大受益者</li> <li>31:11 25 年的中国在重演 23-24 年的美国</li> <li>33:48 芯片「卡脖子」还会是问题吗?</li> <li>35:42 关于趋势 <ul> <li>35:52 暗线 (宏观环境):稳中向好</li> <li>37:30 明线 (产业趋势):AI+专精特新+消费多点开花</li> </ul> </li></ul><p><strong>Part3 股市的未来</strong></p><ul> <li>38:44 今年 A 股会不会继续涨,美股会不会继续跌?</li> <li>41:13 二级市场在变得越来越卷,共识的达成和演绎速度越来越快</li> <li>43:57 这波 AI 最赚钱的方式真的是炒股吗?</li> <li>46:44「大起大落的高频波动」可能是未来股市的常态</li> <li>48:14「做时间的朋友」还行得通吗?</li> <li>49:54 分享一些 25 年的个人观察 <ul> <li>50:18 AI 领域我会重点关注三个问题</li> <li>52:53 很多非 AI 公司也很值得研究</li> </ul> </li> <li>54:56 二级市场是所有人的最终归宿吗?</li></ul><p><strong>【Reference】</strong></p><p><a href="https://www.xiaoyuzhoufm.com/episode/656aeffd0500be931c4eb099">为什么我们开始乐观?关于经济发展的明线暗线、AI 与最佳实践 | 对谈莫傑麟</a></p><p>【<strong>The gang that made this happen】</strong></p><ul> <li>制作人:陈皮、Celia</li> <li>剪辑:陈皮</li> <li>Bgm:Mondo Bongo - Joe Strummer & The Mescaleros</li></ul>
Pod Engine is not affiliated with, endorsed by, or officially connected with any of the podcasts displayed on this platform. We operate independently as a podcast discovery and analytics service.
All podcast artwork, thumbnails, and content displayed on this page are the property of their respective owners and are protected by applicable copyright laws. This includes, but is not limited to, podcast cover art, episode artwork, show descriptions, episode titles, transcripts, audio snippets, and any other content originating from the podcast creators or their licensors.
We display this content under fair use principles and/or implied license for the purpose of podcast discovery, information, and commentary. We make no claim of ownership over any podcast content, artwork, or related materials shown on this platform. All trademarks, service marks, and trade names are the property of their respective owners.
While we strive to ensure all content usage is properly authorized, if you are a rights holder and believe your content is being used inappropriately or without proper authorization, please contact us immediately at [email protected] for prompt review and appropriate action, which may include content removal or proper attribution.
By accessing and using this platform, you acknowledge and agree to respect all applicable copyright laws and intellectual property rights of content owners. Any unauthorized reproduction, distribution, or commercial use of the content displayed on this platform is strictly prohibited.