21:00 《DeepSeek LLM Scaling Open-Source Language Models with Longtermism》技术讲解
45:48 《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models》技术讲解
01:06:40 《DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model》技术讲解
01:40:17 《DeepSeek-V3 Technical Report》技术讲解
DeepSeek推理模型
02:05:03 《DeepSeek-Coder: When the Large Language Model Meets Programming - The Rise of Code Intelligence》技术讲解
02:12:16 《DeepSeek-Coder-V2: Breaking the Barrier of Closed-Source Models in Code Intelligence》技术讲解
02:47:18 《DeepSeek-Prover: Advancing Theorem Proving in LLMs through Large-Scale Synthetic Data》和《DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search》技术讲解
02:52:40 《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》技术讲解
It learns to recognize and correct its mistakes. It learns to break down tricky steps into simpler ones. It learns to try a different approach when the current one isn’t working. (它学会识别并纠正自己的错误,学会将复杂的步骤分解为更简单的步骤,学会在当前方法行不通时尝试不同的解决途径。)这些是模型自己学的,不是人教的。
我们还在技术早期,他们认为这个技术可拓展,后续性能会很快攀升。
33:03 DeepSeek-R1-Zero and DeepSeek-R1技术报告《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》讲解
(投资人包括:Google SVP Jeff Dean,Meta首席科学家Yann LeCun,OpenAI早期投资人Peter Thiel、OpenAI创始成员Andrej Karpathy、知名Solo GP Elad Gil,GitHub之前的CEO Nat Friedman,Databricks联合创始人Reynold Xin,Hugging Face CEO Clément Delangue,亚马逊创始人Bezos)
赵耀辉是北京大学国家发展研究院经济学教授。1995年于美国芝加哥大学获得经济学博士学位,曾任教于美国乔治华盛顿大学,1996年开始任教于北京大学国家发展研究院/中国经济研究中心,长期专注劳动经济学和老年经济学的研究与教学。赵耀辉教授曾于2006年入选教育部“新世纪优秀人才支持计划”,也是中国健康与养老追踪调查(CHARLS)项目组负责人,《The Journal of the Economics of Ageing》副总编,曾任北京大学中国女经济学者研究培训项目联合主任。
就在北京时间本周一,美联储宣布救市——保全了所有存储人的钱、却抛弃了股东利益。这集节目聊了危机的技术细节,包括成因、美联储的选择、svb(Silicon Valley Bank,硅谷银行)特殊性、与中国的纽带关系,同时也探讨了未来风险传导的3个可能性。对于把钱存在硅谷银行的创业公司和风投机构来说,他们的钱安全了。但是,这场危机尚未结束。
这会是一个更长线下坠的开端吗?用他的话来说,“这到底是end of the beginning还是beginning of the end?”
这次聊天让我得到了很多意料之外的惊喜。王怀南作为上世纪90年代赴美留学、在外企的第一批华人高管,他的经历刚好钩沉出一段美国往事。今天包括OpenAI创始人Sam Altman、奇绩创坛创始人兼CEO陆奇、微软CEO Satya Nadella、LinkedIn CEO Jeff Weiner等等这些处在世界舞台中心的大人物全部交错在这段历史之中。
最近,我采访了塞巴斯蒂安·马拉比(Sebastian Mallaby),他是一名英国记者和作家。他出版过记录对冲基金历史的《More Money Than God》(富可敌国)、格林斯潘传记《The Man Who Knew》(格林斯潘传),两次入围普利策,而他的新书《The Power Law》(风险投资史)揭露了硅谷风投的内幕故事。
The Power Law可以翻译成幂次法则或指数法则,它揭示风险投资的秘密规律,即大多数项目终将失败,但只要赌中少数几个有巨额回报的大项目,就能赚得盆满钵满。