DeepSeek

  • 马斯克发布Grok3:多项测试超越DeepSeek 展现强劲竞争力

    xAI今日发布新一代大语言模型Grok-3及其精简版Grok-3 mini。最新基准测试显示,Grok-3在与DeepSeek的直接对比中展现出显著优势。 在数学能力测试(AIME’24)中,Grok-3获得52分,明显超过DeepSeek-V3的39分。科学知识评估(GPQA)方面,Grok-3以75分的成绩领先,而DeepSeek-V3为65…

    2025 年 2 月 18 日
    5200
  • 马克·安德森最新访谈:DeepSeek 宇树和AI影响下的权力结构

    全球权力结构的转变:精英与反精英 Patrick:如果我们考虑全球权力结构的变化,……,你最关注哪些权力中心正在发生变化,无论是正在获得权力还是正在失去权力? Marc:《马基雅维利主义者》(The Machiavellians)。我敢肯定你可能已经有十几个人在你的节目中推荐过这本书了。这是20世纪最伟大的书籍之一。它阐述了关于政治权力、社会和文化权力的理论…

    2025 年 2 月 15 日
    7800
  • DeepSeek 对 Web3 AI 上下游协议产生的影响

    DeepSeek 引发的冲击会在今年对 AI 产业的上下游产生深远的影响,DeepSeek 成功让家用消费级显卡完成了原本大量高端 GPU 才能承担的大模型训练任务。围绕 AI 发展的第一护城河——算力,开始崩塌,当算法效率以每年 68% 的速度狂奔,而硬件性能遵循摩尔定律的线性爬升时,过去三年根深蒂固的估值模型不再适用,AI 的下一章,将由开源模型来开启。…

    2025 年 2 月 13 日
    4700
  • DeepSeek的“服务器繁忙”让所有人抓狂 背后究竟是怎么回事

    DeepSeek频频回复的“服务器繁忙,请稍后再试”,正在让各地用户抓狂。 此前不太被大众所知的DeepSeek,因2024年12月26日推出对标GPT 4o的语言模型V3而声名鹊起。在1月20日DeepSeek又发布对标OpenAI o1的语言模型R1,之后因为“深度思考”模式生成的答案优质度高,以及其创新揭示出模型训练前期成本可能骤降的积极信号,令该公司…

    2025 年 2 月 13 日
    4300
  • 鲸起生万物:有关DeepSeek的2期硬核播客总结

    DeepSeek火出圈的这十几天,其实也是噪音最多的一段时间,说实话大部分的讨论成品都有种加班硬赶KPI的味道,是人是鬼都在掰扯,有留存价值的屈指可数,倒是有两期播客让我听后受益匪浅,非常推荐。 一个是张小珺请来加州伯克利大学AI实验室博士潘家怡对DeepSeek论文的逐句讲解,接近3个小时的高密度输出,非常能杀脑细胞,但杀完之后分泌出来的内啡肽,也含量爆炸…

    2025 年 2 月 11 日
    6100
  • 为什么中国只有一个 DeepSeek?

    “为什么没有成为 DeepSeek”,以及“为什么中国只有一个 DeepSeek”,是几乎所有大模型从业者与 VC 从春节就开始求索的问题。这两个问题几乎可以涵盖了目前国内所有关于大模型创新的焦虑,也只有严肃探讨这两个问题,才能回答另一个更重要的问题:如何成为 DeepSeek? 我们从中美 AI 创新对比的大角度试图向行业传递一个信息:中国 AI 需有民族…

    2025 年 2 月 11 日
    5700