物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，咱们已参加RL黄金时间

慈溪市恩必安电器有限公司-物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，咱们已参加RL黄金时间

让建站和SEO变得简单

让不懂建站的用户快速建站，让会建站的提高建站效率！

你的位置：慈溪市恩必安电器有限公司 > 服务项目 > 物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，咱们已参加RL黄金时间

物理测试暴击AI圈，DeepSeek R1稳超o1、Claude，咱们已参加RL黄金时间

发布日期：2025-03-04 08:13 点击次数：77

专题：DeepSeek为何能转换人人AI圈

　　起首：机器之心

咱们都没料意象，AI 鸿沟的 2025 年是这么开动的。

　　DeepSeek R1 果然太犀利了！

　　最近，‘遍及的东方力量’DeepSeek 正在‘硬控’硅谷。

　　我让 R1 发达解释勾股定理。这一切都是 AI 在不到 30 秒时期里一次性完成的，没出任何错。节略来说，its over．

　　在国表里 AI 圈，平庸网友发现了神奇的高大新 AI（还开源），学界众人纷繁喊出‘要奋发蹈厉’，还有小谈音信称外洋的 AI 公司照旧小题大作。

　　就说这个本周刚发布的 DeepSeek R1，它莫得任何监督检修的纯强化学习门路令东谈主颠簸，从客岁 12 月 Deepseek-v3 基座发展到如今堪比 OpenAI o1 的念念维链智商，似乎是很快杀青的事。

　　但在 AI 社区热气腾腾的读时期讲述、对比实测之余，东谈主们照旧对 R1 有所怀疑：它除了能跑赢一堆 Benchmark 除外，真的能最初吗？

　　能自建模拟‘物理划定’

　　你不信？来让大模子玩玩弹球？

　　最近几天，AI 社区的一些东谈主开动千里迷一项测试 —— 测试不同的 AI 大模子（尤其是所谓的推理模子）来贬责一类问题：‘编写一个 Python 剧本，让一个黄色球在某个形势内弹跳。让该形势安逸旋转，并确保球停留在形势内。’

　　一些模子在这项‘旋转球形’基准测试中的施展优于其他模子。据 CoreView CTO Ivan Fioravanti 称，国内东谈主工智能实践室 DeepSeek 的开源大模子 R1 完胜 OpenAI 的 o1 pro 时势，后者行为 OpenAI ChatGPT Pro 计算的一部分，每月收费 200 好意思元。

　　左边是 OpenAI o1，右边是 DeepSeek R1。如上所述，这里的 Prompt 是：‘write a python script for a bouncing yellow ball within a square， make sure to handle collision detection properly． make the square slowly rotate． implement it in python． make sure ball stays within the square．’

　　阐发另一位网友在 X 上的说法，Anthropic 的 Claude 3.5 Sonnet 和谷歌的 Gemini 1.5 Pro 模子对物理旨趣判断伪善，导致球偏离了形势。也灵验户讲述称，谷歌最新的 Gemini 2.0 Flash Thinking Experimental，以及相对更旧的 OpenAI GPT-4o 都一次性通过了评估。

　　但这里面亦然能分出上下的：

　　在这个推文下面的网友暗意：o1 的智商正本很好，在 OpenAI 优化速率事后就变弱了，即使是每月 200 好意思元的会员版也通常。

　　模拟弹跳球是一个经典的编程挑战。精确的模拟联结了碰撞检测算法，其算法需要去识别两个物体（举例一个球和一个形势的侧面）何时发生碰撞。编写不当的算法会影响模拟的性能或导致赫然的物理伪善。

　　AI 初创公司 Nous Research 的相关员 N8 Programs 暗意，他花了约莫两个小时从新开动编写一个旋转七边形中的弹跳球。‘必须追踪多个坐标系，了解每个系统中的碰撞是如何进行的，并从新联想代码以使其具有鲁棒性。’

　　诚然弹跳球和旋转形势是对编程妙技的合理测试，但对于大模子来说照旧个新面目，即使是指示中的幽微变化也可能产生出不同的着力。是以如果想让它最终成为 AI 大模子基准测试的一部分的话，还需要矫正。

　　岂论如何，经由这一波实测之后，咱们对大模子之间的智商不同有了不雅感。

　　DeepSeek 是新的‘硅谷神话’

　　DeepSeek 正让大洋此岸堕入‘惊骇’。

　　Meta 职工发帖称‘Meta 工程师们正在豪恣地分析 DeepSeek，试图从中复制任何可能的东西。’

　　而 AI 科技初创公司 Scale AI 独创东谈主 Alexandr Wang 也公开暗意，中国东谈主工智能公司 DeepSeek 的 AI 大模子性能大致与好意思国最佳的模子非常。

　　他还觉得，往时十年来，好意思国可能一直在东谈主工智能竞赛中最初于中国，但 DeepSeek 的 AI 大模子发布可能会‘改变一切’。

　　X 博主 @8teAPi 则觉得，DeepSeek 并不是一个‘副业面目’，而是像洛克希德・马丁以前的‘臭鼬工场’。

　　所谓‘臭鼬工场’，即是当初洛克希德・马丁公司（Lockheed Martin）为了研发诸多先进飞动器特地成立的一个高度巧妙、相对寥寂的小团队，从事顶端或相称规的时期相关与开荒。从 U-2 考查机、SR-71 黑鸟，到 F-22 猛禽、F-35 闪电 II 来回机都是从这里走出来的。

　　其后，这个词逐渐演酿成一个通用术语，用来刻画在大公司或组织里面树立的‘小而精’、相对寥寂且解放度更高的转换团队。

　　他给出的意义有两个：

一方面是 DeepSeek 领有多数的 GPU，据称有逾越一万块，而 Scale AI 的 CEO Alexandr Wang 以至暗意可能达到 5 万块。

另一方面，DeepSeek 只从中国排行前三的大学招聘东谈主才，这意味着 DeepSeek 与阿里巴巴和腾讯具有同等的竞争力。

　　仅凭这两个事实，就不错看出，昭着 DeepSeek 在买卖上取得了顺利，况且照旧充足驰名，大约得到这些资源。

　　至于 DeepSeek 的开荒老本，该博主暗意，中国科技公司不错得到各式种种的补贴，比如低用电老本和用地。

　　因此，DeepSeek 相称有可能大部分老本都被‘安置’在中枢业务之外的某个账目上，或者以某种数据中心确立补贴的时势存在。以至除了独创东谈主之外，没东谈主实足明晰通盘财务安排。有些合同可能仅仅‘理论协定’，只靠声誉就能敲定。

　　不管如何，有几点是明确的：

这个模子相称出色，与 OpenAI 两个月前发布的版块非常，天然也有可能不如 OpenAI 和 Anthropic 尚未发布的新模子。

从当前来看，相关标的仍主要由好意思国公司主导，DeepSeek 模子属于对 o1 版块的‘快速跟进’，但 DeepSeek 的研发程度相称迅猛，比预期更快地不甘雌伏，他们并莫得抄袭或舞弊，最多仅仅逆向工程。

DeepSeek 主若是在培养我方的东谈主才，而不是依赖好意思国培养的博士，这大大膨大了东谈主才库。

与好意思国公司比拟，DeepSeek 在常识产权许可、遁藏、安全、政事等方面受到的拘谨较少，围绕伪善地使用那些不想被检修的数据的担忧也较少。诉讼更少，讼师更少，也更少记挂。

　　毫无疑问，越来越多的东谈主觉得 2025 年将会是决定性的一年。与此同期各家公司都在擦掌摩拳，比如 Meta 就正在确立一个 2GW+ 的数据中心，瞻望在 2025 年投资 600-650 亿好意思元，年底领有逾越 130 万块 GPU。

　　Meta 以至用一张图表展示了 2 千兆瓦数据中心与纽约曼哈顿的对比。

　　但当前 DeepSeek 用更低的老本，更少的 GPU 作念到了更好，岂肯不让东谈主惊悸？

　　Yann LeCun：要感谢开源

　　Hyperbolic 的 CTO、都集独创东谈主 Yuchen Jin 发帖暗意，在仅 4 天时期里，DeepSeek-R1 向咱们解说了 4 个事实：

开源 AI 仅过期于闭源 AI 不到 6 个月

中国正在主导开源 AI 竞赛

咱们正参加大谈话模子强化学习的黄金时间

蒸馏模子相称高大，咱们将在手机上运行高智能 AI

　　由 DeepSeek 激发的四百四病仍在延续，比如 OpenAI o3-mini 免费可用、社区中但愿能减少对于 AGI/ASI 的疏漏商榷以及别传 Meta 堕入惊骇等。

　　他觉得，当前很难预测最终谁会告捷，但不要健忘后发上风的力量，毕竟咱们都知谈是 Google 发明了 Transformer，而 OpenAI 解锁了其真确后劲。

　　此外，图灵奖得主、Meta 首席东谈主工智能科学家 Yann LeCun 也抒发了我方的见解。

　　‘对于那些看到 DeepSeek 的性能就觉得“中国正在杰出好意思国的 AI”的东谈主，你意会错了。正确的意会是：开源模子正在杰出非凡模子。’

　　LeCun 暗意，DeepSeek 之是以此次一鸣惊东谈主，是因为他们从怒放相关和开源（如 Meta 的 PyTorch 和 Llama）中获益。DeepSeek 冷落了新目的，并在他东谈主使命的基础上构建。因为他们的使命是公开荒布和开源的，每个东谈主都不错从中受益，这即是怒放相关和开源的力量。

　　网友们的反念念还在延续，在对于新时期发展答应的同期，也能感受到小数点忧虑的歧视，毕竟 DeepSeek 们的出现，可能会带来真金白银的影响。

　　参考本体：

　　https：//x.com/ivanfioravanti/status/1881969391547683031

　　https：//x.com/Aadhithya_D2003/status/1882105009548222953

　　https：//x.com/8teAPi/status/1882836551866204656

　　https：//x.com/Yuchenj_UW/status/1882840436974428362

　　https：//x.com/ylecun/status/1882943244679709130

　　https：//venturebeat.com/ai/tech-leaders-respond-to-the-rapid-rise-of-deepseek/

海量资讯、精确解读，尽在新浪财经APP

职守剪辑：丁文武

上一篇：红杉中国控股Marshall马歇尔，全球顶级品牌迎来发展新乐章
下一篇：白俄罗斯总统选举投票认真驱动

相关资讯

热点资讯

友情链接：