查看: 490|回复: 2

DeepSeek V3“报错家门”：我是ChatGPT [复制链接]

ttxx

军衔等级：

四级军士长

注册：2010-4-28 点赞数

5

发表于 2024-12-29 18:47:06 |显示全部楼层

金磊发自凹非寺
量子位 | 公众号 QbitAI

要说这两天大模型圈的顶流话题，那绝对是非DeepSeek V3莫属了。

不过在网友们纷纷测试之际，有个bug也成了热议的焦点——

只是少了一个问号，DeepSeek V3竟然称自己是ChatGPT。

甚至让它讲个笑话，生成的结果也是跟ChatGPT一样：

加之DeepSeek V3这次爆火的一个亮点，就是训练只花了557.6万美金的成本。

于是乎，有人就开始怀疑了：它不会是在ChatGPT的输出基础上训练的吧？

好巧不巧，Altman也发了一个状态，似乎在暗讽着什么……

不过DeepSeek V3并非是第一个出现“报错家门”的大模型。

例如Gemini就曾说过自己是百度的文心一言

那么这到底是怎么一回事？

为什么DeepSeek V3报错家门？

首先需要强调的一点是，从目前网友们整体讨论的观点来看，说DeepSeek V3是在ChatGPT输出上训练的可能性不大

之所以这么说，正如网友Riley Goodside所总结的那样——因为ChatGPT的影子无处不在。

即便DeepSeek V3故意用ChatGPT的输出做了训练，但这并不重要。所有在ChatGPT之后出现的大模型，几乎都见过它。
例如ShareGPT，一个并不新鲜的ChatGPT对话数据集，许多人已经尝试在它和其它ChatGPT数据源上进行调整。但即便如此，也没能出现DeepSeek V3级别的大模型。

紧接着，Riley Goodside又拿出了DeepSeek V3报告中的一些证据：

而且要是用了ChatGPT数据的话，有些关于DeepSeek V3质量的问题是说明不通的。
例如Pile测试（基础模型压缩Pile的效果），DeepSeek V3得分几乎与Llama 3.1 405B相当，这跟它接没接触ChatGPT数据无关。
而且报告称95%的GPU-hours用于预训练基础模型，即便是跟ChatGPT数据有关，那这部分也会在post-training阶段发生（后5%）。

而比起用没用ChatGPT数据，或许大家应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。

TechCrunch针对这个问题给出了一句犀利的点评：

因为AI企业们获取数据的地方——网络，正在充斥着AI垃圾。

毕竟欧盟的一份报告曾预测，到2026年，90%的在线内容可能是AI生成的。

这种“AI污染”就会让“训练数据彻底过滤AI的输出”变得困难。

AI Now Institute的首席科学家Heidy Khlaaf则表示：

尽管存在风险，开发者依然被从现有AI模型中“蒸馏”常识所带来的成本节约所吸引。
意外地在ChatGPT或GPT-4输出上进行训练的模型，也不一定会展示出让人想起OpenAI定制消息的输出。

那么现在对于网友们热议的问题，量子位进行了一波实测，DeepSeek V3目前还没有解决这个bug。

依旧是少了个问号，回答结果会不一样：

DeepSeek V3更多玩法

不过有一说一，绝大部分网友对于DeepSeek V3的能力是给予了的肯定。

从各路AI大佬们集体直呼“优雅”中就能印证这一点。

而就在这两天，网友们陆续晒出了更多DeepSeek V3加持的实用玩法

例如有网友拿DeepSeek V3和Claude Sonnet 3.5一决高下，在Scroll Hub中分别用它俩创建网站

视频地址：https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CN

博主在测试之后，认为DeepSeek V3完全胜出！

还有网友分享了用DeepSeek V3在AI视频编辑器中的体验。

他表示以后不用再在FFMPEG命令上浪费时间了，DeepSeek V3不仅免费，还能改变你的工作流程：

视频地址：https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CN

AI编程神器Cursor也能跟DeepSeek V3结合，来看一个做贪吃蛇的案例：

视频地址：https://mp.weixin.qq.com/s/ieCfWqC5gsJ-Oc7-_L3uDQ?token=904287848&lang=zh_CN

嗯，DeepSeek V3是有点好用在身上的。

One More Thing

对于此前公布的53页论文，也有网友关注到了一个非技术性的细节——

贡献列表中，不仅展示了技术人员，还有数据注释和商务等工作人员：

网友认为这种做法非常符合DeepSeek的调性：

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/
[2]https://x.com/victormustar/status/1872647314231398524
[3]https://x.com/breckyunits/status/1872422078592516295
[4]https://x.com/op7418/status/1872689338242482203
[5]https://x.com/goodside/status/1872911457857208596
[6]https://x.com/kevinsxu/status/1873146905846530472

来源：网易

举报本楼

本帖有 2 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图

GMT+8, 2025-1-5 11:43 , Processed in 0.219828 second(s), 17 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册