这个关于DeepSeek的说法比较靠谱 [复制链接]

wjhqr

军衔等级：

三级军士长

265

发表于 2025-2-1 16:30:48 |显示全部楼层

本帖最后由 wjhqr 于 2025-2-1 16:32 编辑

英伟达工程师陈源的观点：
1. DeepSeek在算法和工程方面取得很大突破，使得模型训练和推理（尤其是推理端）的成本和效率都得到巨大提升。

2. 通过降低训练成本，DeepSeek能够提高AI投资的回报率。（至少在短期内）会对主要AI基础设施的提供商和使用者（包括科技、工业和能源等领域巨头）构成很大威胁。

3. “600万美金训练成本”可能存在误导性，因为缺少一些关键细节。

4. DeepSeek利用模型蒸馏技术，依赖现有模型（如 GPT-4o和o1）进行训练。虽然美国政府限制中国使用最先进的GPU，但并未限制对最新模型的使用。各大企业将来也许会停止发布最先进的模型，以防止类似的模型蒸馏，但可能为时已晚。“猫已经完全从袋子里跑出来了”。

5. 如果推理成本足够低并能在电脑和智能手机上流畅运行的话，PC和手机设备制造商将受益。就像互联网时代一样，带来更频繁的设备升级换代。

6. 这个进展将极大利好使用AI技术的企业，特别是App和互联网行业。另外，具有高质量和独特数据的企业会变得越来越重要和有价值。

举报本楼

本帖有 10 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图

GMT+8, 2025-2-2 00:42 , Processed in 0.128546 second(s), 17 queries , Gzip On.

Discuz Licensed

回顶部

XML 地图 | Sitemap 地图

		自动登录	找回密码
密码			注册