C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  三级军士长

注册:2024-2-8265
发表于 2025-2-1 16:30:48 |显示全部楼层
本帖最后由 wjhqr 于 2025-2-1 16:32 编辑

英伟达工程师陈源的观点:
1. DeepSeek在算法和工程方面取得很大突破,使得模型训练和推理(尤其是推理端)的成本和效率都得到巨大提升。

2. 通过降低训练成本,DeepSeek能够提高AI投资的回报率。(至少在短期内)会对主要AI基础设施的提供商和使用者(包括科技、工业和能源等领域巨头)构成很大威胁。

3. “600万美金训练成本”可能存在误导性,因为缺少一些关键细节。

4. DeepSeek利用模型蒸馏技术,依赖现有模型(如 GPT-4o和o1)进行训练。虽然美国政府限制中国使用最先进的GPU,但并未限制对最新模型的使用。各大企业将来也许会停止发布最先进的模型,以防止类似的模型蒸馏,但可能为时已晚。“猫已经完全从袋子里跑出来了”。

5. 如果推理成本足够低并能在电脑和智能手机上流畅运行的话,PC和手机设备制造商将受益。就像互联网时代一样,带来更频繁的设备升级换代。

6. 这个进展将极大利好使用AI技术的企业,特别是App和互联网行业。另外,具有高质量和独特数据的企业会变得越来越重要和有价值。


举报本楼

本帖有 10 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-2-2 00:42 , Processed in 0.128546 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图