C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  一级通信军士

注册:2018-6-2420
发表于 2025-2-17 16:45:42 |显示全部楼层
本帖最后由 dingyan1314 于 2025-2-17 16:45 编辑

2月8日,在中国移动的助力下,中国石油高效完成DeepSeek V3/R1全栈国产化的训推适配和私有化部署。此次部署,基于DeepSeek的关键技术点,开展了系列基础模型算法创新,实现了从底层芯片到框架、模型的全栈自主可控,为推动人工智能技术在能源化工领域的深度应用与国产AI技术生态的规模化落地注入了强大动力。


一直以来,中国移动与中国石油两大央企积极响应国家人工智能战略,努力推动 “人工智能 +” 在能源化工行业落地生根。此前,中国移动携手中国石油发布能源化工领域首个行业大模型——700亿参数昆仑大模型,助力中国石油打造“五个一”:建设一个央企领先的算力中心,一个集中统一AI中台,一套高质量行业数据集,一套国内领先的行业大模型、一系列创新应用。

面对中国石油多模态、超百亿参数的大模型训练任务需求,移动云凭借强大的算力网络能力,实现了资源的快速响应、弹性扩展及高质量供给。通过为中国石油构建“算力泛在、算网共生、智能敏捷、安全可靠、绿色低碳”的一体化算力体系,移动云已提供超过1000P的稳定算力资源,为大模型的建设和运行提供了坚实的算力保障。


为了使DeepSeek系列模型在昆仑大模型原有的框架下,获得更好的适配效果和实行性能,中国移动第一时间开展相关的分析、适配与创新工作。中国移动通过配置化开发,在DeepSeek V3模型基础上快速实现了自定义模型参数和规模的针对性优化。团队在不实际启动集群训练任务的情况下,仅通过单卡即模拟出集群中所有卡的内存占用情况,从而制定整体的集群分布式训练策略。


中国移动复现并优化了DeepSeek MTP多Tokens预测功能,通过DeepSeek-V3/R1主模型和MTP Module的分布式调度,实现一次解码生成多个Token,并通过使整图编译功能,组合计算图的通用算子,实现自动融合加速,提升DeepSeek-V3/R1端到端的推理性能。


此次DeepSeek大模型的成功部署,为中国政企客户实现DeepSeek V3/R1全栈国产化的训推适配和部署提供了重要参考。它也为中国石油昆仑大模型优化应用效果、缩短研发周期、构建健康生态提供了新引擎,推动“数智中国石油”建设步入快车道。


在应用层面,昆仑大模型的问答应用“行业大家”目前已新增DeepSeek深度推理能力。用户在使用该应用时,除了可以得到昆仑大模型生成的能源化工领域专业问答结果,还能选择“深度思考”模式,体验常识推理、场景理解等AI服务。


在模型层面,昆仑大模型的AI中台模型广场目前已上线DeepSeek-V3与DeepSeek-R1模型版本,并实现全尺寸适配,用户可基于AI中台调用DeepSeek模型API服务,并使用AI中台组件及工具构建智能体,以满足不同场景的需求。


未来,中国移动与中国石油将继续携手共进,在油气勘探开发、炼油化工、油气销售、工程建设等核心业务领域深入挖掘AI潜力,以新质生产力为中国式现代化建设贡献力量。


举报本楼

本帖有 7 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-2-23 10:43 , Processed in 0.158762 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图