C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  大元帅

注册:2007-12-101728
发表于 2025-1-17 15:43:15 |显示全部楼层

2025年,被业界认为是大模型推理爆发年。大模型厂商们在开年便祭出“王炸”,1月15日,科大讯飞发布全国产算力平台上的深度推理大模型——讯飞星火X1,尚属业界首个。该模型中文数学能力国内第一,已率先落地教育、医疗等刚需场景。



全面对标OpenAI最新版GPT-4o的讯飞星火4.0 Turbo底座能力再次升级,首发混域常识搜索技术。作为2024年中标数量和中标金额“双第一”的大模型,在一定程度上,讯飞星火的研发方向揭示了行业和企业的大模型落地痛点。



而讯飞的看家本领是翻译,此次科大讯飞还推出业界首个具备端到端语音导语音同传能力的大模型——星火语音同传大模型,最快语音同传时延小于5秒,这意味着大模型在向翻译领域最高难度挑战时迈出了一大步。



科大讯飞一直走全国产化路线,与HUAWEI深度合作,2023年10月24日,双方联合发布首个国产万卡算力集群“飞星一号”。2024年10月24日,科大讯飞、HUAWEI、合肥市大数据资产运营有限企业三方联合打造的国产超大规模智算平台“飞星二号”正式启动。



此前科大讯飞与HUAWEI组成“特攻队”,持续攻坚很多大模型在全国产算力平台上的训练推理挑战。最近,双方成功攻克训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。



这给2025年推理年的爆发踩了加速油门,但深度推理大模型跟通用大模型有何不同?从科大讯飞展示来看,讯飞星火X1在解答高考题、AIME竞赛题以及高中奥赛题的表现较为突出,不仅准确给出了题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。



通用大模型能力虽强,但是所耗费的算力成本过高,在某些领域,深度推理大模型能用更少的算力取得同等的效果。讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500等多项“考试”中成绩十分亮眼,用更少的算力,拿下了多项指标国内第一。


举报本楼

本帖有 11 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-1-21 05:51 , Processed in 0.220278 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图