查看: 205|回复: 2

DeepSeek、Grok对医生能有多大的帮助？ [复制链接]

see122

军衔等级：

中尉

注册：2007-10-29 点赞数

10

发表于 2025-2-20 14:01:41 |显示全部楼层

就在医疗界热火朝天地讨论如何应用DeepSeek时，北京时间2025年2月18日，埃隆·马斯克的人工智能企业xAI推出了Grok 3，马斯克将其描述为“地球上最聪明的人工智能”。

除了这大胆的说法，Grok 3在推理、编程和特定领域理解等方面的进步，确实有可能使其成为一些领域游戏规则的改变者。

ChatGPT4、DeepSeek- R1和Grok 3的相继推出，对于那些使用人工智能的医生、药物研发者、影像企业来说，这实际上意味着什么？这些变得越来越优秀的AI在医疗健康行业终究会扮演什么角色？

No.1 Grok 3带来什么冲击？

埃隆·马斯克的Grok 3，得益于神经网络升级、训练数据扩展，以及增强的计算基础设施，据称在数学推理、科学逻辑推理和代码写作等能力表现超过或媲美DeepSeek、ChatGPT等对手，尤其是Grok3的推理模式令人称道。

LabNews Media的一篇文章中指出，在医学领域Grok 3在一些方面的确表现出了显著的优势。

首先对医疗数据的处理，Grok 3可以独立生成和完善训练数据，这在敏感的医疗领域尤为重要，它可以提高患者数据分析的准确性，同时减少诊断中的潜在隐患。

其次，在分析大型生物医学数据集方面， Grok 3表现出特殊优势。它可以检测研究数据中的复杂模式，并支撑新疗法的开发，尤其是它处理不同类型的数据的能力，将使其在药物研究和临床试验有望成为宝贵的工具。

第三，在诊断技能方面，Grok 3的高级图像分析功能允许说明各种医学成像程序，如X射线、PET扫描和核磁共振图像。

另外，Grok 3的实时数据处理允许直接分析和说明医疗信息，这对于在危急医疗情况下的快速决策特别有价值。

然而，尽管诸多优点加身，试用过的医生和研究人员还是表示，Grok 3诊断医疗能力有限。

美国一家非营利性科学研究机构研究人员Derya Unutmaz博士，是Grok的测试者之一，就对媒体指出，“必须对Grok的提示进行调整才能得到正确答案。”

对此，马斯克在X上的一篇文章中称，这仍处于早期阶段，但它已经相当准确，并将变得非常好。

乳腺放射科医生、深度学习研究员Laura Heacock在社交媒体帖子中说，她使用了她以前测试GPT4的相同乳房的X光检查、超声波和核磁共振作为基准，“比ChatGPT4稍微好一点，但没有一个诊断是正确的。”她预计，未来性能会变好。

这些测试暴露出人工智能的限制性，强调了人工智能可以被视为支撑性工具，而不是专业人员的替代品。

No.2 让DeepSeek参加一场医师考试

一个德国研究团队让DeepSeek-R1参加了一场美国医师执照考试（USMLE）。

在这场考试中，DeepSeek-R1不仅通过了USML三个阶段的考验，还顺带着和ChatGPT硬扛了一把。

不出意料，在这场比试中，DeepSeek进一步证明了人工智能系统在回答医知识题、模拟临床推理等方面实现了近乎专家的表现。这个由德国杜伊斯堡-埃森大学医学人工智能研究所（IKIM）、德国亚琛工业大学附属医院组成的研究团队，将该研究的预印本于2月6日发布在medRxiv上。

研究者发现，DeepSeek-R1在基于事实的回忆和临床常识检索方面表现出色。

USMLE有三个考试环节，第一阶段主要考基础医学，如微生物、病理、药理等；第二阶段考临床常识,含内科、外科、妇产科、小儿科等；第三阶段考的是临床实习后对于医学常识的进一步应用。

研究人员称，DeepSeek在第一、二阶段中，其精确匹配性能明显超过ChatGPT。这也表明DeepSeek作为医学教学工具有很大潜力。

不过在第三阶段临床决策方面，无论是DeepSeek，还是ChatGPT都出现力有不逮的状况。

该研究显示，在需要综合多种临床因素的复杂患者病例中，例如为慢性疾病重叠的患者选择最佳管理策略，DeepSeek可能无法考虑患者偏好、症状演变或非典型表现等细微差别；在高风险场景中，ChatGPT可能给出听起来合理，但医学上不合适的治疗计划。

无论是对DeepSeek，还是Grok的测试，都表明目前人类医生的专业经验还是至关重要，人工智能适合扮演最佳助手的角色。

也就是说，将人工智能作为工具，集成到医疗工作流程中可以让医疗健康体系更高效，并且人类专业常识和人工智能支撑的结合，对提高诊断准确性和治疗效果将是一场幸事。

还需注意的是，众多人工智能的集中问世，也让一些问题更突出，也更紧迫。

Grok的数据来源就引发了隐私问题的讨论。2024年10月，马斯克在他的X社交媒体平台上公开要求Grok的用户，上传他们的医疗图像并生成诊断结果。

通过社交媒体平台上收集医疗数据的举动，让 Grok招来欧洲隐私监管机构的质疑，可能违反欧盟法规《通用数据保护条例》。

在步入一个满屏都是讨论AI的时代，最好的、最坏的可能都会发生。如北京朝阳医院一位信息工作人员对《财经》所说：“AI在病历质控、自动生成等已有探索性的应用。现在都还在探索阶段，还需看后面落地的实际应用。”

来源：36kr

举报本楼

本帖有 2 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图

GMT+8, 2025-2-22 16:46 , Processed in 0.137853 second(s), 17 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册