C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

亚星游戏官网-yaxin222  中尉

注册:2007-10-2910
发表于 2025-2-20 14:01:41 |显示全部楼层

就在医疗界热火朝天地讨论如何应用DeepSeek时,北京时间2025年2月18日,埃隆·马斯克的人工智能企业xAI推出了Grok 3,马斯克将其描述为“地球上最聪明的人工智能”。

除了这大胆的说法,Grok 3在推理、编程和特定领域理解等方面的进步,确实有可能使其成为一些领域游戏规则的改变者。

ChatGPT4、DeepSeek- R1和Grok 3的相继推出,对于那些使用人工智能的医生、药物研发者、影像企业来说,这实际上意味着什么?这些变得越来越优秀的AI在医疗健康行业终究会扮演什么角色?

No.1 Grok 3带来什么冲击?

埃隆·马斯克的Grok 3,得益于神经网络升级、训练数据扩展,以及增强的计算基础设施,据称在数学推理、科学逻辑推理和代码写作等能力表现超过或媲美DeepSeek、ChatGPT等对手,尤其是Grok3的推理模式令人称道。

LabNews Media的一篇文章中指出,在医学领域Grok 3在一些方面的确表现出了显著的优势。

首先对医疗数据的处理,Grok 3可以独立生成和完善训练数据,这在敏感的医疗领域尤为重要,它可以提高患者数据分析的准确性,同时减少诊断中的潜在隐患。

其次,在分析大型生物医学数据集方面, Grok 3表现出特殊优势。它可以检测研究数据中的复杂模式,并支撑新疗法的开发,尤其是它处理不同类型的数据的能力,将使其在药物研究和临床试验有望成为宝贵的工具。

第三,在诊断技能方面,Grok 3的高级图像分析功能允许说明各种医学成像程序,如X射线、PET扫描和核磁共振图像。

另外,Grok 3的实时数据处理允许直接分析和说明医疗信息,这对于在危急医疗情况下的快速决策特别有价值。

然而,尽管诸多优点加身,试用过的医生和研究人员还是表示,Grok 3诊断医疗能力有限。

美国一家非营利性科学研究机构研究人员Derya Unutmaz博士,是Grok的测试者之一,就对媒体指出,“必须对Grok的提示进行调整才能得到正确答案。”

对此,马斯克在X上的一篇文章中称,这仍处于早期阶段,但它已经相当准确,并将变得非常好。

乳腺放射科医生、深度学习研究员Laura Heacock在社交媒体帖子中说,她使用了她以前测试GPT4的相同乳房的X光检查、超声波和核磁共振作为基准,“比ChatGPT4稍微好一点,但没有一个诊断是正确的。”她预计,未来性能会变好。

这些测试暴露出人工智能的限制性,强调了人工智能可以被视为支撑性工具,而不是专业人员的替代品。

No.2 让DeepSeek参加一场医师考试

一个德国研究团队让DeepSeek-R1参加了一场美国医师执照考试(USMLE)。

在这场考试中,DeepSeek-R1不仅通过了USML三个阶段的考验,还顺带着和ChatGPT硬扛了一把。

不出意料,在这场比试中,DeepSeek进一步证明了人工智能系统在回答医知识题、模拟临床推理等方面实现了近乎专家的表现。这个由德国杜伊斯堡-埃森大学医学人工智能研究所(IKIM)、德国亚琛工业大学附属医院组成的研究团队,将该研究的预印本于2月6日发布在medRxiv上。

研究者发现,DeepSeek-R1在基于事实的回忆和临床常识检索方面表现出色。

USMLE有三个考试环节,第一阶段主要考基础医学,如微生物、病理、药理等;第二阶段考临床常识,含内科、外科、妇产科、小儿科等;第三阶段考的是临床实习后对于医学常识的进一步应用。

研究人员称,DeepSeek在第一、二阶段中,其精确匹配性能明显超过ChatGPT。这也表明DeepSeek作为医学教学工具有很大潜力。

不过在第三阶段临床决策方面,无论是DeepSeek,还是ChatGPT都出现力有不逮的状况。

该研究显示,在需要综合多种临床因素的复杂患者病例中,例如为慢性疾病重叠的患者选择最佳管理策略,DeepSeek可能无法考虑患者偏好、症状演变或非典型表现等细微差别;在高风险场景中,ChatGPT可能给出听起来合理,但医学上不合适的治疗计划。

无论是对DeepSeek,还是Grok的测试,都表明目前人类医生的专业经验还是至关重要,人工智能适合扮演最佳助手的角色。

也就是说,将人工智能作为工具,集成到医疗工作流程中可以让医疗健康体系更高效,并且人类专业常识和人工智能支撑的结合,对提高诊断准确性和治疗效果将是一场幸事。

还需注意的是,众多人工智能的集中问世,也让一些问题更突出,也更紧迫。

Grok的数据来源就引发了隐私问题的讨论。2024年10月,马斯克在他的X社交媒体平台上公开要求Grok的用户,上传他们的医疗图像并生成诊断结果。

通过社交媒体平台上收集医疗数据的举动,让 Grok招来欧洲隐私监管机构的质疑,可能违反欧盟法规《通用数据保护条例》。

在步入一个满屏都是讨论AI的时代,最好的、最坏的可能都会发生。如北京朝阳医院一位信息工作人员对《财经》所说:“AI在病历质控、自动生成等已有探索性的应用。现在都还在探索阶段,还需看后面落地的实际应用。”


来源:36kr

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2025-2-22 16:46 , Processed in 0.137853 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图