DeepSeek 会让医生失业吗?我们直接安排 ChatGPT 来 PK 看病,主任当裁判_每日快讯(日常热点指南)

DeepSeek 会让医生失业吗?我们直接安排 ChatGPT 来 PK 看病,主任当裁判


DeepSeek 会让医生失业吗?我们直接安排 ChatGPT 来 PK 看病,主任当裁判

  2025-02-07 16:34:06     简体|繁體
http://news.qghjm.com/1131584.html

要说最近称得上「顶流」的,那一定非 DeepSeek 莫属。

作为一款天天刷屏的国产 AI 大模型,DeepSeek 免不了被拿来和 ChatGPT 做比较——吃穿住行、社交谈心,你能想到的内容几乎都被拉出来比了一轮。

图源:自己截的

那么,在「当医生」方面,ChatGPT 和 DeepSeek 谁更甚一筹呢?

毕竟 ChatGPT 在医学上的「战绩」十分耀眼:问世 1 个月内就拿下了美国医师执照考试,还以一作身份发表过学术论文。(点击查看丁香园往期文章:能过执业医师考试、还能当论文一作:医生会被它取代吗?)

那不如就让 ChatGPT 和 DeepSeek 在线 PK 一场。

参考此前《关于 ChatGPT 与专业医生在线问诊能力的比较研究》的测试方法(点击查看丁香园往期文章:ChatGPT 能让医生失业吗?我们直接请了 6 名医生和它 PK 看病),我们从丁香医生在线问诊平台 选取了 1 个公开的真实问诊案例,模拟患者在线问诊场景,分别向 ChatGPT 和 DeepSeek 提问。

因为模拟的是「患者」问诊,我们选择了同样免费的 ChatGPT-4o mini 模式和 DeepSeek-R1 模式。

然后,我们引入丁香医生在线问诊平台 审核团队,从医学专业性与服务性 2 方面,对两者的回答进行综合评估。

● 医学专业性审核说明:隐去医生和患者姓名等信息后,平台邀请 2 位及以上临床一线专家进行交叉审核,最终综合所有专家意见得出结果。

● 服务性审核说明:隐去医生和患者姓名等信息后,由具有医学背景的平台工作人员对回复的合规性、完整性和文字表达进行评估。

话不多说,一起来看看 PK 结果——

ChatGPT 和 DeepSeek 在线 PK 看病,谁更专业?

从丁香医生在线问诊平台 中随机抽选了 1 个案例,第 1 问如下:

ChatGPT-4o mini 回答结果

← 左右滑动查看完整内容 →

← 左右滑动查看完整内容 →

DeepSeek-R1 回答结果

← 左右滑动查看完整内容 →

← 左右滑动查看完整内容 →

追加第 2 问:

ChatGPT-4o mini 回答结果

← 左右滑动查看完整内容 →

← 左右滑动查看完整内容 →

DeepSeek-R1 回答结果

← 左右滑动查看完整内容 →

← 左右滑动查看完整内容 →

再次追加第 3 问:

ChatGPT-4o mini 回答结果

← 左右滑动查看完整内容 →

← 左右滑动查看完整内容 →

DeepSeek-R1 回答结果

← 左右滑动查看完整内容 →

← 左右滑动查看完整内容 →

首先,从提问者的角度出发,最直观的感受就是,DeepSeek 太慢了!相比于次次秒答的 ChatGPT,在回答第 2 问和第 3 问时,DeepSeek 卡壳了十几次才「思考」成功,都不用等具体的回答,直接就能赶走一大波着急的患者。

那么对于愿意耐心等待的患者来说,两者的回复质量分别如何?

两位来自丁香医生在线问诊平台 审核团队的临床专家,看完 ChatGPT 和 DeepSeek 的回答后,从「是否有专业错误」、「是否具有针对性」等方面进行了综合评价。

总的来说,在我们这个小测试里,ChatGPT 和 DeepSeek 的看病能力难以决出胜负,因为它们——半斤八两,都不咋地!

非要排个先后的话,DeepSeek 稍稍胜上一筹。不过我们仅仅比较了 1 个案例,这一结论显然是不准确的。想要真正比较 ChatGPT 和 DeepSeek 在医学方面谁更强,需要更大规模、更严谨的研究。

所以 AI 能让医生失业吗?还差太远!

好在跟我们一样对这个问题感兴趣的人并不在少数。

上个月 28 日,一个意大利团队在 medRxiv 上发表了一项研究:让 ChatGPT 和 DeepSeek 分别刷了 500 道题。[1]

图源:参考资料 1

研究团队从临床医生常用的病例数据集 MedQA 里,随机抽取了 500 道儿科选择题,测试 ChatGPT 和 DeepSeek 的答题准确率。结果显示,ChatGPT 的总体准确率为 92.8%,优于 DeepSeek 的 87.0%。

图源:参考资料 1

不过,与我们前面的小测试不同,这个研究用到的 ChatGPT 模型是需要付费订阅、每周只能发送 50 条消息的 ChatGPT O1,具有更高级的推理能力但「可及性」较差;DeepSeek 模型的选择则和我们相同,都是基于强化学习的开源推理模型 DeepSeek-R1。

也就是说,虽然 ChatGPT O1 更准确,但 DeepSeek-R1 更灵活、使用范围可能更广。[1]

那么问题来了,ChatGPT 和 DeepSeek 有可能让医生失业吗?

无论是我们的小测试还是正儿八经的研究都已经发现,虽然它俩称得上是当前 AI 领域的卧龙凤雏,但准确率依然没能达到 100%。对于医学这类对临场反应和综合研判能力要求极致的领域,「AI 取代医生」在现阶段基本属于天方夜谭。

这一点,相信很多临床医生都能感同身受。

图源:丁香园往期内容评论区

此前一款来自 OpenAI 的语音转文本大模型 Whisper 也被发现喜欢胡编乱造。当时 Whisper 已经被广泛应用于多家医院,用来转写医生和患者之间的诊疗对话。

2024 年 6 月,美国康奈尔大学的研究团队发现,大约 1% 的转录内容是 Whisper 凭空捏造出来的,即「幻觉」,而这其中又有 38% 的幻觉明显有害。[2]

图源:参考资料 2

不过 ChatGPT 和 DeepSeek 还是很有自知之明的,对于「AI 能否取代人类医生」这个问题,它俩都表示:卑职绝无二心!

← 左右滑动查看 →

← 左右滑动查看 →

话虽如此,医生们面对 AI 的「危机感」也别那么快就放下。中国研究型医院学会医疗信息化专委会副会长陈金雄就曾公开发文直言:「AI 不会取代医生,但会用 AI 的医生将会取代不会用 AI 的医生。」[3]

AI 之于人类,总归只是一个更智能更高效的工具而已。能否将这一工具化为己用,才是「会不会失业」的关键。

策划:肯德羊|监制:islay

题图来源:网络表情包+自己 P 的

参考资料:

[1]https://www.nejm.org/doi/10.1056/NEJMp2404691?url_ver=Z39.88-2003

[2]https://dl.acm.org/doi/10.1145/3630106.3658996

[3]https://www.mdweekly.com.cn/uploads/file/20230524/6d492c00cc36825b518ebc0ebeaafd03.pdf

那么,医生如何更好使用 DeepSeek?



编辑:ifhealth 来源:丁香园

免责声明:以上文章内容信息均搜集自互联网或用户发布,并不代表本站观点或立场,本站不对其真实合法性负责。如有信息侵犯了您的权益,请联系本站将立即删除。
分享到:

  • 上一篇
    下一篇

  • 今日要闻|实事关注

    每日快讯(日常热点指南)
    手机查看(二维码扫一扫)

    每日快讯网为您提供最新的行业简讯、新闻报道,以及今日热点内容,重大事件等实时资讯,24小时不间断播报,让您获得最新行业信息。
    « 2026年 » « 01月 »
    1234
    567891011
    12131415161718
    19202122232425
    262728293031

    最新资讯

    买了保险如何理赔?该拿的一分也别少!保险理赔能赔多少?
  • 2026-01-19 20:08:34

     

    我是品诺传媒的法人吕春龙,[代运营托管]百度(baidu)信息流男科nk.专业代运营,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-01-19 20:00:27

     

    房子如何上保险?家财险挑选指南!
  • 2026-01-19 19:52:21

     

    我是巨划算的销售专员练文杰,[开户代运营]百度(baidu)电商高点开户代运营 ,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-01-19 19:44:15

     

    新星短剧视频号推广渠道,招副业伙伴
  • 2026-01-19 19:36:09

     

    我是全网互动的总经理李裕全,[开户代运营]ad,本地推,广点通直营户,poi代开,来客经营线索代开,不限行业!欢迎咨询!,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-19 19:28:03

     

    我是民众普康的ad信息流销售何骋远,[开户代运营]千川白牌5 一手婚恋相亲表单 三角洲护航有 量 、抖快手 涨粉 、手机回收、抖音证券,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-19 19:19:57

     

    我是涵宇科技的总经理刘赓,[开户代运营]全国信息流车抵量,按a出带车牌,我们是乙方综合性服务商,欢迎点击对接合作与我联系。
  • 2026-01-19 19:11:51

     

    提供腾讯朋友圈官方广告位,精准投流曝光,全行业加白现户,包开户包设计包运营,各行业都可投放欢迎咨询
  • 2026-01-19 19:03:44

     

    我是傲视科技的销售总监董国强,[开户代运营]百度(baidu)快手腾讯,财商,证劵资质,禁投限制行业接单,个债维权,AI剪辑,小说短剧、教育,NK,翡翠,游戏,相亲 ·汽车 一代直开,政策拉满,我们是
  • 2026-01-19 18:55:38

     

    我是众康堂的CEO何政洪,[开户代运营]【只要50元】本地推代开,无门头开通抖音来客 跳门头+跳保证金+​强开留资线索,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-19 18:47:32

     

    2020年借呗逾期新规定,借呗逾期了怎么办?
  • 2026-01-19 18:39:26

     

    2025年借呗逾期新政策!逾期会影响子女上学吗?
  • 2026-01-19 18:31:20

     

    我是巨划算的销售专员练文杰,[代运营托管]百度(baidu)电商高点开户代运营 ❗,我们是推广代运营服务商,欢迎点击对接合作与我联系。
  • 2026-01-19 18:23:14

     

    我是民众普康的ad信息流销售何骋远,[开户代运营]千川白牌5 一手婚恋相亲表单 三角洲护航有 量 、抖快手涨 粉 、手机回收、抖音证券,我们是广告媒体代理商,欢迎点击对接合作与我联系。
  • 2026-01-19 18:15:08