当前所在位置: 首页 > 数码科技

Nature 最新:医学版 ChatGPT 已开始临床测试

2023-07-19 小编 【 字体:

人工 AI 在临床医学上的应用发展到什么程度了?

近日,谷歌于 Nature 发表了题为:Large language models encode clinical knowledge 的研究论文,展现了专精于医学领域的大语言模型——Med-PaLM——的测评结果。

Nature 最新:医学版 ChatGPT 已开始临床测试(图1)

论文截图

Med-PaLM 在大语言模型 Flan-PaLM 的基础上进行微调。研究人员首先对 Flan-PaLM 进行测试,结果发现,在整合了美国医师执照考试类问题的数据集中,Flan-PaLM 达到了 67.6% 的准确率,达到了通过考试的标准(60%)。不过,进一步评估显示,Flan-PaLM 在回答消费者的医疗问题方面依然存在不足。

Nature 最新:医学版 ChatGPT 已开始临床测试(图2)

论文截图

经过更适应医学领域的调整后,Med-PaLM 诞生。研究人员让真正的人类临床医生和 Flan-PaLM、Med-PaLM 共同回答了 140 个临床问题,并将答案交由一组临床医生评分。

测试结果显示,评分小组认为 Flan-PaLM 的答案只有 61.9% 符合科学共识,而 Med-PaLM 的这一比例为 92.6%,与临床医生生成的答案(92.9%)相当。此外,29.7% 的 Flan-PaLM 答案被评为可能导致有害结果,而 Med-PaLM 的这一比例为 5.9%,这与临床医生生成的答案(5.7%)的结果相似。

Nature 最新:医学版 ChatGPT 已开始临床测试(图3)

论文截图

论文表示,尽管研究结果展现出了一定的希望,但医学领域非常复杂,依然有许多困难需要克服和改善,在 Med-PaLM 真正应用于临床之前,还需要更详细的进一步评估。(策划:z_popeye|监制:gyozua、carellero)


阅读全文
id_1广告位-300*300
相关推荐

抖音播放来源在哪看?推荐页播放多少好?

抖音播放来源在哪看?推荐页播放多少好?
抖音作为全球最受欢迎的短视频平台之一,让许多用户能够随时随地分享自己的生活、展示...

Nature 最新:医学版 ChatGPT 已开始临床测试

Nature 最新:医学版 ChatGPT 已开始临床测试
人工 AI 在临床医学上的应用发展到什么程度了?近日,谷歌于 Nature 发表...

别让阳台大材小用!海尔洗衣机全国启动最AI阳台节

别让阳台大材小用!海尔洗衣机全国启动最AI阳台节
阳台都只被用来晾晒衣服,两三根衣架就能霸占整个空间,阳光还会被衣服拦截、被杂物阻...

宝马推出摩托车智能眼镜,可显示导航、速度等信息

宝马推出摩托车智能眼镜,可显示导航、速度等信息
IT之家 7 月 9 日消息,摩托车骑手在路上行驶时,需要更加注意防御性驾驶,因...

怎么样使用电脑才能保护眼睛呢?

怎么样使用电脑才能保护眼睛呢?
这样使用电脑才能保护眼睛哦!平时我们使用电脑,看到的都是白底黑字,这种搭配对比较...

12G+512G骁龙870手机,5000万追焦+6400万大底主摄,外观一眼动心

12G+512G骁龙870手机,5000万追焦+6400万大底主摄,外观一眼动心
2023年的安卓手机阵营到处都是骁龙8Gen2旗舰机,剩下的不是搭载骁龙8+就是...

中国手机第一排行已经出炉,华为居然没上榜!

中国手机第一排行已经出炉,华为居然没上榜!
众所周知,伴随着近两年全球经济的降速,手机行业也迎来了寒冬。即便来到 2023 ...

全网在线24小时自助下单平台,抖音涨粉有捷径吗?

全网在线24小时自助下单平台,抖音涨粉有捷径吗?
互联网是一个流量江湖,谁拥有流量,就拥有很话语权,任何项目做到最后其实就是搞流量...

手机连不上wifi是怎么回事 手机连不上wifi是什么情况

手机连不上wifi是怎么回事 手机连不上wifi是什么情况
以魅族pro6s,Android 8系统为例。打开手机设置,点击【无线网络】,再...

京东白条怎么用 京东白条怎样用

京东白条怎么用 京东白条怎样用
以京东APP V7.0.8,华为mate20,EMUI9.1.0版本为例。首先将...