ChatGPT通过美放射学委员会考试
2023-05-22 富美财经 浏览量:次
科技日报北京5月17日电 (记者刘霞)加拿大科学家在16日出版的《放射学》杂志上刊登新论文称,最新版本的ChatGPT通过了美国放射学委员会的考试,突出了大型语言模型的潜力,但它也给出了一些错误答案,表明人们仍需对其提供的答案进行核查。
为评估ChatGPT在美国放射学委员会考试问题上的表现并探索其优势和局限性,多伦多大学研究人员首先测试了基于GPT-3.5的ChatGPT的表现。研究团队使用了150道选择题,这些选择题与加拿大皇家学院和美国放射学委员会考试的风格、内容和难度相当。这些问题不包括图像,分为低阶(知识回忆、基本理解)和高阶(应用、分析、综合)思维问题。高阶思维问题可进一步细分为影像学表现描述、临床管理、计算和分类、疾病关联。
研究人员发现,基于GPT-3.5的ChatGPT的正确率为69%,接近70%的及格线。该模型在低阶思维问题上表现相对较好,正确率为84%,但回答高级思维问题时表现不佳,正确率仅为60%。而性能更优异的GPT-4的正确率为81%,且在高阶思维问题上的正确率为81%,远好于GPT-3.5。但GPT-4在低阶思维问题上的正确率仅为80%,答错了12道题,而GPT-3.5全部答对了这些题目,这引发了研究团队对GPT-4收集信息的可靠性的担忧。
这两项研究都表明,ChatGPT会有提供不正确答案的倾向,如果仅仅依靠它获取信息,非常危险,因为人们可能意识不到其给出的答案是不准确的,这是它目前面临的最大的问题。(来源:科技日报)
-
-
读德勤处罚全文有感——审计报告不是买卖
事实确定、规则唯一面前,执业的会计师需要正直、勇气与责任担当。作为执...
- 国际财经 2024-05-09
-
读德勤处罚全文有感——审计报告不是买卖
-
-
世界是怎样知道毛泽东的
世界是怎样知道毛泽东的?生活中的我们很少思考这样的问题,甚至觉得这不...
- 国际财经 2024-05-09
-
世界是怎样知道毛泽东的
-
-
李显龙结束访华之行,发文大赞“收获颇丰”
4月3日电 当地时间2日上午,新加坡总理李显龙在社交媒体发文称,已经结束...
- 国际财经 2024-05-09
-
李显龙结束访华之行,发文大赞“收获颇丰”
-
-
突发!以色列再对邻国发动导弹袭击,致2人死
4月4日电 据俄罗斯卫星通讯社援引叙利亚媒体消息,当地时间4日凌晨,以色...
- 国际财经 2024-05-09
-
突发!以色列再对邻国发动导弹袭击,致2人死
-
-
今天,特朗普和美国迎来大事件!
4月4日电(王续燃)当地时间4日,全世界的目光都将聚焦在美国纽约曼哈顿——...
- 国际财经 2024-05-09
-
今天,特朗普和美国迎来大事件!
-
-
蔡英文将在洛杉矶同美官员会面,我驻洛杉矶总领馆回应
问:多家媒体报道,台湾地区领导人蔡英文将于4月4日至6日“过境”洛杉矶,...
- 国际财经 2024-05-09
-
蔡英文将在洛杉矶同美官员会面,我驻洛杉矶总领馆回应