新华社伦敦5月28日电(记者郭爽)研究人员日前在美国《科学公共图书馆·生物学》杂志发表的一项最新研究中说,科学文献正面临被大量基于公开数据、且易于利用人工智能工具处理的误导性生物医学论文淹没的风险。
在这项研究中,来自英国萨里大学等机构的科研人员重点分析了341篇基于美国全国健康和营养调查的数据的研究论文。全国健康和营养调查是一个开放数据集,收集了数千名美国人的健康、饮食和生活方式数据。这些论文于2014年至2024年间发表在147份由前沿传媒公司、埃尔斯维尔和施普林格·自然集团等多家出版商出版的期刊上。
图片来源于网络,如有侵权,请联系删除
分析结果显示,这些论文似乎都遵循类似的范式,即将一个变量(例如维生素D水平或睡眠质量)与抑郁症或心脏病等复杂疾病联系起来,但忽略了这些疾病由多种因素引发的事实。
研究人员发现,许多论文中提出的关联性经不起统计学的检验,而且有些研究中的数据似乎是精心挑选的。就时间趋势而言,研究人员发现从2014年到2021年,平均每年约有4篇基于该数据集的论文发表,但2024年仅截至当年10月9日就有190篇发表。
研究人员认为,2022年起,大语言模型开始变得更加复杂和主流,而美国全国健康和营养调查的数据集公开可用,可以插入编码或人工智能系统进行分析,这可能导致过去两年基于这些数据的研究大幅增加。
研究共同作者、萨里大学生物医学专家马特·斯皮克说,一些极其公式化的论文发表率激增,而这些论文很容易由大语言模型生成。
【纠错】 【责任编辑:赵文涵】-
新华全媒头条丨经济大省挑大梁观察
- 财经观察丨落地逾7个月 支持资本市场2项新工具有何进展
- 新华全媒+丨腾仓备库迎夏收 河南全力保障新粮归仓
- 新华视点丨“几元绕开限制”,谁在诱导孩子沉迷网游?
- 新华每日电讯丨透视深圳宝安高质量发展新活力
- 追光丨他们,会成为国乒的“拦路虎”吗?
- 国际观察丨德国战后首次大规模海外驻军传递什么信号
-
中美啦啦操青少年以“舞”会友
-
昔日悬崖求学 今朝返乡行医
推荐阅读:
《中国商业医疗险发展蓝皮书》:一半保民会为家人投保,年轻保民满意度超70%
抖音直播持续强化暑期保护 未成年人打赏平均21小时内全额垫赔
高通推出全新骁龙座舱至尊版平台和Snapdragon Ride至尊版平台