世界科技研究与发展 ›› 2024, Vol. 46 ›› Issue (6): 831-849.doi: 10.16507/j.issn.1006-6055.2024.01.001 cstr: 32308.14.1006-6055.2024.01.001
麻笑生1,2,3 刘巍1,2 王思丽1,2 杨恒1,2
MA Xiaosheng1,2,3 LIU Wei1,2 WANG Sili1,2 YANG Heng1,2
摘要: 人工智能和数据驱动的电子健康记录(EHR)挖掘可以发现潜在医学规律和知识,为精准化、个性化医疗决策和健康管理提供高价值情报和技术方法支撑。本文从Web of Science、PubMed以及CNKI数据库中检索相关EHR挖掘的文献,通过可视化发文趋势及关键词共现分析领域研究热点与趋势。在充分了解EHR数据类型和数据库来源的基础上,对科学界现有EHR挖掘技术方法及其优缺点进行归纳总结与对比分析。研究发现,目前EHR挖掘技术可分为基于关联规则、词典和规则相结合、统计机器学习、深度学习四种,其中基于深度学习的EHR数据挖掘技术是当前的研究热点和趋势,可对大规模复杂异构的EHR数据进行高效挖掘和结果预测。总体研究仍存在挖掘结果可解释性差、技术方法单一和融合不足、智能化程度低和可移植性较差、多模态异构数据的表示学习能力不强、在医疗领域实际应用落地困难等问题。未来研究应针对EHR挖掘结果的可解释性、多模态异构数据的强表示性、EHR数据的集成和标准化,以及在临床医疗实践中的可落地性等重点展开研究。此外,随着大语言模型和知识图谱相关技术的快速发展,建议探索其在EHR挖掘领域实际应用的可行性。