最新公告
  • 欢迎您光临欧资源网,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • 智慧医疗的现状与发展趋势——一下场景应用研究

    01、智慧医疗现状

    首先介绍一下智慧医疗的现状:

    1. 前景

    从统计数据可以看出,中国医疗软件市场呈逐年上升趋势,基本保持每年50%的增长速度。据统计,到2025年,全球智慧医疗市场规模将达到275亿美元,其中中国和美国是最发达的两个国家。

    我国存在医疗资源不均衡的问题,急需人工智能的帮助。当前的人工智能正处于从感知到认知的过渡期。在这个过程中,诞生了大量基于感知和分类的医学影像AI应用,比如癌症筛查。新冠疫情的刺激,也加速了智慧医疗产业的发展。政府也制定了一系列利好政策,各大厂商和独角兽企业也开始在AI医疗行业发力。其中,华为云在云计算领域具有天然优势。

    2. 场景应用

    目前,实施相对成熟的智慧医疗项目包括:医学影像诊断、疾病筛查与预测、临床辅助决策、智能病历等。这也说明“AI+医疗”是越来越热的趋势资本市场。从左上近几年投融资的频次分布可以看出,医疗一直是比较热门的领域。涉及的AI技术主要包括:计算机视觉、NLP、语音识别(如案例录入功能)、机器学习等。如右图所示,随着近年来深度学习技术的日益成熟,基于神经网络的算法在医学文献中出现的频率比较高。

    3. 重要事件

    上图展示了智慧医疗发展中重要事件的时间线。早在1960年代,人们就开始尝试建立知识库来模拟医生的诊疗过程。1978年,北京中医院研制出“关有伯肝病”诊治程序;2000年,“达芬奇手术机器人”获批用于腹腔镜手术;2011年,IBM带来了“Doctor Watson”。近年来,随着技术的成熟和市场的活跃,“AI+医疗”产品也异军突起。

    02、核心问题

    下面将分析智慧医疗行业的核心问题,分为以下三个部分:

    1. 行业限制

    首先是行业限制问题。医疗行业本身就不同于其他行业。它的特殊性在于它关系到每个人的健康乃至生命,这使得行业谨慎,导致智慧医疗发展不成熟。近年来,国家也在积极进行政策布局,提出到2023年初步建立医疗领域人工智能标准体系。目前,医疗行业存在较强的“马太效应”,即就是,大城市和前三名医院会吸引大量的资源基于q学习算法和bp神经网络的倒立摆控制,如医生、护士、国家政策、资金等,形成叠加效应。医院)会变得更好,偏远地区则相反,迫切需要人工智能在其中发挥作用。如何将庞大而复杂的医学领域知识和差异化的专家知识融入人工智能算法中,并带来可实现的实用产品,是一个关键问题。还要处理好各方利益分配问题。

    2. 数据

    接下来我们将讨论数据问题。与美国等发达国家相比,我国在健康数据管理方面略显落后,总体上还存在一定差距。国家出台了一些政策来保护用户的健康数据。例如,在数据采集中,需要与数据管理者和患者签订“安全使用协议”;同时,必须经过数据管理者(如医院)伦理委员会的批准才能获得伦理。证明和数据使用主要用于研究目的。此外,还需要面对数据获取后的隐私保护、质量、数据存储和保护等问题。

    3. 算法与算力

    在算法和算力方面,AI一直被认为是接近黑匣子的东西基于q学习算法和bp神经网络的倒立摆控制,尤其是深度学习模型本身在可解释性上存在先天不足,医生希望AI能提供一连串的推理证据,患者也希望结果有来源。并且在数据不足的情况下,算法很难给出小而有差异的输出。此外,近期大模型的排名、算力的消耗、硬件的更新换代,这些都是想要落地智慧医疗行业的科研人员/行业人员所面临的问题。

    从技术的角度来看,正如前面提到的行业知识的重要性,如何将行业知识融入到医学推理任务中,让知识参与计算是我们接下来要讨论的。

    03、领域知识

    从领域知识的表现来看,医学知识图谱和医学预训练模型是不可回避的话题。下面先介绍医学知识图谱。

    1. 医学知识图谱

    医学知识图谱的构建在方法论上与传统的图谱构建没有区别。构建过程主要包括:医学知识本体的设计、医学文本的获取、实体和属性的抽取、关系抽取和知识对齐。

    在知识抽取方法中,大致经历了以下四个阶段:

    该图显示了实体和属性提取的其余两种方法:左图显示了基于深度学习的方法在中文电子病历中提取风险因素实体及其属性的工作;右图显示了基于工作的预训练模型。提取工作。

    对于关系抽取,上图分别展示了我们的三个工作成果:首先是在CNN的模型编码中加入实体的位置信息;二是将语法树结合到 BiLSTM-RNN 的建模框架中。三是通过改变抽取范式将关系抽取转化为实体识别的任务。

    在知识对齐的方法中,基于预训练的知识对齐是当前的研究热点。左图通过计算预训练模型编码的实体表示与字典中标准化实体表示的相似度进行对齐;右图是剑桥大学和亚马逊的研究工作。核心思想是:预训练语义相似的词,模型编码后的相似度高于其他词。该研究使用 UML 数据作为训练集,并通过预训练模型对其进行编码。

    这里有一些比较有影响的中英文医学知识图谱。中文比较有影响的有CMeKG和OMAHA。去年,华为云和浙江大学还构建了“新冠基本信息图谱”(英文),主要考虑基因和蛋白质之间的关系。还有一个比较有影响的英文评价任务I2b2,开创了一系列针对实体(包括一般医学实体(疾病、症状)、药物、时间)和实体之间关系的评价任务。

    bp网络神经算法例子_基于状态观测器直线一级倒立摆控制_基于q学习算法和bp神经网络的倒立摆控制

    2. 医学预训练模型

    自 2018 年 BERT 诞生以来,预训练模型的研究热潮愈演愈烈。领域预训练模型还突出了它们在下游任务中的能力。BioBERT是生物医学领域的预训练模型,以医学文本作为预训练数据进行训练。与一般模型相比,BioBERT 在下游任务中表现不错,比如实体识别、关系抽取、问答等任务都有比较明显的提升。

    MC-BERT 是阿里巴巴开源的领域预训练模型。预训练模型的学习任务是通过对医学实体和医学短语的全覆盖构建的,并且暴露了预训练模型和下游任务的基准数据集。

    MT-BERT结合多个医学下游任务对预训练模型进行微调,多任务学习在预训练模型中也有一定的效果。

    BERT-MK 是华为诺亚实验室的作品。它将知识图中学习到的语义信息通过实体作为中间环节传递给预训练模型,指导预训练模型的参数学习。

    华为云和Noah还提出了知识集成的医学预训练模型,充分利用实体和关系、联合实体掩码任务和关系分类任务这两个重要的知识要素来学习预训练模型的参数。

    04、融合领域知识推理技术

    下面介绍如何将领域知识融入医学推理任务。

    1. 医学知识计算

    AI推理过程通常有两个方面:

    ①知识的推理,即新知识的产生

    在此过程中需要完整的证据链和可解释性。例如明尼苏达团队提出的传统知识补全算法,如TransE、RotatE等方法,补全新冠图,用于发现图中新冠之间的治疗关系,辅助新冠治疗.

    ② 模型训练后的预测

    医学地图的数据一般是稀疏的,因为医学数据比一般数据更珍贵。如何对稀疏数据进行知识补全,上述研究提出了基于预训练模型的领域知识推理,将关系推理转化为数值计算,通过数据计算进行知识推理。

    模型训练后的预测相对实用一些,比如问答、医学文献检索、推荐等排名问题。左图为复旦大学和德州农工大学基于维基百科关键词构建包含疾病知识的句子,对 BERT 进行再训练,提高对下游 QA 任务的效果。右图为亚马逊为新冠科学文献构建图,学习节点表示,根据文献的标题、作者、关键词等构建文章的表示,计算相似度检索文献。

    医学推理任务中的另一个常见问题是分类问题,例如疾病预测和疾病诊断。左图是郑州大学和鹏城实验室提出的基于产科知识图谱的疾病诊断分类。通过提取病例中的实体,将其与产科图谱对齐,根据图谱中的共现概率计算候选疾病,并结合预训练模型对疾病进行诊断和分类。右图是美国德克萨斯大学和鹏城实验室根据超过2000万患者的病历提出的领域预训练模型Med-BERT。提升效果。

    此外,治疗建议也是医疗AI实施的常见场景。图为美国某生物制药公司与IBM提出的一种基于“GNN+预训练模型”的药物推荐方法。通过学习每次咨询的药物和疾病的表示,模仿BERT的语言模型mask和下一句预测,设计了预训练学习目标——药物或疾病的掩蔽和药物预测两个任务,实现了预训练的学习。 – 训练模型和药物使用预测。

    华为还提出了融合预训练模型和知识图谱的医学推理任务框架:预训练模型对患者健康文本进行语义编码,构建患者健康文本的上下文表示;结合知识图谱学习实体表示,分析患者的健康状况。通过实体抽取法提取患者的健康文本,构建患者健康文本的实体表示;结合上下文表示和实体表示,对患者整体的语义信息进行建模/集成,从而构建患者下游任务的模型。

    上图展示了临床决策支持任务的实验结果,包括治疗建议和疾病诊断。以100M参数的BERT为baseline,对比自研领域BERT模型(Domain-Bert)的效果。可以看出,领域知识预训练模型的组合在下游任务上有更好的表现。

    05、精彩问答

    问:Domain-Bert 是如何训练的?模型结构有什么变化吗?数据集的注意事项是什么?

    A:领域预训练模型一般使用RoBERTa这样的框架进行训练。模型结构变化不大,主要结合了中国医疗数据的特点。

    问:客户的年龄和过敏情况在预测药物使用方面是否起作用?

    A:我们在这个问题上做过实验,特别是年龄和性别对吸毒有影响。我们的数据集有大约 3 个百分点的变化。

    Q:预训练时,好的模型召回率是多少?如何确定最佳的预训练样本量?

    A:目前我们模型的召回率是70%-80%,但是召回率的大小还是要看具体的任务,也要看数据的质量,有没有细清洗和预处理工作。关于样本量的问题,一般领域会有一些先例,比先例的数据量大一个数量级比较好。

    问:预训练有多少 GPU 资源?

    答:我们使用了 8 个 V100(32G)。

    Q:数据清洗是否使用预训练模型清洗?

    A:不,数据被清洗后用于模型训练。会使用一些模板/规则来清洗数据,也会使用机器学习的方法来清洗数据,比如MC-BERT,它可以通过弱标注等方法训练数据质量分类模型来判断数据的质量数据。

    站内大部分资源收集于网络,若侵犯了您的合法权益,请联系我们删除!
    欧资源网 » 智慧医疗的现状与发展趋势——一下场景应用研究

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    欧资源网
    一个高级程序员模板开发平台

    发表评论