临床大数据系统的研发与应用

地区：上海市宝山区

关键词：上海柯林布瑞信息技术有限公司;复旦大学附属肿瘤医院;上海致腾禾景信息技术有限公司

成果类型：其它

成果领域：生物与新医药

成果编号：A2021061000001317

成果描述：

医学的发展有经验医学、循证医学、精准医学三个阶段，现阶段处于循证医学到精准医学跨越的关键时段。精准医学需要基因组学和临床大数据的支撑。在美国，基于大数据挖掘和分析方法的生物医学研究已经在促进人类健康方面取得了巨大成就。在中国，在基因组学方面开始已经有一些基础，深圳国家基因库样本量840万份。然而，在临床大数据方面，中国处于“一穷二白”的状态。医疗信息化发展二十多年来，业务系统分步建成后产生了大量的“孤岛数据”，数据没清洗、没整合、没加工，数据难搜索、难分析、难利用。该项目有几下关键创新点：首创了基于国际标准HL72.5结合国内标准的临床大数据建模方法在医院信息化过程中，行业标准的制订滞后于业务系统的建设，导致医院中的信息系统没有标准、“百花齐放”。在整合建设临床大数据过程中，需要有一套符合行业标准又能涵盖所有临床数据元的数据模型。该项目结合国际标准HL72.5,并结合国内行业标准如《电子病历基本架构与数据标准》、《卫生信息数据元目录》、《中医药文献元数据》等，建立了一套满足国际标准又契合中国医学特色的数据模型；首创了基于SNOMED CT术语集的临床大数据文本式数据的分词及后结构化处理方法临床大数据有关系型数据库、XML、文本、影像等各种形态，如电子病历的数据，有完全非结构化的数据、有半结构化的数据，这些数据如果要利用，就必须通过一种方法能够进行分词及后结构化处理。该项目基于SNOMED CT术语集，通过分词技术、语料训练机技术实现了对临床大数据文本式数据的分词及后结构化处理，把医院杂乱的文本数据加工成“数据宝藏”。首创了基于互联网搜索引擎技术Solr的二次开发进行临床大数据的搜索方法该项目通过在互联网搜索引擎技术Solr基础进行二次开发，实现了“跨异构”数据的快速搜索，从百亿级规模的临床大数据中复杂条件、跨异构数据搜索响应时间在3秒以内；通过临床大数据搜索技术，把临床科研人员从繁重的“翻病案”工作中解脱出来，工作效率提高几十倍。首创了基于自然语言处理技术自动分析临床病历及医学文献的方法项目组采用自然语言处理技术结合机器学习算法，以SNOMED CT为术语支撑，建立了一套以全自动以海量病历及医学文献为基础临床决策知识模型。只要输入患者的客观临床数据，该模型自动从海量库中找到最佳的治疗方案及相关的毒副作用及不良反应。首创了基于临床大数据的预测模型的建立方法该项目基于医院近5年的门诊、住院的就诊数据，用HoltWinters模型、广义线性模型等模型，对医院的各就诊节点的排队时间及就诊时间进行预测，帮助管理人员提前了解未来患者就诊的“瓶颈”点，及时进行流程优化布局。该项目获授权软件著作权16项，发表SCI论文2篇，发表核心期刊论文1篇，出版专著1部。项目研发成果在复旦大学附属肿瘤医院、上海中医药大学附属龙华医院、上海市质子重离子医院、上海交通大学附属国际和平妇幼保健院、第三军医大学第一附属医院等大型三甲医院。近三年来新增销售额2212万元。

需求匹配

临床大数据系统的研发与应用

沪ICP备2021009587号-1 沪公网安备 31010402009217号