基于人机协同大数据智能分析系统(GoIN),从患者行为轨迹、疫情发展态势、治疗药物研究等维度对疫情进行回顾分析,结合大数据和人工智能驱动的分析建模手段,实现对疫情传播规律与风险、防控措施效用的深入认识,为*府精准防控、科学防治提供有效决策支持。
患者活动场所分析
对各省市公布的患者行为轨迹数据进行处理(湖北省未公布)数据样例如图1,将数据拆成五类节点处理后如图2。(数据来源:腾讯新闻;截止时间:年2月18日)
省份:province,包含30个省级行*区,不包含湖北、西藏、澳门、台湾,包含香港
城市:city,省级的下一级行*单位(直辖市以下为区),共计个
患者:patient,各省市公布的具体病例活动信息(不包含湖北)共名确诊病例
轨迹事件:track,确诊病例的具体行为轨迹,1名确诊病例有1个或多个行为轨迹,共计条
活动地点:location,确诊病例的活动地点(从患者行为轨迹中提取的,如小区、超市等),1名确认病例有1个或多个活动地点,多个确诊病例可能在同一个地点活动过,共计个活动地点
图1患者行为轨迹数据样例
图2患者行为轨迹五类节点
根据行为轨迹五类节点构建关系图谱
五类节点共四类关系:1)患者与轨迹事件;2)患者与活动地点;3)活动地点与城市;4)城市与省份。图3是构建好的图谱抽取的子图,可以大概反映整个图谱的全貌。
图3行为轨迹图谱子图
行为轨迹图谱的节点重要度分析
节点重要度分析采用PageRank算法进行计算,该算法排名的高低主要依赖以下两个方面:1)某地区公布的具有患者行为轨迹的确诊病例的人数;2)这些确诊病例的活动地点的多少。因此该算法可以从某种层面上反映某地区的疫情严重程度。
注:各地对患者数据的公开程度会影响该排名。
省份层面:黑龙江省、河南省、重庆市、湖南省、四川省、山东省、安徽省、广东省,这些省份排名靠前。以黑龙江省为例,如图4所示,可以看到黑龙江省下属的地级市的患者活动地点(蓝色点)都较多,并且有四个地级市(哈尔滨市、双鸭山市、牡丹江市、七台河市)的患者都在“哈尔滨冰雪大世界”活动过。
图4黑龙江省各市的患者信息
可能大家会有疑问,浙江省的确诊病例在全国排名靠前,为何在这里排名不靠前。经过分析我们发现,如图5,浙江省各市的患者活动轨迹除宁波外都较少,且和其他省比较来看,总体相对较少。这可能是浙江省对民众的活动限制的相对较好,也可能是浙江省对患者的行为轨迹公布的不够详细。
图5浙江省各市的患者信息
城市层面:黑龙江省哈尔滨市、湖南省常德市、河南省商丘市、湖南省株洲市、海南省海口市、河南省信阳市排名比较靠前。以湖南省常德市为例,如图6所示,可以看出常德市的患者活动地点较多,且病例也较多。
图6湖南省各市的患者信息
另外,大家都知道浙江省温州市的疫情相对较为严重,但是在这里排名并不靠前,经过分析,如图7,发现浙江省温州市公布的90名患者行为轨迹中,大多不涉及患者活动地点,只有一处“银泰世贸店”。这可能有两种情况,一是温州市公布的患者行为轨迹不够详细,二是温州市的确诊病例大多为外地输入型病例。
图7浙江省温州市患者信息
患者活动地点层面:珠海站、湖南省株洲市腰潞镇横屋村,黑龙江省双鸭山市友谊县宝胜超市、黑龙江省哈尔滨市九丰家园、惠东万科双月湾、广州南站等地点排名靠前,这些地点确诊病例患者活动较多,可能出现聚集性疫情。注:以上患者活医院,因为一个地方的患者确诊后一般都前医院治疗。以腰潞镇横屋村为例,如图8,就有多名确诊病例在此村逗留过。
图8腰潞镇横屋村患者信息
另外,哈尔滨市九丰家园也出现家庭聚集性疫情。
图9哈尔滨市九丰家园患者信息
行为轨迹图谱的社区发现分析
聚类出的第一大社区,如图10所示,可以看到几乎所有病人都与“医院”相关,并且这些病例的主要活动地点都是在珠三角地区。这是因为这些病例都入住在该院,这印证了为何在节点重要度分析中,“珠海站”“广州南站”为何排名靠前。
图10医院社区
聚类出的第二个社区,几乎所有病例都与“友谊宝盛超市”相关,并且这些病例大多不住在同一个小区,经过对这些病例活动事件的分析,发现他们都曾去“友谊宝盛超市”购物过,因此他们很有可能都是在这家超市感染的疫情。这印证了为何在节点重要度分析中,“友谊宝盛超过”排在患者活动地点第二位。
图11友谊宝盛超市社区
聚类出的第三个社区,可以看到是家庭聚集性疫情,分布是两家苗姓和冉姓家庭,并且这两家还有活动地点的交集,因此病*的家庭性和社区性传播还是值得注意的。
图12家庭聚集性社区
疫情变化时空分析
基于12月1日到2月20日全国疫情数据分析疫情的演变情况:
全国疫情变化层面:看到疫情从武汉向周边城市逐渐扩散。
图13全国疫情变化
湖北疫情变化层面:截止2月20日,襄樊和恩施无确诊病例,武汉周围城市疫情最严重。
图14湖北疫情变化
湖北浙江疫情对比:两个省的疫情模式完全不同,湖北主要从中心城市武汉向外发散,浙江主要从沿海城市温州向内发散。
图15湖北浙江疫情对比
黑龙江河南安徽对比:河南安徽疫情爆发明显比黑龙江早;河南安徽多个城市都较为严重,而黑龙江只有哈尔滨市较为严重。
图16河南安徽黑龙江疫情对比
研究单位和药物关联分析
研究单位活跃度层面:发现当前较为活跃的机构有:华中科技大学同济医学院(其附属的医院医院,一共进行了15项临川课题研究,浙江大医院(从图17可以看到其与国家感染病、传染病诊治重点实验室合作了一个课题,另外,独立进行了8项其它的研究)。
图17研究单位活跃度
研究单位之间的合作层面:发现当前研究合作比较密切的有湖北、天津、医院。如图18,医院、天津中医药大学、医院、医院医院、医院五家单位合作进行了10项临床课题研究。另外,在查看当前活跃度较高的研究单位后,发现湖北、浙江、四川、上海等地的研究单位较多,属于课题研究较为活跃的省份。
图18研究单位合作
对治疗药物及其手段层面:发现研究课题中最受