查看原文
其他

理解了病毒传染模型,就能知道宅在家里为抗击肺炎疫情做出了多大贡献!

傅一平 与数据同行 2021-10-16

这是傅一平的第319篇原创



作者:傅一平

个人微信:fuyipingmnb


“与数据同行”开通了微信群,现已汇聚了3500位小伙伴了,加我为微信好友(微信号:fuyipingmnb)申请即可,会拉你入群,让我们共建一个知识社区。

正文开始

近期武汉传染病传播迅速,这次病毒和SARS病毒存在诸多相似之处,所以大家都在和03年的非典情况做比较。网络上关于武汉肺炎的传播预测已经具有一定热度的是德国哥廷根大学于晓华教授在微博上的一个模型。


这次肺炎是传染病,而传染病的基本数学模型主要研究传染病的传播速度、空间范围、传播途径、动力学机理等问题,以指导对传染病的有效地预防和控制。常见的传染病模型按照传染病类型分为 SI、SIR、SIRS、SEIR 模型等,按照传播机理又分为基于常微分方程、偏微分方程、网络动力学的不同类型。

那么上面提到的这个SIR模型到底有多大的科学性呢?这个模型真的能预测武汉肺炎的发展走势吗?

笔者综合了网上的资料(参考文献见末尾)写了这篇浅显易懂的传染病模型科普文,从中你会学到一些知识,也能发现这些模型存在的不足,从而有利于自己去做出一些判断。

一、模型假设

一般把传染病流行范围内的人群分成如下几类:

1、S 类,易感者 (Susceptible),指未得病者,但缺乏免疫能力,与感染者接触后容易受到感染;

2、E 类,暴露者 (Exposed),指接触过感染者,但暂无能力传染给其他人的人,对潜伏期长的传染病适用;

3、I 类,感病者 (Infective),指染上传染病的人,可以传播给 S 类成员,将其变为 E 类或 I 类成员;

4、R 类,康复者 (Recovered),指被隔离或因病愈而具有免疫力的人。如免疫期有限,R 类成员可以重新变为 S 类。

二、几种常见模型

1、SI模型:在 SI 模型里面,只考虑了易感者和感染者,并且感染者不能够恢复,此类病症有 HIV 等。


2、SIS 模型:除了 HIV 这种比较严重的病之外,还有很多小病是可以恢复并且反复感染的,例如日常的感冒,发烧等。在这种情况下,感染者就有一定的几率重新转化成易感者。如下图所示:


3、SIR 模型

有的时候,感染者在康复了之后,就有了抗体,于是后续就不再会获得此类病症,这种时候,考虑SIS 模型就不合适了,需要考虑 SIR 模型。此类病症有麻疹,腮腺炎,风疹等,于晓华教授采用的就是这个模型。


在以上的 SI,SIS,SIR 模型中,还可以把死亡因素考虑进去。除此之外,还有 SIRS 模型,SEIR 模型等,在这里就不再做赘述。有兴趣的读者可以参阅相关的参考书籍。

你会发现,其实不同的传染病模型是基于不同的传染病类型的假设,如果业务假设错了,可能就谬以千里了。

三、SIR模型的原理

SIR 模型是传染病传播模型中的最经典模型。传播过程大致如下:

最初,所有的人都处于易感染状态(S),也就是还没得这种病。

然后,部分人被传染后,变成感染状态(I),也就是得病了。

这些得病的人可能会传染给其他还没得病的人。或者自行痊愈,成了免疫状态(R),不会再得病。


SIR 模型的数学表达如下:

N(t)=S(t)+I(t)+R(t)=N

其中S(t)表示t时刻的健康人,I(t)表示t时刻的病人,R(t)表示t时刻的痊愈的人,按照SIR模型的假设,人口总数为一个常数N。

可以用微分方程来描述传播过程:

dS/dt=-B*I(t)*S(t)/N

其中,B表示病人的日接触率,如果B=2,表示一个病人每天接触两个人,一个病人每天接触的人可以接触到病人,也可以接触到本来就得病的人。如果接触健康人(S),那就会使其得病;接触病人或者免疫了的人,那就不产生任何效果。

所以,一个病人每天接触的人数是B*I(t),但是只有在接触到健康人时,才会有影响。所以要再乘健康人的比例,才是这个病人每天传染使其得病的健康人数B*I(t)*S(t)/N。

dI/dt=B*I(t)*S(t)/N-Y*I(t)

其中Y表示痊愈率,那么上式的意思是,一天中得病的人减去痊愈的人,就是一天中的病人。

dR/dt=Y*I(t)

求解三个常微分方程组,我们需要初值。也就是在第一天的健康人数目 S(0),病人数目I(0)及痊愈人数目R(0),求解微分方程就可以得到任何一个时间点的健康人数目 S(t),病人数目I(t)及痊愈人数目R(t)。

解这三个微分方程,得到S(t)是严格单调递减函数,当t=80,S(t)=51万左右时,感染人数I(t)最大。

理解了上述原理再看于教授提供的 SIR 模型的计算结果图,就非常清晰了,如下图,你会看到感染者的峰值出现的时间在第 80 天左右。


Beta:就是B=0.2586,一个病人日均接触0.25人

Gamma:就是Y=0.0821,表示病人的痊愈率是0.0821

Susceptible:就是S(0)

Infected:就是I(0)

Recovered:就是R(0)

四、SIR模型的问题

中国科学院院士、中国疾病预防控制中心主任高福就表示,他看到过上述科学家的计算结果,这是一个数学模型,他算出的是数字区间的最大数。

但对于这个数据,高福认为,认识任何一个新生事物,尤其像这样的病毒,一定是“事实是事实,知识理论是理论”。

“现在也出来很多模型。这样的模型是不是和事实相符合,国家卫健委已经把我们的措施和公开透明的疫情公布了。随着大家对这个病毒的认识,会去验证这个模型。目前我们掌握的情况,并不是这位科学家计算的模型情况。”

怎么进一步理解呢?

应该讲,SIR模型一定程度能刻画武汉肺炎的传播趋势,但模型终究仅仅是针对现实的一个模拟,而且这个SIR模型有着明显的缺陷:

1、SIR模型的假设是不考虑人口的出生、死亡、流动等各种群动力因素,人口始终保持一个常数,即N(t)=K,但武汉的疫情人口并不是封闭的,它不是模型的理想情况。

2、这个模型没有考虑潜伏期的问题,事实上,针对潜伏期的传染病,有专门的SEIR模型,这个模型显然是过于简化了,与武汉的疫情事实不符。

3、一个病人一旦与易感者接触就必然具有一定的传染力。假设 t 时刻单位时间内,一个病人能传染的易感者数目与此环境内易感者总数S(t)成正比,比例系数为B,从而在t时刻单位时间内被所有病人传染的人数为BS(t)I(t),由于有超级传播着的存在,这个假设B其实很难成立。

4、SIR模型是基于传染病自然扩散的一个假设,但政府的强力干预会直接影响模型预测的准确程度,比如与03年不同的是,这次政府干预迅速,而且近20年科技发展使得医疗水平有了大幅提升,这些因素都会影响模型的预测准确度。

同时网上对于于晓华教授SIR模型的参数设定也有异议,但无论如何,B(病人的日接触率)这个参数在这个模型中是至关重要的,而降低病人的日接触率的唯一方法就是隔离。

数学老师最后再解释下:

我们把现在的人群分为四种人A、B、C、D。 A是有武汉接触史的,目前500万人,分散在全国各地,容易找出来,现在已经找出来很多了。 A在旅途中遇到过素未平生绝不认识的B,A不知道B的存在,B也不知道A的存在。 A到达目的地后接触了C,无论接触了多少个C,这些C都能够找到,官方已经对他们隔离了。 D是居家没有外出的安全市民。 现在最大的隐患是B,根本找不到,没有人知道谁是B,自己根本不知道自己是B。D只要出门,就有碰到B的可能性,自己也就是2B了。 


因此现在每个人相互隔离的目的就是用时间来筛出B,潜伏期两周,两周之内,B纷纷发病,水落石出。直到所有的B都发完病,并隔离治疗,疫情才能结束。 因此现在采取的所有措施都是减少新B(2B)的产生。 1918年美国的瘟疫采取的是同一种办法。


因此,请坚持到正月十五不要出门,大家宅在家就是对于抗击肺炎疫情的最大贡献。

参考文献:
1、bilibili 自然 《关于传染病的数学模型有哪些?》
2、无雨森 知乎  《关于传染病的数学模型有哪些?》


作者:傅一平 (微信号:fuyipingmnb)

“与数据同行”开通了微信群和QQ群,现已汇聚了3500位小伙伴了,长按以下二维码加入。


笔者也开通了知识星球,欢迎到我的知识星球进行探讨。


近期文章列表

数据挖掘失败的根源

“做好大数据测试,我是认真的!”

美团点评基于 Flink 的实时数仓平台实践

大数据的过去、现在和未来:万字长文解读《大数据四十二条》

阿里巴巴高级算法专家威视:组建技术团队的一些思考

2019年,我的大数据白皮书

中台的末路

数据挖掘的军规

好好学习,好好思考(2019年第一期)

浙江移动数据中台的建设和应用实践

工作六年,我总结了一份数据产品建设指南

五级数据挖掘工程师,你处在哪一级?

不做中台会死吗?

BI(商业智能)的未来?

数据分析的道与术

OPPO数据中台之基石:基于Flink SQL构建实数据仓库

超越BI,数据产品的前途在哪里?

数据中台已成下一风口,它会颠覆数据工程师的工作吗?

数据产品经理,并不是数据 + 产品经理

数据中台不是技术平台,没有标准架构!

如何有效推进百万标签库的治理?

运营商大数据对外价值变现的十大趋势

如何深入浅出的理解数据仓库建模?

艰难的旅程:我们如何用“十步法”完成了一次企业级数据治理的落地?

超越平台,数据中台的业务化、服务化及开放化!


要看更多,请点击左下角阅读原文即可阅读整理好的所有文章!


: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存