机器学习是一种教会计算机执行人类或动物所做的动作的技术(基本上是从经验中学习)。使用机器学习,你可以分析大量的数据,得到几乎准确的结果。
在这个机器学习项目中,您将了解如何使用机器学习预测冠状病毒/COVID-19疫情。你也可以用同样的方法来预测其他流行病,如疟疾、登革热、猪流感、SARS等。最近,冠状病毒在全球造成了巨大影响,感染了数以万计的人,杀死了数千人。
机器学习工具包将发送给您,您可以学习和构建使用教程。你今天就可以免费开始了!
在机器学习中有两种类型,一种是监督学习和非监督学习。监督学习建立基于输入和输出的预测模型。无监督学习仅从输入数据发展模型。
大纲:在这里,我们将使用支持向量机模型和线性回归方法,通过图表和图形来预测未来10天不同地区冠状病毒的爆发。
冠状病毒没有从一个宿主转移到另一个宿主的能力。但一旦它进入宿主体内,它就能自我繁殖。因此,通过考虑上述场景,我们可以得出结论,它是通过物理网络传播的。
在我们的例子中,有两个因素创建了物理网络:
人口密度:大城市等人口密度高的地区增加了人与人之间的接触,增加了疾病在人与人之间传播的风险。
热点:它是一个有更多的人的吸引力的地方,如购物中心,剧院,游乐园,机场等。
项目实施
1.将必要的库导入jupyter笔记本。库,例如
Numpy, pandas -用于数值计算和操作
Matplotlib -用于可视化数据
数学,时间,sklearn,日期时间,运算符等。
2.导入数据集——confirmed_cases、deaths_reporting、recovered_cases(可以从www.kaggle.com下载数据集)
3.使用.keys()函数从confirmed_cases数据集中提取所有列名
4.使用.loc()函数只从所有三个数据集中提取日期列。
5.找出确诊病例、死亡病例和康复病例总数,并计算总死亡率。
6.现在使用np以numpy数组的形式转换所有日期和案例。数组函数。
7.因为我们要预测未来10天的病例数把过去10天加到我们的总天数里。
8.使用不同的图表和图形可视化数据,以检查冠状病毒的影响,为了可视化提取所有三个数据集的最后一列值。
9.使用.unique()函数查找各个国家的列表,并计算各个国家的确诊病例总数。
10.现在查找每个省/州/市的确诊病例数,并将已标记为省或州的国家分类为离群值。
11.绘制图表以查看不同国家的确诊病例总数。
12.你也可以通过另一张图表来比较中国和国外的确诊病例。
13.现在,用柱状图或饼状图来看看确诊冠状病毒病例数量最多的前10个国家。
14.让我们开始使用支持向量机算法构建模型。它使用不同的参数来建立模型,如kernel, c, gamma, epsilon, shrink和svm_grid。
内核-它指定了算法中使用的内核类型(linear, poly, rbf, sigmoid)
c-正则化参数
γ- rbf, sigmoid, gamma等的核系数
15.使用RandomizedSearchCV函数通过传递必要的参数来构建模型。最后,使用svm.search.fit()函数对数据进行拟合。
16.您可以使用svm_search找到最佳估计器。最佳估计函数,并使用svm_confirmed预测未来的预测。预测功能
17.通过在svm_test_pred数据和y_test_confirmed数据之间创建一个图来检查测试数据的值,然后打印平均绝对误差和平均平方值。
18.然后根据你的意愿绘制冠状病毒病例的总数。接下来绘制确诊冠状病毒病例总数和支持向量机预测病例之间的图表。
19.使用支持向量机算法预测未来10天的病例数量。
使用线性回归模型
通过使用机器学习,你可以可视化很多东西的数据和图表,但缺点是高的错误敏感性,导致在预测中出现错误。
2022世界杯亚洲区赛程表时间Skyfi实验室帮助学生学习实用技能通过构建真实的项目。
你可以和朋友一起报名,并在家门口领取工具包
你可以向专家学习,建立可行的项目,向世界展示技能,获得最好的工作。
今天就开始吧!
加入来自36个以上国家的25万多名学生,通过建设项目培养实践技能
24小时内发货。使用在线教程进行构建。
保持更新,并基于最新的技术构建项目