分析
使用数据挖掘技术进行癌症预测
Atharv Deshpande
![Cancer Prediction using Data Mining technique 使用数据挖掘技术进行癌症预测](https://assets.skyfilabs.com/images/blog/cancer-prediction-using-data-mining-techniques.webp)
简介
如今,数据挖掘在医疗保健领域和工业领域都变得非常重要。数据挖掘主要是通过对数据的分析来预测结果。收集数据、计算数据和分析数据是业务方法中不可分割的部分。我们都知道,数据挖掘在分析和建模方面非常流行,因此本文针对的是使用数据挖掘进行癌症预测。本文主要关注项目实现的后端技术。如果您对这个领域感兴趣,请阅读本文。2022世界杯亚洲区赛程表时间帮助您学习更多的技术,促进您的职业生涯。
阅读更多…
希望在Analytics上构建项目?:
Analytics Kit将发送给您,您可以学习和构建使用教程。你今天就可以免费开始了!
1.使用R进行数据分析
项目描述
本项目侧重于使用ML和数据挖掘实现癌症预测所需的指导方针和基本知识。所以在这里我们使用疾病的历史和疾病的条件和标准。由于它依赖于预测分析,我们必须有训练和测试数据集。甚至我们可以使用一个数据集进行训练和测试。这是一个非常简单的工程二年级学生的项目。谁能通过开发这样一个项目来学习这个概念的实际实施?因此,请按照本文了解项目的主要指导方针。
分析的最新项目
想要培养分析学的实用技能?检查我们最新的项目,并开始免费学习
实施细则
- 第一步是找到一个数据集。你可以很容易地从Kaggle获得数据集,它是数据集集合的最大平台。世界卫生组织或任何私人组织都有许多癌症风险预测的数据集。
- 该数据集包含年龄、性别、卡路里、血压和其他一些与健康相关的属性。
- 然后导入所需的库,如numpy, pandas, matplotlib和seaborn等。
- 这里我们正在使用谷歌的协作笔记本。所以上传数据集非常容易。所以你必须导入我们已经下载的数据集。这些都不需要安装python。你只需要浏览colab控制台的链接
- 数据集中有一个诊断列,其中包含M和B值。M代表恶性,B代表良性。
- 我们必须使用sklearn库对分类数据值进行编码。为了更好地理解,它将把M转换为1,把B转换为0。
- 为了更好地理解,您可以使用海运库绘制图表。另外,获取数据集列之间的相关性。
- 然后将数据集分成75%和25%分别用于训练和测试。对训练和测试数据进行缩放。
- 这里我们使用的是训练和测试数据精度最高的决策树模型。你也可以选择随机森林模型,但首先要检查它的准确性。
- 最后一步是打印预测。因此打印的预测模型精度很高。为了更好地理解,您可以打印预测结果和实际结果。
- 请注意,您可以为训练和测试检查每个模型的准确性,并选择最准确的模型以获得更好的结果。
好处
模型的理解
在Colab平台上练习
下面是癌症风险预测项目的一些基本指导方针。你可以搜索更多关于项目改进的信息。所以请和Skyfi实验室保持联系。2022世界杯亚洲区赛程表时间
你知不知道
2022世界杯亚洲区赛程表时间Skyfi实验室帮助学生学习实用的技能通过构建真实的项目。
你可以和朋友一起报名,并在家门口领取工具包
你可以向专家学习,建立可行的项目,向世界展示技能,获得最好的工作。
今天开始!
使用数据挖掘技术开发癌症预测所需工具包:
通过使用数据挖掘技术进行癌症预测,你将学到的技术:
使用数据挖掘技术进行癌症预测
2022世界杯亚洲区赛程表时间
•发表:2020-08-23•最后更新:2021-05-11