机器学习是人工智能的一个分支,用于更智能地分析数据。它使用特定的算法将流程自动化,以减少流程中的人工干预。
在这个机器学习项目中,我们将使用python来预测房价。这个项目将帮助卖方和买方对形势有一个概览,以便他们可以采取相应的行动。
2022世界杯亚洲区赛程表时间Skyfi实验室为您提供了学习和构建这个项目的最简单的方法。
这里我们要用线性回归来预测房价。简而言之,线性回归是一种机器学习工具,它可以帮助您使用现有数据(基本上是目标数据和其他数据集之间的关系)进行预测。就我们而言,房价主要取决于卧室数量、位置、居住面积大小、附近位置等参数。
项目实施:
1.导入依赖项和库
进口熊猫
进口numpy
Sklearn -它是python的机器学习库
从sklearn linear_model
从sklearn.model_selection train_test_split
(它是一个函数,将我们的数据分为训练集和测试集)
2.现在,为您想要分析的特定位置加载数据集。这里我们将使用来自sklearn.datasets的波士顿住房数据集。现在创建一个名为boston的变量并将其赋值给load_boston()函数。现在用print(Boston)打印
3.下一步是将数据集转换为数据帧。创建变量df_x和df_y。
4.现在从数据集中获取一些统计数据,计数、平均值等。
5.初始化线性回归模型- reg = linear_model. linearregression ()
6.将数据分成67%作为训练数据,33%作为测试数据。
7.现在用我们的训练数据训练模型
8.打印模型中每个特征/列的系数/权重- Print (reg.coef)
9.现在把预测打印在我们的测试数据上。
10.打印实际值- Print (y_test)
11.使用均方误差(MSE)检查模型性能。
12.现在使用MSE和sklearn.metrics检查模型性能。把实际价格和预测价格之间的差异形象化
13.同样训练模型使用各种模型-随机森林回归器,XGBoost回归器,支持向量机回归器,
14.最后,对所有模型进行评估和比较,以得到适当的输出。(根据我的经验,XGBoost Regression最适合这个数据集)
同样,您可以通过导入特定地点的数据来预测各个地点的房价。(你可以从99acres, airbnb, homes.com, trulia, realtor等房地产网站获得数据。
pandas-这是一个为python编写的开源库,用于执行数据分析和操作。
Matplotlib -它是python程序及其数学扩展NumPy的绘图库。
NumPy -它是python的一个包,用于科学计算执行不同的操作。
sklearn/scikit-learn -这是一个在BSD许可下为python编程语言开发的免费机器学习库,主要用于数据分析和数据挖掘。它还支持各种机器学习算法,如支持向量机,随机森林,k邻居等。
软件需求和使用的库:
木星笔记本-在线编辑器
库——pandas, numpy, matplotlib
2022世界杯亚洲区赛程表时间Skyfi实验室帮助学生学习实用的技能通过构建真实的项目。
你可以和朋友一起报名,并在家门口领取工具包
你可以向专家学习,建立可行的项目,向世界展示技能,获得最好的工作。
今天开始!
加入来自36个以上国家的25万多名学生,通过建设项目培养实践技能
24小时内发货。使用在线教程进行构建。
保持更新,并基于最新的技术构建项目