最近看有人发了机器学习的培训挺便宜的,就尝试了一下。

讲的比较基础,很适合入门,用来了解这个行业。即使不从事此行业,用工具去画一个数学模型的图也是好的。

其他的各种机器学习概念,高数离散等数学基础知识都一样,没什么可写的。

只有安装的工具和使用方法,值得记录一下。

1.安装anaconda

到anaconda官网,下载安装就行,不过记住安装的时候选上注册环境变量,要不然使用起来麻烦。

2.安装jupyter notebook

打开命令终端,执行命令conda install jupyter

3.启动jupyter notebook

打开命令终端,执行jupyter notebook,然后发现它会自动打开你的浏览器,显示一个页面。

4.执行程序

(1)把要分析的文件在操作页面上上传,

(2)在右侧有个"new"按钮,点击new->python3

(3)在命令终端上执行机器学习代码:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
#显示前几行
data = pd.read_csv("data/Advertising.csv")
data.head()

#查看列标题
data.columns

#数据可视化
plt.figure(figsize=(16,8))
plt.scatter(data['TV'],data['sales'],c='black')
plt.xlabel("Money spent on TV ads")
plt.ylabel("Sales")
plt.show()

#训练线性回归模型
x = data['TV'].values.reshape(-1,1)
y = data['sales'].values.reshape(-1,1)

reg = LinearRegression()
reg.fit(x,y)

#打印结果
print('a = {:.5}'.format(reg.coef_[0][0]))
print('b = {:.5}'.format(reg.intercept_[0]))

print("线性模型为:Y = {:.5}X + {:.5} ".format(reg.coef_[0][0], reg.intercept_[0]))

#画出预测曲线
predictions = reg.predict(x)
plt.figure(figsize=(16, 8))
plt.scatter(data['TV'], data['sales'], c = 'black')
plt.plot(data['TV'], predictions, c = 'blue', linewidth=2)
plt.xlabel("Money spent on TV ads")
plt.ylabel("Sales")
plt.show()

#预测当投入100亿时的结果
predictions = reg.predict([[100]])
print('投入一亿元的电视广告,预计的销售量为{:.5}亿'.format( predictions[0][0]))

predictions = reg.predict([[100],[200],[300]])
print('投入一亿、二亿、三亿元的电视广告,预计的销售量分别为为{:.5}、{:.5}、{:.5}亿'.format( predictions[0][0], predictions[1][0], predictions[2][0]))

View Code