hjk-airl Archives - Python技术站

Python开发

【机器学习】数据准备–python爬虫

前言我们在学习机器学习相关内容时，一般是不需要我们自己去爬取数据的，因为很多的算法学习很友好的帮助我们打包好了相关数据，但是这并不代表我们不需要进行学习和了解相关知识。在这里我们了解三种数据的爬取：鲜花/明星图像的爬取、中国艺人图像的爬取、股票数据的爬取。分别对着三种爬虫进行学习和使用。体会个人感觉爬虫的难点就是URL的获取，URL的获取与自身的经验有…

2023年4月2日

000

Python开发

【机器学习】线性回归预测

前言回归分析就是用于预测输入变量（自变量）和输出变量（因变量）之间的关系，特别当输入的值发生变化时，输出变量值也发生改变！回归简单来说就是对数据进行拟合。线性回归就是通过线性的函数对数据进行拟合。机器学习并不能实现预言，只能实现简单的预测。我们这次对房价关于其他因素的关系。波士顿房价预测下载相关数据集数据集是506行14列的波士顿房价数据集，数据集是…

2023年4月2日

000

Python开发

【机器学习】K-means聚类分析

前言聚类问题是无监督学习的问题，算法思想就是物以类聚，人以群分，聚类算法感知样本间的相似度，进行类别归纳，对新输入进行输出预测，输出变量取有限个离散值。本次我们使用两种方法对鸢尾花数据进行聚类。无监督就是没有标签的进行分类 K-means 聚类算法 K-means聚类算法（k-均值或k-平均）聚类算法。算法思想就是首先随机确定k个中心点作为聚类中心，然后…

2023年4月2日

000

Python开发

【机器学习】手写数字识别

前言 logistic回归，是一个分类算法，可以处理二元分类，多元分类。我们使用sklearn中的logistic对手写数字识别进行实践。数据集 MNIST数据集来自美国国家标准与技术研究所，训练集由250个不同人手写数字构成，50%高中学生，50%来自人口普查局。数据集展示数据集下载百度云盘：链接：https://pan.baidu.com/s/1…

2023年4月2日

000

Python开发

【机器学习】支持向量机分类

前言支持向量机是一类按监督学习方式对数据进行二元分类的广义线性分类器，其决策边界是对学习样本求解的最大边距超平面。SVM尝试寻找一个最优决策边界，使距离两个类别最近的样本最远。SVM使用铰链损失函数计算经验风险并在求解系统中加入了正则化项以优化结构风险，是一个具有稀疏性和稳健性的分类器。SVM可以通过核方法（kernel method）进行非线性分类，是…

2023年4月2日

000

Python开发

【深度学习】DNN房价预测

前言我们使用深度学习网络实现波士顿房价预测，深度学习的目的就是寻找一个合适的函数输出我们想要的结果。深度学习实际上是机器学习领域中一个研究方向，深度学习的目标是让机器能够像人一样具有分析学习的能力，能够识别文字、图像、声音等数据。我认为深度学习与机器学习最主要的区别就是神经元。深度学习中重要内容建立模型——神经元基本构造一个神经元对应一组权重w，a…

2023年4月2日

000