机器学习
-
【HMS Core】机器学习服务助力APP快速集成图像分割与上传功能
1、介绍 总览 机器学习服务(ML Kit)提供机器学习套件,为开发者使用机器学习能力开发各类应用,提供优质体验。得益于华为长期技术积累,ML Kit为开发者提供简单易用、服务多样、技术领先的机器学习能力,助力开发者更快更好地开发各类AI应用。 AppGallery Connect(简称AGC)云存储是一种可伸缩、免维护的云端存储服务,可用于存储图片、音…
-
机器学习(五):混合高斯聚类(求聚类标签)+PCA降维(3维降2维)习题
使用混合高斯模型 GMM,计算如下数据点的聚类过程:\(Data = np.array([1,2,6,7])\) 均值初值为:\(\mu_1, \mu_2 = 1, 5\) 权重初值为:\(w_1, w_2 = 0.5, 0.5\) 方差:\(std_1, std_2 = 1, 1\)\(K = 2\) 10 次迭代后数据的聚类标签是多少? 采用python…
-
机器学习:K-means算法进行分类 两种初始化簇中心的方法
一、第一种初始化簇中心的方法:随机产生k个簇中心,保证簇中心的每个维度的取值都在这个纬度所有值的最小值与最大值的左闭右开区间内 import numpy as np class KMeans_1: def __init__(self,k_clusters,tol=1e-4,max_iter=300): self.k_clusters=k_clusters s…
-
One-Hot编码(转) 机器学习:数据预处理之独热编码(One-Hot)
前言 ———————————————————————————————————————— 在机器学习算法中,我们经常会遇到分类特征,例如:人的性别有男女,祖国有中国,美国,法国等。这些特征值并不是连续的,而是离散的,无序的。通常我们需要对其进行特征数字化。 那什么是特征数字化呢?例子如下: 性别特征:[“男”,”女”] 祖国特征:[“中国”,”美国,”法国”]…
-
DBSCAN聚类算法——机器学习(理论+图解+python代码)
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法,它是一种基于高密度连通区域的、基于密度的聚类算法,能够将具有足够高密度的区域划分为簇,并在具有噪声的数据中发现任意形状的簇。 基本概念: minPts = 3 基于密度的聚类中的密度可达和密度相连性 …
-
Python_sklearn机器学习库学习笔记(五)k-means(聚类)
# K的选择:肘部法则 如果问题中没有指定 的值,可以通过肘部法则这一技术来估计聚类数量。肘部法则会把不同 值的成本函数值画出来。随着 值的增大,平均畸变程度会减小;每个类包含的样本数会减少,于是样本离其重心会更近。但是,随着 值继续增大,平均畸变程度的改善效果会不断减低。 值增大过程中,畸变程度的改善效果下降幅度最大的位置对应的 值就是肘部。 import…
-
【模式识别与机器学习】——4.3离散K-L变换
全称:Karhunen-Loeve变换(卡洛南-洛伊变换) 前面讨论的特征选择是在一定准则下,从n个特征中选出k个来反映原有模式。 这种简单删掉某n-k个特征的做法并不十分理想,因为一般来说,原来的n个数据各自在不同程度上反映了识别对象的某些特征,简单地删去某些特征可能会丢失较多的有用信息。 如果将原来的特征做正交变换,获得的每个数据都是原来n个数据…
-
【模式识别与机器学习】——3.2广义线性判别函数
线性判别函数简单,容易实现; 非线性判别函数复杂,不容易实现; 若能将非线性判别函数转换为线性判别函数,则有利于模式分类的实现。 基本思想 设有一个训练用的模式集{x},在模式空间x中线性不可分,但在模式空间x*中线性可分,其中x*的各个分量是x的单值实函数,x*的维数k高于x的维数n,即若取 x* = (f1(x), f2(x), …., f…
-
2018百词斩暑期实习笔试-机器学习算法岗位
百词斩这次题目不是很难,但是时间比较紧张,3道编程题60分钟,接下来放上编程题: 第一题 求数组的可达路径,有点类似于《剑指offer》上机器人运动路径,目测使用动态规划,但是具体怎么做我还没想好,先放着 第二题: 求字符串的最小编辑距离,题目还是很经典,但是时间不够了,没有完全完成,网上类似的题目很多,思路也比较明确,就是动态规划,只是输入输出需要…
-
【火炉炼AI】机器学习007-用随机森林构建共享单车需求预测模型
【火炉炼AI】机器学习007-用随机森林构建共享单车需求预测模型 (本文所使用的Python库和版本号: Python 3.5, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 ) 共享单车是最近几年才发展起来的一种便民交通工具,基本上是我等屌丝上班,下班,相亲,泡妞必备神器。本项目拟使用随机森林回归器构建共享单车…