文章 2018-03-12 来自:开发者社区

Python3入门机器学习 - 逻辑回归与决策边界

logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。 逻辑回归需要将原本线性回归结果的值域置于(0,1)之间,概率大于0.5看作结果为1 ...

文章 2018-03-10 来自:开发者社区

Python3入门机器学习 - 模型泛化

模型正则化 在多项式回归中如果degree过大,会造成过拟合的情况,导致模型预测方差极大,因此,我们可以使用模型正则化的方式来减小过拟合导致的预测方差极大的问题 即在我们训练模型时,不仅仅需要将预测的y和训练集的y的均方误差达到最小,还要使参数向量最小。(即上图公式。) 使用岭回归达到最小方差 from sklearn.linear_model import ...

文章 2018-03-08 来自:开发者社区

Python3入门机器学习 - 多项式回归与学习曲线

非线性方程的拟合,例如 y=x^2+0.5x+1 , 就是将x^2看作X的一个特征值 #准备数据 import numpy as np import matplotlib.pyplot as plt x = np.random.uniform(-3,3,size=100) X = x.reshape(-1,1) y = 0.5*x**2 + x + 2 +np.random.normal(...

文章 2018-03-07 来自:开发者社区

Python3入门机器学习 - PCA(主成分分析)

主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标(即主成分),其中每个主成分都能够反映原始变量的大部分信息,且所含信息互不重复。这种方法在引进多方面变量的同时将复杂因素归结为几个主成分,使问题简单化,同时得到的结果更加科学有效的数据信息。 使用梯度上升法求解主成分 //准备数据 import numpy as np import matplotli...

文章 2018-02-28 来自:开发者社区

Python3入门机器学习 - 梯度下降法

梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数,即无约束优化问题时,梯度下降(Gradient Descent)是最常采用的方法之一,另一种常用的方法是最小二乘法。在求解损失函数的最小值时,可以通过梯度下降法来一步步的迭代求解,得到最小化的损失函数和模型参数值。 模拟实现梯度下降法 def DJ(theta): //计算损失函数...

文章 2018-02-26 来自:开发者社区

Python3入门机器学习 - 线性回归与knn算法处理boston数据集

简单线性回归 最小二乘法实现原理 最小二乘法公式 使用最小二乘法计算a、b的值,实现线性回归的拟合 # _*_ encoding:utf-8 _*_ import numpy as np class SimpleLinearRegression1: //该类使用for循环方法计算a、b值,效率较低 def __init__(self): self.a_...

文章 2018-02-25 来自:开发者社区

Python3入门机器学习 - GridSearch探索最佳超参数与交叉验证

这次我们依旧使用digits数据集 准备数据 %%time import sklearn.datasets import numpy as np from sklearn.neighbors import KNeighborsClassifier from sklearn.metrics import accuracy_score from sklearn.model_selection imp....

文章 2018-02-23 来自:开发者社区

Python3入门机器学习 - k近邻算法

邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。 数据预备,这里使用random函数生成10*...

文章 2018-02-22 来自:开发者社区

Python3入门机器学习 - 数据可视化基础matplotlib

先上张图 折线图 plt.plot(x,siny,label="sin(x)") plt.plot(x,cosy,color="red",linestyle="--",label="cos(x)") plt.axis([-2,12,-2,2]) //设置横纵坐标范围,也可以使用 plt.xlim(-2,12) plt.ylim(-2,2)来设置 plt.xlabel("x axis...

文章 2018-02-22 来自:开发者社区

Python3入门机器学习 - numpy篇

numpy是python的一个支持矩阵、向量运算的库,由于python自带的list不仅效率低,也不会将数组看作矩阵或者向量,因此在机器学习中,使用numpy来作为操作数组及矩阵的工具 numpy生成数组或矩阵 numpy.array([i for i in range(10)]) numpy.dtype numpy.zeros(10,dtype=int //该参数可选) numpy.zer...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云机器学习平台PAI

阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。

+关注
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等