理解生成模型与判别模型腾讯云开发者社区

我们都知道,对于有监督的机器学习中的分类问题,求解问题的算法可以分为生成模型与判别模型两种类型。但是,究竟什么是生成模型,什么是判别模型?不少书籍和技术文章对这对概念的解释是含糊的。在今天这篇文章中,我们将准确、清晰的解释这一组概念。

第一种定义

对于判别模型和生成模型有两种定义,第一种定义针对的是有监督学习的分类问题。该问题的目标是给定一个样本的向量x(可以是原始数据如图像,声音,也可以是提取出来的特征向量),在这里我们将它称为输入变量,目标是预测出这个样本的类别y即标签值,一般是一个离散的标量,即类别编号。因此算法要解决的核心问题是根据训练样本建立下面这样的映射函数:

对于这个问题,有3种求解思路,下面我们分别介绍。

第一种做法称为生成模型。已知输入变量x和目标变量y,先对它们的联合概率分布p(x, y)建模,然后计算样本属于每一个类的条件概率p(y|x)即类后验概率,按照这个值来完成分类,如将样本分到概率p(y|x)最大的那个类。根据概率论的知识,有:

在这里,p(x, y)为联合概率密度函数,p(x)为样本输入向量x的边缘密度函数。对上面这种做法的直观解释是:我们已知某一个样本具有某种特征x,现在要确定它输入哪个类,而自然的因果关系是,样本之所以具有这种特征x,是因为它属于某一类。例如,我们要根据体重,脚的尺寸这两个特征x来判断一个人是男性还是女性,我们都知道,男性的体重总体来说比女性大,脚的尺寸也更大,因此从逻辑上来说,是因为一个人是男性,因此才有这种大的体重和脚尺寸。而在分类任务中要做的却相反,是给了你这样个特征的样本,让你反推这人是男性还是女性。

联合概率密度函数等于类概率p(y)与类条件概率p(x|y)即先验概率的乘积,即:

将上面两个公式合并起来,有:

这就是贝叶斯公式。它完成了因果转换,我们要完成的是由果推断因,而在训练时我们建立的是因到果的模型及p(x|y),即男性和女性的体重、脚尺寸分别服从的概率分布。

总结起来,生成模型对联合概率p(x, y)建模,根据它,我们可以得到类后验概率p(y|x)。事实上,这种做法不仅仅局限于分类问题,如果将x看做可以观测的变量,y看做不可观测到的变量,只要具有这种特征的问题,我们都可以建立生成模型。

生成模型的典型代表是贝叶斯分类器,它对类条件概率p(x|y)建模,而p(x|y)p(y)就是联合概率p(x, y)。通过贝叶斯公式,根据联合概率又可以得到类后验概率:

如果只用于分类而不需要给出具体的概率值,则分母p(x)对所有类型y都是一样的,只需要计算分子p(x|y)p(y)。如果我们假设每个类y的样本的特征向量x的每个分量相互独立,则可以得到朴素贝叶斯分类器,如果假设每个类的样本服从正态分布,则p(x|y)为正态分布,此时为正态贝叶斯分类器。

生成模型的另外一个典型代表是受限玻尔兹曼机(RBM),这是一种随机性的神经网络,由两类神经元组成(每一类为一个层),量个层之间有连接关系,第一种神经元为可见变量,即可以直接观测到的值v,如图像的每个像素。第二类为隐含变量h,是不能直接观测到的变量,如图像的特征。v和h的联合概率服从玻尔兹曼分布:

根据这个联合概率,我们可以很容易得到条件概率p(x|y)和p(y|x)。例如为了得到p(y|x),可以先求边缘概率p(x),对于离散型随机变量,对y的概率求和,对于连续型随机变量,则为求积分,然后有:

生成模型最显著的一个特征是假设样本向量x服从何种概率分布,如正态分布,均匀分布。

第二种做法称为判别模型。已知输入变量x,它直接对目标变量y的条件概率p(y|x)建模。即计算样本x属于 每一类的概率。注意,这里和生成模型有一个本质的区别,那就是每一假设x服从何种概率分布,而是直接估计出条件概率p(y|x)。

这类模型的典型代表是logistic回归和softmax回归,它们直接对p(y|x)建模,而不对p(x, y)建模,即每一假设x服从何种概率分布。logistic回归用于二分类问题,它直接根据样本x估计出它是正样本的概率:

注意,这里只是直接猜测出了这个概率,而没有假设每个类的样本服从何种概率分布,即没有对p(x|y)或者p(x, y)建模。如果对logistic回归感兴趣,可以阅读SIGAI之前的公众号文章“理解logistic回归”。

softmax回归是logistic回归的多分类版本,它直接估计出一个样本向量x属于k个类中每一个类的概率:

这里预测出的是一个向量,每个分量为样本属于每个类的概率。和logistic回归一样,它是直接预测出了这个条件概率,而没有假设每个类的样本x所服从的概率分布。

第三种做法最直接,分类器根本就不建立概率模型,而是直接得到分类结果,这种是非概率模型,也称为判别模型。它直接根据样本向量x预测出类别编号y:

这类模型的典型代表是决策树,支持向量机,随机森林,kNN算法,AdaBoost算法,xgboost,标准的人工神经网络(包括全连接神经网络,卷积神经网络,循环神经网络等)。如果神经网络的最后一层是softmax变换,即softmax回归,则可以归到第二种情况里,如果没有使用,则是这第三种情况。

支持向量机的预测函数是:

它自始至终没有假设样本向量x服从何种分布,也没有估计类后验概率p(y|x)。这可以看成是一种几何划分的思想,把空间划分成多个部分。如果对支持向量机感兴趣,可以阅读SIGAI之前的公众号文章“用一张图理解支持向量机的脉络”。

类似的,决策树的预测函数时分段常数函数,直接实现从向量x到类别标签y的映射,没有计算任何概率值。如果对决策树感兴趣,可以阅读SIGAI之前的公众号文章“理解决策树”。其他的算法如随机森林,kNN,也是如此。

这类模型没有使用概率的观点进行建模,而是用几何或者分析(函数)的手段建模,如找出分类超平面或者曲面,直接得到映射函数。

一般来说,我们把使用第一种模型的分类器称为生成式分类器,把使用第二种和第三种模型的分类器称为判别式分类器。

第二种定义

除此之外,对生成模型和判别模型还有另外一种定义。生成模型是已知样本的标签值y,对样本的特征向量x的条件概率进行建模,即对条件概率p(x|y)建模,它研究的是每种样本服从何种概率分布。判别模型则刚好相反,已知样本的特征向量x,对样本的标签值y的概率进行建模,即对条件概率p(y|x)建模,这种一般用于分量,即给定样本x,计算它属于每个类的概率。

根据这种定义,生成模型可以用来根据标签值y生成随机的样本数据x。生成对抗网络(GAN)就是典型的例子,它可以生成服从某种概率分布的随机变量,即拟合类条件概率密度函数p(x|y),而此时它的目的不是分类,而是生成样本。事实上,如果我们知道了p(x|y)或者p(x, y),无论是用来做分类,还是用来做数据生成,都是可以的。

而判别模型以及不使用概率模型的判别型分类器则根据样本特征向量x的值判断它的标签值y,即用于判断样本的标签值y。

再次对上期作者Fisher yu以及广大SIGAI小伙伴表示感谢。

THE END
0.机器学习实战学习笔记AiLearning之机器学习基础总结 Logsitic回归 sigmoid阶跃函数: Tanh函数:sigmoid函数变形,且是0均值的:; 寻找最优参数的相关理论 梯度算jvzquC41yy}/lrfpuj{/exr1r1idf==255:9hl
1.什么是机器学习,机器学习概述(新手必看)什么是机器学习,机器学习概述(新手必看) 机器学习(machine learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,简单理解,就是通过训练数据对模型进行训练,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测,如下图所示。jvzquC41e0hjcwhjgpm/pny1xkkx1pgusc;f0qyon
2.机器学习的介绍数据分析机器学习3. 机器学习的分类 根据学习方式的不同,机器学习可以分为以下几类: 监督学习(Supervised Learning):监督学习是指模型在训练过程中,能够获得带有标签的训练数据。标签是指训练数据中每个样本对应的正确输出。通过学习带有标签的训练数据,模型可以学会如何根据输入数据预测输出结果。常见的监督学习任务包括分类和回归。 jvzquC41dnuh0lxfp0tfv8sppaeopw4ctvodnn4fgvgjn|4374684@:6
3.机器学习(深度学习)机器学习在预测和推荐系统中也有广泛的应用,如销售预测、个性化推荐等。协同过滤和基于内容的推荐是常用的技术。 制造业和物联网 物联网(IoT)在制造业中的应用越来越广泛,机器学习可用于处理和分析传感器数据,实现设备预测性维护和质量控制。 能源管理与环境保护 jvzquC41dnuh0lxfp0tfv87523e8:>=343;0c{ykenk0fnyckny03=<::2967
4.机器学习是什么?机器学习分为几类?机器学习是什么?机器学习分为几类? 随着互联网的高速发展,被收集并应用于分析的数据量呈现出爆发式增长,面对如此量级的数据,以及常见的实时利用该数据的需求,仅依靠人工处理难免力不从心,这就催生了所谓的大数据和机器学习系统。 机器学习是一门多领域的交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学 jvzquC41yy}/k}hcuv4dp8sgyu532;5264903=6252;46B<0ujznn
5.人工神经网络进化简史1949年,心理学家唐纳德·赫布在《The Organization of Behavior》论文中描述了神经元学习法则。 人工神经网络更进一步被美国神经学家 Frank Rosenblatt 所发展。他提出了可以模拟人类感知能力的机器,并称之为“感知机”(MLP)。1957年,在 Cornell 航空实验室中,他成功在IBM 704机上完成了感知机的仿真。两年后,他又jvzquC41yy}/lrfpuj{/exr1r165f96gh8682@
6.机器学习入门模型优化与部署:根据评估结果对模型进行优化,如调整模型参数、选择更合适的特征等。优化后的模型可以部署到实际应用中,为用户提供服务。 1.2 机器学习的前景 机器学习作为人工智能的核心技术,在近年来得到了迅速发展,为人类社会各个方面带来了巨大的影响和潜力。,机器学习将在很多领域发挥重要作用,为人类创造更美好的生活。 智能化 jvzquC41dnuh0lxfp0tfv8vsa6;:9>6651gsvrhng1jfvjnnu175;>:333?
7.⭐️机器学习概念步骤分类和实践此外,机器学习算法可以分为监督学习、无监督学习、半监督学习和强化学习等多种类型,这些类型各有其特点和适用场景。机器学习是人工智能 的一个关键分支,它使计算机系统能够在没有明确编程的情况下学习和进步。 二、机器学习步骤 机器学习流程通常包括以下步骤: jvzquC41dnuh0lxfp0tfv8rqncthoxqcpi5bt}neng5eg}fknu525@732;:2
8.什么是Azure机器学习?Azure 机器学习是一种用于加速和管理机器学习项目生命周期的云服务:训练和部署模型,以及管理 MLOps。jvzquC41fqit0vnetqyph}3eqo5{j6hp1c€vtn4ocenjpn2ngcxokwl1uv{ekx4yjcz.k|2on/yuwmnq
9.我是如何准备机器学习竞赛,超详细的综合指南本文旨在为初学者和专家提供一个模板,让他们能够开始学习机器学习竞赛。 从理论上学习机器学习,理解所有这些令人惊叹的算法是很意思的,但最重要的部分是实际应用这些概念。 实践活动可以加强你对概念的理解,并会向你展示仅通过理论无法达到的重大发现。 增强技能的最佳途径是参加现实世界的比赛,在那里你可以找到很多志同jvzquC41yy}/hu~ck0ipo8ftvkimg8ftv:kg;:=h;d>54=j949613@>:8
10.西安思考:“2018国际人工智能院长论坛”专家思想分享个领域。如何用数据科学和机器学习帮助进化算法做复杂优化,关键是如何把数据和其它经验知识运用到进化优化的大环境中去。”通过人脸识别、疫苗选择、生物调控网和工业生产等实例,金耀初教授介绍了将进化计算和机器学习结合的优势:“从优化的角度出发,机器学习基本可以看成是一个优化问题,进化计算可以解决机器学习方法中的不足 jvzquC41krov0nfkct/gmz0ep5jpot132?81:6430nuo
11.机器学习面试笔试知识点1.一棵决策树的生成过程分为以下3个部分 特征选择:指从训练数据中众多的特征中选择一个特征作为当前节点的分裂标准,如何选择特征有着很多不同量化评估标准,从而衍生出不同的决策树算法。 决策树生成:根据选择的特征评估标准,从上至下递归地生成子节点,直到数据集不可分则停止决策树生长。 jvzquC41fg|fnxugt0gmk‚zp0eun1jwvkerf1:886:;:
12.西北工业大学类脑计算前沿学科论坛会议通知本次论坛瞄准脑科学与类脑计算学科国际前沿,围绕我国脑科学与类脑计算战略发展需求,从脑科学与类脑计算领域关键核心技术(脑科学最新进展、类脑模型和算法、脑机交互、仿生计算、深度学习、智能计算、类脑计算芯片和软件等),全方位讨论类脑计算的研究背景、面临的挑战和可能的发展技术路线,追踪学科发展新动态。热忱欢迎jvzquC41|fny{7syrw4ff~3ep1oohx432:905@<60jzn
13.北京大学数学学院2020年秋学期我讲了一次。这门课北大数学学院的本科生和博士生反响应该还是比较好的,因为它是概率、组合、机器学习、理论计算机和统计有关的一个基础课,又比较现代,可以马上用于研究。我下学期(2022年春学期)将开设《理论机器学习》,这个是为博士生首次开设的,我现在正在找教学资料。jvzquC41yy}/ojyj0rqv0niw0et0z‚}y13976;90jvs
14.什么是模型生成器,它的工作原理是怎样的?多类分类数据分类 图像分类图像分类 文本分类文本分类 回归值预测 建议建议 预测预测 例如,将情绪归类为正面或负面的方案属于二元分类任务。 若要详细了解 ML.NET 支持的不同 ML 任务,请参阅ML.NET 中的机器学习任务。 哪个机器学习方案最适合我? 在模型生成器中,你需要选择一个方案。 方案类型取决于尝试进行的jvzquC41fqit0vnetqyph}3eqo5{j6hp1fuupny1ociikwj/nggsprsi1c{uqvq/qxksxrjy
15.字节跳动算法岗武功秘籍(上)(1)实习岗位类 【图像与多媒体算法实习】、【Data搜索部(数据挖掘)实习】、【三维视觉实习】、【自然语言处理实习】、【数据挖掘/搜索/推荐实习】、【效率工程算法实习】、【广告算法实习】、【AI Lab机器学习实习生】、【商业变现部门推荐算法】、【编解码算法工程师实习】 (2)全职岗位类 【AI Lab计算机视觉与深jvzquC41yy}/hu~ck0ipo8ftvkimg8>35