翻译翻译，什么叫机器学习贝叶斯算法|什么是机器学习、机器学习可以分为几类_机器人编程

编辑导读：认识世界，就是一个从已知到未知的函数。机器学习，就是预测这个函数，并且使预测结果尽量准确。本文作者围绕机器学习展开讨论，与你分享。

问：谈谈你对机器学习的理解。答：机器学习就是用已知去预测未知。

认识世界，就是一个从已知到未知的函数。收集一大堆数据，然后用它们去预测一个值，就是回归问题。例如数码回收，根据你的机型、机况和行情，给出一个价格走势；从一大堆数据中，找到属于某一类的那些，就是分类问题。例如我们经常使用的验证码，“选出所有带桥的图片”。

机器学习，就是预测这个函数，并且使预测结果尽量准确。当然，这个过程是由算法工程师实现的，策略产品经理需要思考的是怎样用算法的逻辑，去解决业务问题。本文放弃了复杂的定义和公式，尝试用口语化的语言介绍常用算法的逻辑，降低新手产品经理（非技术）的学习成本，并且覆盖尽可能多的工作场景。

一、像树一样决策

决策树（Decision Tree）是一种以树形数据结构来展示决策规则和分类结果的模型，比较接近人类的决策过程。决策树发挥作用，首先要用到看似杂乱无序的已知实例，有2个值可以来形容这些实例。

信息熵：对随机时间不确定的度量，即到底有多杂乱无章。信息增益：事件A的的发生为事件B增加了一些确定性，增量的多少即信息增益。

接下来，你要不断寻找最能将这堆杂乱无章的数据区分开来的特征——即使之区分于其他数据的特质——使用这一特征对数据进行划分。每次选择区分度最高的一个，不断迭代，直到所有特征都被用掉。用最经典的买瓜问题来示例：

这时你就可以通过决策树来判断，下一个西瓜到底该不该买。在这个过程中，有时候需要产品帮助判断什么特征才是最有价值的。你也可以不断发现新的有价值特质，或删除一些多余的特征，将这棵”树“修剪地更加精致。

二、以类聚物，以群分人

所谓”近朱者赤近墨者黑“，虽然我们不了解一个人，但我们了解了他身边的人后，就根据已知信息推测他的性格特征。这也是K近邻模型的原理。在一个空间中，距离样本A最近的K个样本B属于一个类别，那么A也属于这个类别，并且具备这个类别的特征。这里”空间“和”距离“的定义较为复杂，不做展开。

如何选择合适的K值？需要持续训练。如果K们不能很好地归成一类咋办？那我A应该归属于谁呢？有两种判定方式，一种是少数服从多数，哪类最多我属于谁；一种是加权投票，可以根据远近程度加权，越近权重越大。

对于产品而言，在进行用户分层类的项目时，可能会依赖这类算法能力。举个例子，当前我能提供图文、短视频和中长视频三种形式的服务，每种服务下都积累了大量的用户数据。这时由于运营的出色表现，产品涌入了大量新用户，我需要尽快知道他们更适合哪种形式的服务，以提高留存、活跃和转化。

三、完美一刀切

承接上文，面对大量新用户，我想要知道他们哪些对我价值最高，哪些价值稍低，从而采取不同的运营策略。支持向量机模型会是一个好的选择。

假如我有N个特征来形容这批用户，那么构建一个N维的空间，每个用户都能在其中找到自己的坐标。这时我找到一个N-1维的平面，它正好将所有用户分割成2个不同的类别，并且离正负样本的距离最远。

这就是支持向量机模型的基本逻辑，是解决线性不可分问题、非线性问题的利器。

以上三种模型都是根据已知特征，给出一个确定的分类结果（未必准确），我们称之为判别模型。与之相对的是生成模型，它会给出一个最优的猜测结果，同时给出猜测的概率估计值。在一定条件下，它能更好地反映数据分布的全貌。

四、朴素贝叶斯模型

啥叫贝叶斯？贝叶斯就是在已知某条件的前提下，推算某事件发生的概率。它强调我们在预测一个事物前，要根据已有信息推断一个先验概率。用举个例子：如何肿瘤化验结果推断患者是否真正得癌？在计算这个概率之前，我们首先要知道先验概率，即癌症本身的发病率为多少，以及化验检测的准确率是多少。

如上图所示，当你的化验结果是有病时，你实际上只有9%的概率真正患病；而如果你真正患病，也有十万分之一的概率没有被检测出来。

这其实告诉我们，在根据数据进行决策时，要考虑前提条件。例如我们在产品内部新上线了一个“长视频”板块，数据分析发现这一板块下的用户以35-45岁的用户为主，所以我们判断要根据这一年龄阶段的用户去优化UI设计和内容投放。

但考虑到先验概率的问题，我们首先要知道该板块用户的转化概率，即从35岁-45岁的网民转化到我“长视频”板块活跃用户的概率。如果这一概率很高，那么我们可能只是在这一年龄段用户聚集的渠道做了比较多的投放，导致现阶段35-45岁用户较多。我们针对其他年龄用户聚集的渠道，也来一波拉新策略，可能同样获得成功。那么现阶段去调整功能设计和内容策略，就是不合适的。

五、总结

对很多非技术产品经理来说，充斥着数学公式和专业术语的技术语言是很难理解，或理解成本较高的。但实际上，作为一个新手产品经理，还没有深入到具体的业务之前，只需要了解每种技术的实现逻辑即可。从策略的视角去审视技术，而不是让技术限制了你的想象力。树立强烈的目标导向，与技术团队建立良好的沟通关系，可能是更高效的手段。

新手产品经理高效沟通体系的搭建

本文由 @学产品的小学生原创发布于人人都是产品经理。未经许可，禁止转载

题图来自Unsplash，基于CC0协议

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

THE END

翻译翻译，什么叫机器学习贝叶斯算法

翻译翻译，什么叫机器学习贝叶斯算法

机器学习简介腾讯云开发者社区

人工智能导论基础概念提纲询

什么是机器学习分为哪三种

一文读懂什么是机器学习人工智能

机器学习是什么定义类型与应用全解析

文件系统与挂载点使用管理文件存储

深度学习六十问（基础题）博客

什么是机器学习机器学习主要有哪几种类型今天过后你就懂了｜极客云算腾讯云开发者社区

计算力学快讯，第卷，第期计算力学快讯

能实现二分类的机器学习模型什么是二分类模型mobccf的技术博客

三种不同类型的机器学习

机器学习（）谈谈机器学习toooner

深度学习的基础：机器学习入门和数学基础博客

理解生成模型与判别模型腾讯云开发者社区

机器学习概述一如年少模样

关于机器学习中迁移学习的一些看法零壹博弈

算法面经重读：机器学习面试算法梳理腾讯云开发者社区