2026年4月第334页 - 星博讯网络科技知识-SEO优化技巧|AI知识科普|互联网行业干货大全

一、核心思想，什么是降维？

想象你有一组描述一个人的数据,包含身高（米）、体重（公斤）、年龄（岁）、月收入（元）、每日步数、睡眠时长（小时）等上百个特征（维度），这些数据点存在于一个“高维空间”（比如100维）中，降维的核...

星博讯 2026-04-09 51 #降维 #核心思想

核心思想PCA通过找到数据方差最大的方向（主成分）来重新表达数据，使得第一个主成分方向方差最大，后续每个主成分与之前方向正交且方差递减，这样可以用少数主成分近似表示原始高维数据，实现降维和特征提取，数...

星博讯 2026-04-09 60 #主成分分析 #降维

核心假设：流形假设高维观测数据（如图像、文本特征）通常分布在一个低维流形上，例：人脸图像虽由大量像素组成，但受光照、姿态、表情等少数因素控制，本质上可能只有几十个自由度，与线性降维的区别线性方法（如P...

核心思想与动机问题起源：在分类或回归任务中，我们经常遇到数据在原始特征空间（低维空间）中线性不可分的情况，用一条直线无论如何也无法完美分开一个圆圈内的点和圆圈外的点，直觉思路：一个直观的想法是，如果我...

星博讯 2026-04-09 45 #核函数 #高维映射

核心概念与数学定义在一个集合 ( X 中，一个距离度量（或度量函数） ( d(x, y 是一个函数：( X \times X \to [0, \infty ,它必须满足以下四个公理：非负...

星博讯 2026-04-09 45 #距离度量 #数学公理

核心步骤a. 特征表示将现实世界中的对象转化为计算机可以处理的数学对象（通常是向量或集合），示例1（用户画像）：用户A = [年龄: 25, 对科技的喜爱度: 9, 对文艺的喜爱度: 3] ->...

星博讯 2026-04-09 49 #相似度计算 #向量化

基本定义对于一个离散随机变量 (X ，其可能的取值为 (x_1, x_2, \dots, x_n ，对应的概率分布为 (P(X=x_i =p_i （满足 (pi \geq 0 且 (\sum{i=1...

星博讯 2026-04-09 63 #信息熵 #信息论

交叉熵的本质是用一个“估计的分布”Q去描述“真实的分布”P时，所需要的平均信息量（或说造成的平均惊讶度），它衡量的是两个概率分布之间的“距离”或差异，在机器学习中，交叉熵越小，说明我们的预测分布Q越接...

星博讯 2026-04-09 54 #概率分布 #差异

KL 散度是一种用于衡量两个概率分布 P 和 Q 之间差异程度的度量，它量化了“当你用分布 Q 来近似真实分布 P 时，所损失的信息量”或者“产生的额外惊喜度”，直观解释：编码长度的视角想象一下，我...

星博讯 2026-04-09 48 #一句话 #核心思想

极大似然估计是一种在统计学中估计模型参数的方法，它的核心思想非常直观，甚至有点“马后炮”：已经发生的事情，最有可能是由最可能让它发生的那个原因所导致的，换句话说，我们观察到了一组数据（结果），我们假设...