AI基础认知 一、核心思想,什么是降维? 想象你有一组描述一个人的数据,包含 身高(米)、体重(公斤)、年龄(岁)、月收入(元)、每日步数、睡眠时长(小时) 等上百个特征(维度),这些数据点存在于一个“高维空间”(比如100维)中,降维 的核... 星博讯 2026-04-09 20 #降维 #核心思想
AI基础认知 主成分分析(PCA)是一种常用的无监督线性降维方法,旨在通过正交变换将原始特征转换为一系列线性不相关的主成分,并保留数据中的主要变异信息 核心思想PCA通过找到数据方差最大的方向(主成分)来重新表达数据,使得第一个主成分方向方差最大,后续每个主成分与之前方向正交且方差递减,这样可以用少数主成分近似表示原始高维数据,实现降维和特征提取,数... 星博讯 2026-04-09 16 #主成分分析 #降维
AI基础认知 流形学习(Manifold Learning)是一类基于流形假设的非线性降维技术,核心思想是发现高维数据中内在的低维几何结构,并实现有效表示。以下为基础认知要点 核心假设:流形假设高维观测数据(如图像、文本特征)通常分布在一个低维流形上,例:人脸图像虽由大量像素组成,但受光照、姿态、表情等少数因素控制,本质上可能只有几十个自由度,与线性降维的区别线性方法(如P... 星博讯 2026-04-09 15 #流形学习 #非线性降维
AI基础认知 核函数是机器学习,尤其是支持向量机(SVM)中一个非常核心且强大的工具。它的核心思想是 低维不可分,映射到高维就可能变得可分 核心思想与动机问题起源:在分类或回归任务中,我们经常遇到数据在原始特征空间(低维空间)中线性不可分的情况,用一条直线无论如何也无法完美分开一个圆圈内的点和圆圈外的点,直觉思路:一个直观的想法是,如果我... 星博讯 2026-04-09 16 #核函数 #高维映射
AI基础认知 简单来说,距离度量 是定义在一个集合上的一个函数,它量化了该集合中任意两个元素之间的差异或远近。一个有效的距离度量必须满足一些基本的数学公理 核心概念与数学定义在一个集合 ( X 中,一个距离度量(或度量函数) ( d(x, y 是一个函数:( X \times X \to [0, \infty ,它必须满足以下四个公理:非负... 星博讯 2026-04-09 14 #距离度量 #数学公理
AI基础认知 相似度计算的核心思想是,将对象(物品、用户、文本、图像等)量化为数学上可计算的形式(通常是向量)然后定义一个度量函数,来计算两个向量之间的距离或相似程度 核心步骤a. 特征表示将现实世界中的对象转化为计算机可以处理的数学对象(通常是向量或集合),示例1(用户画像):用户A = [年龄: 25, 对科技的喜爱度: 9, 对文艺的喜爱度: 3] ->... 星博讯 2026-04-09 17 #相似度计算 #向量化
AI基础认知 信息熵是信息论中最核心的概念,用于量化信息的不确定性或随机性。它由克劳德·香农于1948年提出,是通信、数据压缩、密码学、机器学习等领域的理论基础 基本定义对于一个离散随机变量 (X ,其可能的取值为 (x_1, x_2, \dots, x_n ,对应的概率分布为 (P(X=x_i =p_i (满足 (pi \geq 0 且 (\sum{i=1... 星博讯 2026-04-09 20 #信息熵 #信息论
AI基础认知 一、核心思想,衡量两个概率分布的差异 交叉熵的本质是用一个“估计的分布”Q去描述“真实的分布”P时,所需要的平均信息量(或说造成的平均惊讶度),它衡量的是两个概率分布之间的“距离”或差异,在机器学习中,交叉熵越小,说明我们的预测分布Q越接... 星博讯 2026-04-09 21 #概率分布 #差异
AI基础认知 1.一句话核心思想 KL 散度 是一种用于衡量两个概率分布 P 和 Q 之间差异程度的度量,它量化了“当你用分布 Q 来近似真实分布 P 时,所损失的信息量”或者“产生的额外惊喜度”,直观解释:编码长度的视角想象一下,我... 星博讯 2026-04-09 19 #一句话 #核心思想
AI基础认知 一、核心思想,用结果反推原因 极大似然估计是一种在统计学中估计模型参数的方法,它的核心思想非常直观,甚至有点“马后炮”:已经发生的事情,最有可能是由最可能让它发生的那个原因所导致的,换句话说,我们观察到了一组数据(结果),我们假设... 星博讯 2026-04-09 20 #核心思想 #结果反推原因