AI基础认知 一句话核心定义 词嵌入是一种将文本中的词(或短语)转换为计算机可以处理的稠密、低维数值向量的技术,这个向量能够捕捉词的语义和语法信息,为什么要词嵌入?—— 从问题出发在计算机看来,文字只是一串符号,为了让计算机“理解... 星博讯 2026-04-09 36 #核心 #定义
AI基础认知 下面我将为你系统地梳理关于句向量的基础认知 核心定义与类比句向量 指的是将一个句子(无论长短)通过某种模型或算法,映射成一个固定长度、稠密的实数向量(即一列数字,[0.23, -0.45, 1.2, ..., 0.89],维度通常是几百到几千)... 星博讯 2026-04-09 18 #句向量基础 #语义表示
AI基础认知 一、核心定义 数据噪声 是指在数据收集、传输或记录过程中,混入的非本质的、随机的、无意义的扰动或误差,它不是数据所代表的真实信号或模式的一部分,而是会干扰、模糊甚至扭曲真实信息的一种“杂质”,一个核心的比喻是:信号... 星博讯 2026-04-09 19 #核心 #定义
AI基础认知 一、是什么?重新定义异常值 异常值不是“错误值”,它是一个“不寻常的值”,其定义高度依赖于业务背景和建模目标,统计定义:在数据分布中,远离其他大部分数据的观测点,常用识别方法有:标准差法:平均值 ± 3倍标准差之外的数据,四分位... 星博讯 2026-04-09 18 #异常值 #重新定义
AI基础认知 假设 df 是你的DataFrame 这是一份清晰的缺失值填充基础指南,涵盖了核心概念、常用方法和实践流程, 为什么要处理缺失值?算法限制:大多数机器学习算法和统计模型(如逻辑回归、SVM、神经网络)无法直接处理包含缺失值的数据,会直接报... 星博讯 2026-04-09 18 #df #DataFrame
AI基础认知 数据标准化是一个多维度概念,核心目标是将数据转化为统一、可比、规范的格式,以提升数据质量、可用性和分析效率。主要分为以下两个层面 统计与机器学习中的数值标准化(核心方法)这是最常用的含义,指通过数学变换消除数据量纲和数量级差异,使不同特征具有可比性,常见方法:Z-Score标准化公式:(x - μ / σ结果:数据均值为0,标... 星博讯 2026-04-09 20 #数据标准化 #数据质量
AI基础认知 1.核心定义与目标 数据归一化 是指将数据按比例缩放,使之落入一个特定的、统一的尺度范围(通常是[0,1]或[-1,1])的过程,根本目标:消除数据特征之间因量纲和尺度不同而带来的消极影响,使不同特征具有可比性,从而确保... 星博讯 2026-04-09 21 #核心定义 #目标
AI基础认知 公式,x x 特征缩放基础特征缩放是数据预处理的关键步骤,用于将数据的不同特征标准化到相似的数值范围,以提高机器学习模型的性能和稳定性,📌 为什么需要特征缩放?当数据特征具有不同量纲或范围时,会出现以下问题:梯度下... 星博讯 2026-04-09 20 #公式 #x x
AI基础认知 这是一个在机器学习和数据处理中非常基础且重要的技术 核心定义独热编码是一种将分类数据(或称类别数据、名义数据)转换为数值数据的方法,它的核心思想是:对于有 N 个可能取值的类别特征,我们创建 N 个新的二进制特征(0或1),对于原始数据中的每一个样本,... 星博讯 2026-04-09 31 #机器学习 #数据处理
AI基础认知 注意,这里映射是自动按大小中的拼音/字母顺序生成的,不一定符合我们的语义顺序! 核心定义标签编码 是一种将分类变量(尤其是有序分类变量或目标变量)转换为数值的数据预处理技术,它为每个唯一的类别分配一个唯一的整数,分类变量、有序、整数转换,主要目的与用途让算法理解:大多数机器学习算... 星博讯 2026-04-09 19 #自动生成 #顺序映射