AI基础认知 序列编码是将序列数据(如文本、时间序列等)转换为机器可处理的数值表示的基础技术。以下是常见的序列编码方法及其特点 独热编码(One-Hot Encoding)原理:每个类别用一个长度为词汇表大小的向量表示,只有对应索引位置为1,其余为0,示例:词汇表 {猫, 狗, 鸟} → 猫: [1,0,0], 狗: [0,1... 星博讯 2026-04-09 18 #序列编码 #编码方法
AI基础认知 1.一句话核心定义 词嵌入是将文本中的词语(或更小的单位如字、子词)映射为计算机能够理解和处理的实数向量的技术,这些向量能够捕捉词语的语义(含义)和语法(用法)信息,简单说,它把单词变成一串有意义的数字,为什么要用词嵌入... 星博讯 2026-04-09 20
AI基础认知 一、核心定义,什么是句向量? 句向量,顾名思义,就是一个句子的向量表示,它将可变长度的句子(由多个词语组成)映射成一个固定长度的、稠密的实数向量(通常是一个几百到上千维的数组),你可以把它理解为:句子的“数字指纹”:每个句子都有一... 星博讯 2026-04-09 21 #句向量 #定义