第二部分:关键模型与架构
-
神经网络核心架构
第三部分:大语言模型与生成式AI
-
相关技术
- 检索增强生成:RAG,结合信息检索和LLM的技术,先从外部知识库检索相关文档,再让LLM基于检索结果生成答案,提高准确性和时效性。
- 微调:Fine-Tuning,在预训练好的基础模型上,使用特定领域的小规模数据集进行额外训练,使其适应特定任务。
- 指令微调:Instruction Tuning,使用(指令,输出)配对的数据进行微调,让模型更好地遵循人类指令。
- 基于人类反馈的强化学习:RLHF,通过人类对模型输出的偏好反馈来训练奖励模型,并用RL进一步优化模型,使其输出更符合人类价值观。
- 上下文长度:模型单次处理(输入+输出)的文本最大长度。
- 令牌:Token,文本被分割成的更小单元(可以是词、子词或字符),是模型处理的基本单位。
第四部分:计算机视觉
- 图像分类:识别图像中的主要对象类别。
- 目标检测:不仅识别物体,还要用边界框定位其在图像中的位置。
- 图像分割:
- 语义分割:为图像中每个像素分类。
- 实例分割:区分同一类别的不同个体实例。
- 生成对抗网络:GAN,包含一个生成器和一个判别器,通过相互对抗来生成逼真数据。
- 扩散模型:当前主流的图像生成模型,通过逐步去噪过程从随机噪声中生成图像。
- 姿态估计:检测图像或视频中人物的关键身体关节位置。
第五部分:其他重要技术
- 嵌入:Embedding,将离散对象(如词、图)映射到低维连续向量空间,捕捉其语义信息。
- 向量数据库:专门用于存储、索引和检索高维向量(嵌入)的数据库,是RAG的关键组件。
- 多模态AI:能够同时处理和整合多种类型信息(如文本、图像、音频)的模型。
- 智能体:Agent,能够感知环境、自主决策并执行行动以实现目标的AI系统。
- 具身智能:Embodied AI,研究拥有物理身体(如机器人)的智能体如何通过与真实世界互动来学习。
- 联邦学习:一种分布式机器学习技术,允许多个客户端在本地训练模型,只共享模型更新而非原始数据,保护隐私。
- 可解释AI:XAI,旨在提高AI模型决策过程的透明度和可理解性。
- AI对齐:确保AI系统的目标、行为与人类价值观和意图保持一致的研究领域。
第六部分:应用与产品形态
- 聊天机器人:基于自然语言处理的对话程序。
- Copilot:特指以“副驾驶”形式嵌入到各类软件中,辅助用户完成工作的AI助手。
- AI绘画/文生图:利用扩散模型等,根据文字描述生成图像的工具。
- 代码补全:基于AI的编程助手,如GitHub Copilot。
- 语音助手:如Siri、Alexa,集成了语音识别、自然语言理解和语音合成技术。
- 推荐系统:利用协同过滤、深度学习等技术,预测用户偏好并推荐内容。
如何使用这份列表:
- 初学者:建议从第一部分和第二部分开始,建立基础认知。
- 关注热点:当前重点可以放在第三部分(LLM与Gen-AI) 和 第五部分的前沿技术。
- 按领域查找:如果您从事CV,重点看第四部分;如果是NLP,重点看第三部分。
AI领域日新月异,此列表涵盖了截至2024年的主流与关键术语,可作为一份实用的快速参考指南。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
