一种在海量文本数据上训练的AI模型,能够理解和生成人类语言。例如GPT-4、Claude和Llama。
一种使用自注意力机制处理序列数据的神经网络架构,是现代语言模型的基础。
语言模型处理的基本文本单位。一个token可以是一个词、词的一部分或一个字符。
给AI模型的输入文本或指令,用于生成响应。提示工程是编写有效提示词的实践。
在特定数据集上进一步训练预训练模型的过程,使其适应特定任务或领域。
一种将信息检索与文本生成相结合的技术,使AI模型能够访问外部知识库。
AI模型生成听起来合理但实际上不正确或虚构的信息的现象。
语言模型在单次交互中能处理的最大文本量(以token计)。
控制AI模型输出随机性的参数。较低的值产生更确定的响应,较高的值产生更有创意的响应。
文本在高维向量空间中的数值表示,用于语义搜索和相似性比较。
一种假设的AI系统,能够理解、学习和应用知识来完成人类能执行的任何智力任务。
受生物神经网络启发的计算系统,由分层处理信息的互连节点组成。
一种通过逐步去除随机信号中的噪声来创建数据的生成模型。
神经网络中的一个组件,允许模型在产生输出时关注输入的相关部分。
AI模型仅使用其通用知识和任务描述来执行未经明确训练的任务的能力。
一种技术,AI模型仅从提示中提供的少量示例中学习执行任务。
一种使用人类偏好来微调AI模型的训练技术。
能够处理和生成多种类型数据(如文本、图像、音频和视频)的AI模型。
使用训练好的AI模型从新输入数据生成预测或输出的过程。
模型学习到的数据压缩表示,其中相似的项目在数学空间中位置相近。
通过简明定义和示例了解AI术语。
Term: RAG
Retrieval-Augmented Generation...
Term: Temperature
Controls randomness of outputs...
Term: Token
Smallest unit of text a model processes.