首页/术语表/Embedding

Embedding

Embedding(嵌入)是一种将文字、图片或声音等复杂信息,转换为一串计算机能理解的数字(即向量)的技术。你可以把它想象成给每个概念或物体分配一个独特的“数字身份证”,方便AI进行比较和计算。

它的工作方式

它的工作原理是,通过AI模型分析数据,将语义相近的事物(如“国王”和“王后”)映射到数字空间中彼此靠近的位置。这种表示方法至关重要,因为它让计算机能够“理解”并处理非结构化的文本、图像等信息,是许多AI应用的基础。

示例

  • 1.在搜索引擎中,将你的搜索词和网页内容都转换为Embedding,从而快速找到语义最相关的结果。
  • 2.在推荐系统中,将电影、商品或歌曲转换为Embedding,根据你的喜好推荐相似的内容。
  • 3.在大语言模型(LLM)中,将输入的词语转换为Embedding,作为模型理解并生成回复的第一步。