Foundation Model
基础模型是一种经过海量数据预训练的大型人工智能模型,它掌握了通用的知识和能力,可以作为多种具体任务的基础。
它的工作方式
它通常基于Transformer架构,通过分析互联网规模的文本、图像或代码等数据来学习通用的模式和表示。这种预训练使其具备了强大的泛化能力,之后可以通过微调等方法来适应各种下游任务,从而避免了为每个新任务从头训练模型的巨大成本。
示例
- 1.像GPT-4或Claude这样的聊天机器人,其核心就是一个强大的文本基础模型。
- 2.图像生成工具DALL-E或Stable Diffusion,其核心是基于扩散模型构建的图像基础模型。
- 3.代码辅助工具GitHub Copilot,其核心是基于代码数据训练的基础模型。