这篇文章所介绍的大模型,主要特指大规模语言模型,即Large Language Model[1],简称LLM。
LLM是一类在语言理解和生成方面表现卓越的人工智能模型,通常具有高度的自我学习能力和自我适应能力。常见的LLM包括GPT类(Generative Pre-trained Transformer,Decoder结构),T5类(Encoder+Decoder结构)等。这些模型通过在大量语料上进行预训练,能够获得更高的语言理解和生成能力,并可以应用于各种自然语言处理任务,如机器翻译、问答系统、文本分类等。