大模型

SFT 模型预训练 -----transformer

RLHF 针对输出偏好 ----如符合人类价值观的的训练、纠正

规模大、参数大

适应性强、灵活

广泛数据集的预训练 --资源珍贵、需成百上千的知识数据进行训练

计算资源需求大

专注于处理NLP,处理语言、文章、自然语言基于深度学习矿建（transfomer）

deepseek openai grok qwen

视觉、音频

将段落句子分为更小的分词（token）

词粒度 English

字符粒度中文

字词粒度分词分的更细处理网络用语、专有名词

分词之后会给到tokenid 供计算机使用

生成文本过程

根据提示token，预测下一个最有可能的token,加入到输入序列中输入大模型

知识问答、智能助手、、、、、

如果觉得文章对你有用，请随意赞赏

LLM

大模型

Administrator

2025-03-24

2025-03-24

CC BY 4.0