大模型知识地图

本文最后更新于 2024年3月16日 上午

工作后有许多人都问过我学数学的为什么不去做算法?那就跟上现在大模型的潮流,先了解下相关知识,希望将来可以有机会结合Data和AI做一番事情~

大模型应用

llm_ind_chain.png

行业实践

框架开发

易上手

  • RAG: Retrieval Augmented Generation

  • Agent:ReAct vs Tree of Thought

2024-02-18T20:41:34.926175464-ygzubmoy.png

基础大模型

语言大模型

  • 发展历史tree.jpg

  • 数据

    • 规模:Scaling Law

    • 质量:多样性、重复率、混合比例等

  • 预训练

    • 任务:Mask

    • 效率:分布式训练&算子融合&数据IO

    • 稳定:debug&checkpoint

  • SFT

    • PEFT(Parameter-Efficient Fine-Tuning): lora
  • RLHF

    • Reward model

    • 强化学习-PPO

  • 评估

    • 任务:理解&推理&生成

    • 方法:大模型评测大模型

  • 推理

    • 无损优化:backend&fused op

    • 有损优化:量化&剪枝&蒸馏

多模态大模型

  • Vision Transformer(ViT): 打通CV与NLP的壁垒

  • Encoder模式

    • CLIP: 图文对齐有效方式

    • BEIT: 文本、图像走向统一

  • 桥接大语言模型

    • Blip2: Q-Former
  • 视频大模型:时序建模

  • 生成算法

    • 图像

      • GAN

      • VAE

      • Diffusion Model: 加噪声和去噪声过程2024-02-17T21:13:08.948439019-poijshdp.png

    • 视频

      • 3D建模

      • Sora: DiT = VAE 编码器 + ViT + DDPM + VAE 解码器2024-02-17T21:20:42.598478305-rhpjvtmb.png

行业大模型

  • 常识 --> 专业(知识 + 逻辑 + 适当性)

    • 世界知识 --> 领域知识

    • 基础能力 --> 领域能力

  • 代码大模型

  • 金融大模型

基础设施

AI芯片

  • Colossal-AI

  • DeepSpeed

  • Ray


大模型知识地图
https://syntomic.cn/2023/10/21/大模型知识地图/
作者
syntomic
发布于
2023年10月21日
更新于
2024年3月16日
许可协议