Skip to content

大模型应用开发技术

大模型应用开发基于已有的 C/S 架构的客户端服务端技术栈,在前后端分别引入新的组件,推动大模型的能力落地到实际的生产环节中。

  • 2022 年 10 月,GPT 横空出世
  • 2023 年,各大互联网公司纷纷下场,开启大模型竞赛,推出各家的聊天模型
  • 2024 年,RAG 技术和联网搜索逐步成形,大模型的幻觉问题得到初步解决
  • 2025 年,智能体技术提出,模型不只要能回答,更要能动手做
  • 2026 年,大模型应用理论体系已经初具体系之态

短短 3 年,AI 大模型应用技术以野蛮姿态生长,新技术层出不穷,不断加入到已有的技术体系中,逐步形成了一个完整的结构体系。

新组件

大模型开发技术引入了新的组件——模型推理服务组件。目前市面上使用最多的组件就是 vLLM,