大模型应用开发技术

大模型应用开发基于已有的 C/S 架构的客户端和服务端技术栈，在前后端分别引入新的组件，推动大模型的能力落地到实际的生产环节中。

2022 年 10 月，GPT 横空出世
2023 年，各大互联网公司纷纷下场，开启大模型竞赛，推出各家的聊天模型
2024 年，RAG 技术和联网搜索逐步成形，大模型的幻觉问题得到初步解决
2025 年，智能体技术提出，模型不只要能回答，更要能动手做
2026 年，大模型应用理论体系已经初具体系之态

短短 3 年，AI 大模型应用技术以野蛮姿态生长，新技术层出不穷，不断加入到已有的技术体系中，逐步形成了一个完整的结构体系。

新组件

大模型开发技术引入了新的组件——模型推理服务组件。目前市面上使用最多的组件就是 vLLM，