装机
软件层的开发者,通常不参与硬件的设计和开发,但是需要软件开发者能够识别和辨认当前市场上的硬件设备的基本参数和发展进度,充分了解硬件设备的能力边界,从而有助于更好地开发相对应平台的软件,同时也避免被割韭菜。
对于嵌入式开发,充分了解各种硬件的市场情况是压缩生产成本的必要环节。
硬件组成
主板(Motherboard / Mainboard)
支持多 CPU 插槽、大量内存插槽、PCIe 通道,一般使用 SSI-EEB / EATX / Proprietary 规格;
CPU
服务器用的 CPU 多为多核、高缓存、支持多路(multi-socket)的型号。支持 ECC、NUMA、硬件虚拟化(VT-x/AMD-V)、大内存寻址。
Intel:Xeon 系列(如 Xeon Silver/Gold/Platinum); AMD:EPYC 系列(Rome、Milan、Genoa 等); ARM:Ampere Altra、华为鲲鹏等;
内存(RAM)
类型:ECC RDIMM / LRDIMM / ECC DDR5; ECC(Error-Correcting Code)能自动纠正单比特错误,保证系统长时间运行稳定; 服务器通常有 8~32 个 DIMM 槽,支持数百 GB 到 TB 级内存;
NUMA 架构下不同 CPU 拥有自己的内存控制器与内存通道
硬盘
HDD(机械盘):便宜,大容量,适合归档或冷数据; SATA SSD:中速存储,适合系统盘或通用业务; NVMe SSD:高速 PCIe 通道直连,AI、数据库、虚拟化场景首选;
通常由 RAID 控制器 管理(硬 RAID / 软 RAID),支持 RAID 0/1/5/10 等
RAID 控制器(Storage Controller)
负责磁盘阵列、缓存、掉电保护等;有些主板自带基础 RAID 功能(Intel VROC / AMD NVMe RAID);
网卡(NIC)
千兆/万兆/25G/100G Ethernet,部分主板带双口 Intel i350、X550 或 Broadcom 控制器,高端服务器可配光纤/InfiniBand 网络卡(用于 HPC 或 GPU 集群)。
加速卡
- GPU:通用计算(AI/ML/CUDA/OpenCL),图形渲染;
- FPGA:可编程逻辑阵列,用于加速网络包处理、信号处理;
- NPU/TPU/DPU:专为 AI 推理、网络虚拟化、数据安全设计的专用芯片;
多 GPU 系统需主板/CPU 支持足够的 PCIe 通道与散热设计。
PCIe 扩展插槽
承载 GPU、RAID 卡、网卡、采集卡、存储扩展卡等;PCIe Gen4/Gen5 是主流,影响 GPU 与 NVMe 带宽。
BMC/IPMI(远程管理控制器)
服务器专有芯片(如 ASPEED AST2600); 提供 远程开关机、KVM over IP、硬件监控、风扇控制 等功能; 通过 Web/命令行远程维护,无需操作系统启动;
电源(PSU)
冗余电源(1+1 或 2+1 配置),其中一个坏了系统不宕机;支持热插拔;
散热系统
多风道设计,支持热插拔风扇;机架式服务器采用前进风后出风,便于机柜集中散热;GPU 服务器通常需要更高风量或液冷方案。
机箱(Chassis)
形式分为塔式、机架式、刀片式等。带热插拔硬盘仓、冗余风扇、电源托架。不同的形式其结构、散热、扩展与管理方式不同。
塔式形如普通的 PC 机箱,适用于小企业、办公室、实验室。成本低、噪音小、单机维护简单。内部空间大,支持标准显卡、SATA 硬盘等。无需机柜,放地上或桌下即可使用。但是,不便于规模化管理或集中散热。无法高密度堆叠部署。
机架式,最常见的企业服务器形态。外形:统一为扁平长方体,安装在机柜(Rack)中。高度单位:U(1U = 1.75 英寸 ≈ 4.45 cm),常见规格:1U、2U、4U。支持高密度部署,可集中管理与散热,标准化强,便于堆叠、扩展、维护;支持热插拔硬盘、电源、风扇。缺点:噪音大(风量高)、维护需要机柜。内部扩展性相对受限(尤其是 1U 型)。
刀片式,真正为数据中心高密度集群而生。结构上是一整套刀片系统(Blade Enclosure)像一个“机箱母舰”,内部插入多块独立“刀片(Blade)”主板。每块刀片都有自己的 CPU、内存、存储,但共享电源、散热、网络、管理模块。
极高密度:一个 10U 机箱能装十几台服务器。集中供电、散热、管理。维护便捷:抽出更换单块刀片即可。成本极高(机箱+刀片+专有配件)。扩展受限于厂商生态(Dell、HPE、IBM 各自标准不同)。需要专业机房环境。
其他组件
- CMOS 电池(维持 BIOS 配置)
- TPM / 安全模块(安全启动、加密)
- I/O 接口(USB、VGA/IPMI、串口)