llmcalc
5 步算出 agentic workload 下的网络带宽需求(派生值全部从架构参数现算)
1
选模型 / 粘贴 config.json
预设模型
粘贴 config.json
模型
KV 精度(部署选择)
权重精度
FP8 (1B/param)
FP4 (0.5B/param)
BF16 (2B/param)
粘贴 HuggingFace config.json
解析后
粘贴后点击下方按钮
解析
示例
2
部署配置
GPUs per instance
单个模型实例用多少 GPU(TP×PP 之类的聚合)
Instances per machine (DP)
一台机器跑几个独立实例
GPUs per machine (推导)
8
3
硬件
GPU 型号
单卡 Peak FP8 dense (PFLOPS)
单卡 HBM (GB)
MFU
4
Workload
📦 加载预置 5 桶
+ 加桶
清空
桶名
T (tokens)
命中率 h
操作
5
本地命中率 & 最终带宽
+ 加
重置默认
单实例 BW
单机 BW(× DP)
导出 CSV
📊 每桶带宽构成
📊 流量一览
(实时)
查看桶
h_local