使用统计信息收集#

默认情况下,vLLM 会收集匿名使用数据,以帮助工程团队更好地了解哪些硬件和模型配置被广泛使用。这些数据使他们能够优先处理最常见的负载。收集的数据是透明的,不包含任何敏感信息,并将公开发布以供社区使用。

收集哪些数据?#

你可以在 usage_lib.py 中查看 vLLM 收集的最新数据列表。

以下是以 v0.4.0 为例:

{
  "uuid": "fbe880e9-084d-4cab-a395-8984c50f1109",
  "provider": "GCP",
  "num_cpu": 24,
  "cpu_type": "Intel(R) Xeon(R) CPU @ 2.20GHz",
  "cpu_family_model_stepping": "6,85,7",
  "total_memory": 101261135872,
  "architecture": "x86_64",
  "platform": "Linux-5.10.0-28-cloud-amd64-x86_64-with-glibc2.31",
  "gpu_count": 2,
  "gpu_type": "NVIDIA L4",
  "gpu_memory_per_device": 23580639232,
  "model_architecture": "OPTForCausalLM",
  "vllm_version": "0.3.2+cu123",
  "context": "LLM_CLASS",
  "log_time": 1711663373492490000,
  "source": "production",
  "dtype": "torch.float16",
  "tensor_parallel_size": 1,
  "block_size": 16,
  "gpu_memory_utilization": 0.9,
  "quantization": null,
  "kv_cache_dtype": "auto",
  "enable_lora": false,
  "enable_prefix_caching": false,
  "enforce_eager": false,
  "disable_custom_all_reduce": true
}

你可以通过运行以下命令来预览收集的数据:

tail ~/.config/vllm/usage_stats.json

选择退出使用统计信息收集#

你可以通过设置 VLLM_NO_USAGE_STATS 或 DO_NOT_TRACK 环境变量,或创建 ~/.config/vllm/do_not_track 文件来选择退出使用统计信息收集:

# Any of the following methods can disable usage stats collection
export VLLM_NO_USAGE_STATS=1
export DO_NOT_TRACK=1
mkdir -p ~/.config/vllm && touch ~/.config/vllm/do_not_track