输入处理管道

输入处理管道#

  1. 输入数据传递给 AsyncLLMEngine)。

  2. 如果需要,对数据进行标记化。

  3. 使用 INPUT_REGISTRY.process_input 处理输入。

    • 例如,添加占位符标记以保留用于多模态嵌入的 KV 缓存。

  4. 将处理后的输入发送到 ExecutorBase

  5. 通过 WorkerBase 将输入分发到 ModelRunnerBase

  6. 如果数据包含多模态数据,请使用 MULTIMODAL_REGISTRY.map_input 将其转换为关键字参数。