运行时库,包括用户态驱动、模型执行库及推理引擎,负责NPU Session创建、模型解析与下发执行等