为破解企业在 AI 部署过程中的核心难题,京东近期正式开源了一款专为国产芯片打造的 xLLM 推理引擎。这款引擎通过创新融合请求优先级调度、动态架构调整以及多级流水线三大核心技术,在大幅提升 AI 推理速度的同时,也显著优化了资源利用效率,从技术层面为企业 AI 落地扫清障碍。
从实际应用效果来看,该引擎已在京东内部业务场景中完成验证:不仅助力相关业务的运行效率提升超 5 倍,更实现了机器成本 90% 的大幅削减。这一成果不仅体现了技术的实用性与可靠性,更为广大企业推进 AI 应用、实现降本增效提供了切实可行的解决方案,进一步推动 AI 技术在各行业的规模化落地。

.
.
.
.
