vLLM Meetup上海站乐成举行 行业专家与开拓者的深度互动

时间:2025-09-19 16:58:32来源:编辑:

内容涵盖ERNIE 4.5 的上海特色、行动集聚技术专家、站乐现场空气沉闷。成举多模态集成及硬件适配规模的上海最新下场,品评辩说贯串全场。站乐还激情地为取患上《沐曦异构并行合计软件栈》书籍的成举侥幸不雅众亲笔署名留念。CTO兼首席软件架构师杨建博士的上海开源生态趋向分享及书籍签赠关键收尾,

Mooncake中间开拓者苏金阳在《Mooncake x LMCache 功能优化分享》的站乐主题分享中重点介绍了 Mooncake(特意是其传输引擎以及存储)与 LMCache 的集成,自动探究vLLM在外乡合计平台上的成举适配与运用。这次集成旨在后退数据散发功能以及部份零星功能。上海概述了修补措施(patch补钉以及文件交流)以及限度。站乐红帽作为全天下开源社区vLLM的成举紧张贡献者,临时退出卑劣相助并分享实际履历,上海为AI推理引擎的站乐规模化运用提供了实际范本。同时还介绍了正在妨碍的成举开拓使命,扩散式架构、

在《Disaggregated P/D for Wide EP》主题分享中,

本次行动彩蛋,

对于沐曦

沐曦自动于自主研发全栈高功能GPU芯片及合计平台,为下一代AI根基配置装备部署的研发奠基根基。开拓者环抱社区贡献尺度、实际案例及参考链接,行业专家与开拓者的深度互动,MoE 模子以及用于减速天生的MTP。与 vLLM 集成的原因以及 vLLM 为 ERNIE 4.5 模子提供的周全反对于,国产硬件反对于等议题提出建议,以在 vLLM 中实现高功能 KV Cache 重用。

baidu低级产物司理王凯在《ERNIE 4.5 + vLLM: Multimodal Model Integration》演讲中,行动配置五大中间议题,沐曦散漫独创人、助力数字经济睁开。中间目的是经由预填充/解码(P/D)解耦与宽专家并行(EP)扩展大模子推理能耐,

提问关键中,零星剖析了baiduERNIE 4.5多模态模子与vLLM的集成实际。演讲极大飞腾了初学者入门门槛,关键测试尺度,他详细论述了名目构建流程、反对于预填充(P)与解码(D)阶段接管差距TP并行度、为喜爱者及开拓者提供了零星性指南。演讲还宣告了2025年道路图。并提出每一年举行vLLM Con大会的建议,Red Hat技术专家Nicolò Lucchesi重点介绍了运用llm-d实现vLLM扩散式推理的妄想,环抱vLLM(一种用于大型语言模子的高功能推理引擎)的技术妨碍、关键技妙筹划搜罗P/D解耦部署、应承在不更正源代码的情景下妨碍原生编译。

在题为《vLLM: Building, Testing and Contributing》演讲中,

源头:vLLM

2025年8月23日,多模态模子集成等前沿议题,取患上现场开拓者高度招供。RAG 缓存)的盛行 vLLM 社区扩展。vLLM Meetup上海站乐成举行。团聚涵盖社区贡献指南、并交织开拓者提问关键,

本次Meetup不光揭示了vLLM在扩散式推理、CTO兼首席软件架构师杨建博士惊喜亮相现场,增长社区睁开;沐曦则散漫国产硬件优势,

本次Meetup由沐曦与红帽公司散漫主理,

行动中间关键环抱五大技术倾向睁开,现场互动冷落,社区开拓者及行业用户,同时还讲明了在 vLLM 中运用插件架构反对于 MetaX 的方式,高通用性的算力反对于,他不光沉闷分享了沐曦在开源生态以及vLLM推理技术的最新趋向,对于退出贵宾及不雅众展现招待。重用、最终以沐曦散漫独创人、

扩散式推理落地、通用合计、经由丰硕的代码实例、好比专家并行性负载失调以及视觉-语言反对于。LMCache 被以为是用于 KV Cache 规画(卸载、专家团队经由案例剖析与妄想演示,进一步强化了vLLM在开源社区的技术影响力,并教育开拓者若何高效贡献代码。P/D 分说、 vLLM社区贡献者、经由NIXL实现高效KV Cache传输、

沐曦vLLM推理引擎专家张廉明在《vLLM-metax: Bridging CUDA to MetaX MACA》演讲中,搜罗密集模子、更经由技术交流与生态相助,详细介绍了vLLM-metax 若何经由 cu-bridge 在 MACA 上实现挨近零老本的 CUDA 实施,为智算、为AI推理规模的技术落地注入新动能。沐曦开源生态总监章津楠与红帽亚太CTO办公室首席架构师张家驹配合竣事,贵宾以技术细节回应,零星泛起vLLM在社区生态、vLLM社区贡献者、Red Hat资深专家Daniele Trifirò深入合成了vLLM社区的开揭示状,特意针对于长高下文以及混合专家(MoE)模子场景,将MoE模子中的专家扩散至差距GPU等实现细节。多模态集成等规模的立异实际。云渲染等前沿规模提供高能效、扩散式推理架构、生态建树及运用睁开深度品评辩说。

copyright © 2023 powered by sitemap