分类存档: 工作

LMCache Blending 实现解析：从理论突破到工程实践的挑战

作者: 輕微日期: 2025/08/08 没有评论

摘要 LMCache的Blending（融合）功能，其思想源于荣获学术大奖的“CacheBlend”研究项目 1，代表了大型语言模型（LLM）推理服务中一项关键的范式转变。它超越了传统的、仅限于前缀的KV缓存（Key-Value Cache）复用模式，旨在实现一种更强大、更灵活的非前缀知识融合模型，专为加速如检索增强生成（Retrieval-Augmented Generation, RAG）等复杂工作负载而设计。其核心机制在于，能够将任意文本块预先计算生成的KV缓存，在新的、任意位置的提示（Prompt）中进行复用，仅需进行少量的位置编码校正和局部重计算。然而，本报告的深度分析揭示了一个关 …

继续阅读 »

LMCache项目深度技术剖析：大语言模型推理加速

作者: 輕微日期: 2025/08/08 没有评论

I. 引言与架构背景本章节旨在为LMCache项目建立坚实的技术背景，将其定位为一个深度集成于特定高性能大语言模型（LLM）服务生态系统中的关键组件，而非一个孤立的工具。我们将追溯其从学术研究到当前角色的演进历程，并重点阐述其与vLLM项目之间共生共荣的紧密关系。 A. 项目起源：从芝加哥大学到vLLM生产级技术栈 LMCache项目源于芝加哥大学的LMCache实验室，由助理教授Junchen Jiang领导。其核心技术，如 CacheGen和CacheBlend，是学术研究论文的直接产物，这为该项目奠定了坚实的理论基础。该项目是LMCache团队（芝加哥大学）与vLLM团队（加州大学 …

继续阅读 »

青云备份功能简单测试

作者: 輕微日期: 2014/05/16 3 条评论

================================================================ 注：领导的强制更新博客挂了。因为后续要跟进对比，所以挪到这里来了。还好我做了备份顺便吐槽领导搞这些东西有啥意思嘛，才给报100块害我不得不熬夜，真抠 ➡ ================================================================ 附加硬盘总配额为500G 500G性能盘写满再备份消耗3个多小时其中写操作1个小时多一点，备份操作消耗2个小时零5分对主机的备份操作 …

继续阅读 »

哈哈，cloudstack代码涉嫌故意卖萌

作者: 輕微日期: 2014/04/18 没有评论

cloudstack 4.2.1 AgentManagerImpl.java: 469 虽然这样的报错不太恰当，不够简洁明确，但是我喜欢这样的态度和风格。 coding不应该是枯燥无趣的工作。

excel的BUG。打开大csv文件显示不全

作者: 花花日期: 2012/04/24 1 条评论

.csv:用逗号分割的文本文件，一般用于在不同应用程序之间进行数据交换。如果文件内的内容超过65536行，用excel2003可以打开，但是超过65536的数据会丢失，用wps打开也是这样。可以excel2003以上的版本，比如2007，可以打开，且数据不会丢失，也可用写字板打开。文件内容不超过65536行，就不会有数据丢失的问题了。

輕微&花花

Dyluck&Zero

分类存档: 工作

LMCache Blending 实现解析：从理论突破到工程实践的挑战

LMCache项目深度技术剖析：大语言模型推理加速

青云备份功能简单测试

哈哈，cloudstack代码涉嫌故意卖萌

excel的BUG。打开大csv文件显示不全

近期文章

近期评论