Mixture of Insights.

这里会长期记录我拆解系统、训练模型、打磨工具时留下的笔记：从一行日志到一次架构取舍，从工程细节到人的判断。写给未来的自己，也写给同样愿意把问题追到底的人。

精选

可以从这里开始读

2026年6月10日 · 13 分钟

后训练是个数据问题

很多后训练项目最后拼的不是 PPO、GRPO 还是 DPO，而是你能不能持续造出好数据：合成轨迹、自我博弈、拒绝采样，再加一个足够可靠的裁判。

2026年6月10日 · 11 分钟

租 GPU 的控制面

租来的 GPU 很快会消失，但一次训练不能只活在 SSH 会话里。ORBIT 的核心想法，是把运行变成可复现的产物。

2026年6月10日 · 35 分钟

离开 N 卡后的真实世界：Ultra x7 358h 平台上的 TTS 推理框架重构

脱离了 CUDA 的舒适区，vLLM 隐藏的复杂性全部暴露。本文以 Ultra x7 358h 为例，深度剖析在异构 AI PC 上从零重构大模型推理栈的框架级、算子级与代码级优化。

系列

后训练实战

后训练不只是换一个优化器。这里写数据怎么长出来、奖励怎么骗人、RL 什么时候值得上，以及模型到底学到了什么。

系列

ORBIT —— 在租来的 GPU 上编排训练

租来的机器会消失，训练留下的东西不能消失。这个系列写一次运行怎样从 shell 会话变成可复现的工件。

系列

把 TTS 模型搬上 OpenVINO

离开 CUDA 以后，很多平时理所当然的东西都要重新做一遍：缓存、批处理、带宽账，还有第一帧声音。

系列

一台 root 手机能藏住什么

从包名、系统特性、日志到硬件证明，一条通道一条通道地看：哪些能藏，哪些最好早点承认撞墙。

笔记

独立文章

2024年6月16日 · 4 分钟

Neovim：用 OSC 52 穿越终端剪贴板屏障

绕开 SSH/WSL 的限制，使用 Neovim 0.10 的原生 OSC 52 转义序列将寄存器内容直达系统剪贴板。没有外挂，只有极简的字节流通信。

Mixture of Insights.

可以从这里开始读

后训练是个数据问题

租 GPU 的控制面

离开 N 卡后的真实世界：Ultra x7 358h 平台上的 TTS 推理框架重构

后训练实战

01后训练是个数据问题

02先冷启动，再让 RL 往上爬

03你到底在奖励什么?

04算力不够上 RLHF，就把 DPO 用对

05自我博弈：让模型从游戏里捞数据

ORBIT —— 在租来的 GPU 上编排训练

01租 GPU 的控制面

02ORBIT 的内核为什么不懂任务

03bundle 即契约

把 TTS 模型搬上 OpenVINO

01离开 N 卡后的真实世界：Ultra x7 358h 平台上的 TTS 推理框架重构

02拆解 Qwen3-TTS：OpenVINO 移植过程中的图分离与调度实践

03无 vLLM 环境下的 Paged-KV 与连续批处理调度

一台 root 手机能藏住什么

01Google Wallet 不是 Play Integrity 那一关

02StockMask：不碰 App，也能造一层原厂感

03十五个 App 正在读整台设备的日志

04别用 adb shell 代替 App 的眼睛

05一台 root 手机能藏住什么

独立文章

Neovim：用 OSC 52 穿越终端剪贴板屏障