Mixture of Insights.

这里会长期记录我拆解系统、训练模型、打磨工具时留下的笔记:从一行日志到一次架构取舍,从工程细节到人的判断。写给未来的自己,也写给同样愿意把问题追到底的人。

系列

后训练实战

后训练不只是换一个优化器。这里写数据怎么长出来、奖励怎么骗人、RL 什么时候值得上,以及模型到底学到了什么。

系列

ORBIT —— 在租来的 GPU 上编排训练

租来的机器会消失,训练留下的东西不能消失。这个系列写一次运行怎样从 shell 会话变成可复现的工件。

系列

把 TTS 模型搬上 OpenVINO

离开 CUDA 以后,很多平时理所当然的东西都要重新做一遍:缓存、批处理、带宽账,还有第一帧声音。

系列

一台 root 手机能藏住什么

从包名、系统特性、日志到硬件证明,一条通道一条通道地看:哪些能藏,哪些最好早点承认撞墙。

笔记

独立文章