pytorch 4 可视化 Attention 头实战:它到底在关注什么? 2026/03/12 从 MicroGPT 最小实现迁移到 PyTorch(Tensor 版)实战指南 2026/03/12 把字符级语言模型升级为中文分词版本:从数据到训练的完整改造 2026/03/12 自动微分与反向传播 —— 神经网络是怎么"学会"东西的? 2026/02/26