从零开始，2小时训练你的专属AI--MiniMind-代码号

Name: MiniMind
Author: 原创

MiniMind

用户：原创发布日期：2026-02-26 已有人查阅

MiniMind是一个极轻量级的开源语言模型项目，让所有人都能低成本、快速地体验从零训练大模型的全过程。它的模型体积仅为GPT-3的七千分之一，个人电脑就能跑起来，训练成本据说只需3块钱。

MiniMind 是由开发者 Jingyao Gong 发起并开源的一个项目，它的核心理念是“降低门槛”。在大型语言模型动辄需要成千上万张显卡和数月训练时间的今天，MiniMind 反道而行之，专注于打造一个“小而美”的模型训练和学习工具。

项目提供了从数据处理、分词器训练、预训练、监督微调（SFT）、LoRA高效微调到基于人类反馈的强化学习（RLHF/Direct Preference Optimization）的完整代码。所有这些代码都是用PyTorch从零开始实现的，几乎没有依赖复杂的第三方大模型库，这对于想深入理解模型底层原理的学习者来说，是一个非常清晰的教科书式项目。

MiniMind 提供了多种规格的模型版本，参数量仅为 25.8M（约2580万参数），模型文件大小约26MB。项目还扩展了多模态版本 MiniMind-V，支持图文理解。它不仅开源了代码，还提供了高质量的数据集和预训练权重，方便开发者快速上手。

官网入口地址

官网入口地址是：https://jingyaogong.github.io/minimind/

下载地址

项目的所有代码和模型都可以在GitHub和Hugging Face上获取。

开源项目地址（下载代码）：https://github.com/jingyaogong/minimind
预训练模型下载地址：https://huggingface.co/jingyaogong/MiniMind2
数据集下载地址：https://huggingface.co/datasets/jingyaogong/minimind_dataset

功能介绍

MiniMind 的功能覆盖了训练一个对话式语言模型的全链路：

极致轻量化的模型设计：提供 26M、100M 等多个小参数版本，模型体积小，推理速度快，甚至可以在普通CPU上运行。通过使用自定义的 6400 词表大小的分词器，有效控制了嵌入层（Embedding）的参数占比，防止“头重脚轻” 。
完整的训练流程代码：
- 预训练（Pretrain）：让模型从海量文本中学习语言知识和世界事实，对应的脚本是 train_pretrain.py 或 1-pretrain.py 。
- 监督微调（SFT）：让预训练模型学会理解和执行人类指令，进行多轮对话，对应脚本是 train_full_sft.py 或 3-full_sft.py 。
- 高效微调（LoRA）：通过低秩适配技术，只需要训练极少数的参数就能让模型适配特定任务，对应脚本 4-lora_sft.py 。
- 强化学习对齐（RLHF/DPO）：使用直接偏好优化算法，让模型的回答更符合人类的偏好，对应脚本 5-dpo_train.py 。
- 模型蒸馏（Distillation）：提供了从更大模型（如DeepSeek-R1）蒸馏推理能力到小模型的示例。
丰富的开源数据集：项目配套提供了预训练、SFT、DPO、医疗问答、自我认知等多个阶段的高质量清洗数据集，开发者无需再从零收集数据。
便捷的推理和交互方式：
- 支持命令行交互模式，通过 eval_model.py 快速测试模型效果。
- 提供了基于 Streamlit 的 WebUI 界面，可以像聊天机器人一样与模型交互。
- 兼容 llama.cpp、vllm、ollama 等主流推理框架，方便在不同场景下部署。
支持多模态和推理模型：扩展版本 MiniMind-V 支持视觉理解；MiniMind-Reason 则复现了类似DeepSeek-R1的推理能力。

应用场景

AI 教学与学习：作为大模型入门的实践教程，学生和开发者可以通过修改代码、调整参数，直观地理解Transformer的每个部件是如何工作的，以及预训练和微调究竟有什么区别。
个人开发者的快速原型验证：如果你想验证一个新的想法，比如一种新的注意力机制或者数据增强策略，用MiniMind可以在几小时内看到结果，而不需要等待数天。
边缘设备部署：由于模型体积极小，经过量化后甚至可以部署在手机或树莓派等资源受限的设备上，提供基础的离线AI能力。
特定领域知识库问答：利用LoRA技术，可以在极低成本下针对特定领域（如医疗、法律）的文档进行微调，打造一个小型的垂直领域专家模型。

定价或应用示例

定价：MiniMind 是一个免费且开源的项目。项目提到的“3块钱”成本，是指在云服务平台（如AutoDL）租用一块 NVIDIA 3090 显卡进行2小时训练的估算费用，用户只需支付给云服务商的硬件租赁费即可。
应用示例：开发者可以先在云端用2小时训练一个基础模型，然后用LoRA技术在医疗数据集上微调10分钟，就能得到一个可以进行简单医疗问答的对话机器人。