LLaMA-Factory

什么是LLaMA-Factory？

LLaMA-Factory 是一个全面且用户友好的框架，旨在统一各种大型语言模型（LLM）的微调过程。它通过提供一个简单的Web用户界面和一个强大的命令行界面，为初学者和专家提供了易于上手的解决方案。该项目旨在通过支持超过100种模型和各种高效的微调技术，使LLM定制大众化，使其成为训练和部署自定义AI模型的一站式解决方案。

主要特点

广泛的模型支持： 原生支持超过100种流行的LLM，包括Llama、Mistral、Mixtral、Qwen、Yi和Gemma。
多种微调方法： 实现多种最先进的微调技术，如LoRA、QLoRA、全参数微调和GaLore。
直观的Web用户界面： 具有基于Gradio的Web界面，允许用户在不编写任何代码的情况下选择模型、数据集和训练参数。
高效率： 集成了FlashAttention-2、Unsloth和RoPE缩放等性能增强库，以加速训练并减少内存使用。
可扩展性： 支持通过DeepSpeed ZeRO和分布式数据并行（DDP）进行多GPU训练，以及使用vLLM进行快速推理。
一体化平台： 处理各种训练任务，包括预训练、监督微调（SFT）和奖励建模。

使用案例

自定义聊天机器人： 在特定的对话数据集上微调基础模型，为客户服务或个人助理创建专门的聊天机器人。
领域特定助手： 在技术文档、法律文本或医学论文上训练模型，为特定领域构建专家助手。
研究与开发： 为学术或商业研究快速试验不同的模型和微调方法。
内容生成： 创建专门用于生成特定风格文本的模型，如营销文案、诗歌或代码。

入门指南

开始使用LLaMA-Factory非常简单。您只需几个命令即可启动Web用户界面。

克隆存储库：

git clone https://github.com/hiyouga/LLaMA-Factory.git

导航到目录并安装依赖项：

cd LLaMA-Factory
pip install -e .[torch,bitsandbytes]

启动Web用户界面：
```
llamafactory-cli webui
```
运行此命令后，您可以在浏览器中访问Web界面，开始微调您的第一个模型。

定价

LLaMA-Factory 是一个在Apache 2.0许可下分发的开源项目。它完全免费，可用于个人和商业目的。

什么是LLaMA-Factory？

主要特点

使用案例

入门指南

定价

System Specs

Classifications

Tags

Alternative Systems