什么是 Mistral-7B-Instruct？

Mistral-7B-Instruct 是由 Mistral AI 开发的一款高性能、拥有 73 亿参数的语言模型。作为一个指令调优模型，它专门设计用于遵循用户命令并进行对话式聊天。它因在多种基准测试中超越了许多更大的模型而备受关注，为开源人工智能的效率和能力树立了新标准。

主要特点

高性能： 在许多标准基准测试中表现优于像 Llama 2 13B 这样更大的模型。
高效率： 采用分组查询注意力（GQA）以实现更快的推理速度，并使用滑动窗口注意力（SWA）以更低的计算成本处理更长的序列。
开源： 在宽松的 Apache 2.0 许可下发布，允许在商业和研究应用中广泛使用，无任何限制。
指令遵循： 经过微调以理解和执行复杂指令，使其成为聊天机器人和助手类应用的理想选择。

应用场景

对话式AI和聊天机器人： 其主要应用场景是驱动响应迅速、智能化的聊天机器人。
文本摘要： 能够将长文档浓缩成简洁的摘要。
代码生成： 能够根据自然语言描述生成代码片段。
问答系统： 为各种查询提供准确的答案。
微调基础模型： 为针对特定任务或领域创建专门模型提供了坚实的基础。

入门指南

这是一个“Hello, World!”风格的示例，展示了如何使用 Hugging Face transformers 库来运行 Mistral-7B-Instruct。

首先，请确保您已安装必要的库： ```bash pip install transformers torch

然后，您可以使用以下 Python 代码加载模型并生成响应： ```python from transformers import AutoModelForCausalLM, AutoTokenizer

model_id = “mistralai/Mistral-7B-Instruct-v0.1” tokenizer = AutoTokenizer.from_pretrained(model_id) model = AutoModelForCausalLM.from_pretrained(model_id)

使用聊天模板创建提示

messages = [ {“role”: “user”, “content”: “用 Python 写一个 ‘Hello, World!’ 程序。”} ] prompt = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True) inputs = tokenizer(prompt, return_tensors=”pt”)

生成响应

print(“正在生成响应…”) outputs = model.generate(**inputs, max_new_tokens=50) response_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

清理输出，只显示模型的响应

user_prompt_part = “[INST] 用 Python 写一个 ‘Hello, World!’ 程序。 [/INST]” model_response = response_text.replace(user_prompt_part, “”).strip()

print(model_response)

定价

Mistral-7B-Instruct 模型是开源的，在 Apache 2.0 许可下可免费下载和使用。Mistral AI 还通过其平台“La Plateforme”提供对此模型及其他模型的付费 API 访问，该平台提供了一个托管的、无服务器的端点，便于轻松集成。

社区反馈

社区对 Mistral-7B-Instruct 的反馈非常积极。开发者和研究人员称赞其令人印象深刻的性能与尺寸之比，使得那些没有海量计算资源的个人也能够使用它。它被广泛认为是同类产品中最好的开源模型之一，并成为许多其他流行的微调模型的基础。

Mistral-7B-Instruct

什么是 Mistral-7B-Instruct？

主要特点

应用场景

入门指南

使用聊天模板创建提示

生成响应

清理输出，只显示模型的响应

定价

社区反馈

System Specs

Classifications

Tags

Alternative Systems