Databricks Dolly：商用许可的指令跟随型大型语言模型

Databricks Dolly是由Databricks开发的基于指令的大型语言模型，采用了从EleutherAI的Pythia-12b派生的12亿参数模型，并在约15,000条由Databricks员工生成的指令/响应记录上进行了微调。这些记录涵盖了从脑力激荡到总结等多个能力领域，显示了Dolly在指令跟随任务上的出色表现。

模型概述

Dolly-v2-12b虽然不是最先进的生成语言模型，但其在遵循指令方面的表现令人惊讶，显示出不同于基础模型的高质量行为。模型的开发和微调过程充分展示了Databricks对推动人工智能变革力量的承诺。

性能与数据限制

尽管Dolly-v2-12b在定量基准测试中的表现还在持续评估中，但它在处理复杂句子结构、编程问题、数学运算和开放式问题回答等方面存在一些已知的挑战。此外，由于训练数据的限制，模型可能会反映出数据中的偏见或错误。

开始使用Dolly

对于希望测试模型但不进行训练的用户，可以直接在Hugging Face上访问databricks/dolly-v2-12b模型。以下是如何在配备A100 GPU的机器上使用transformers库运行模型的示例：

    
    from transformers import pipeline
import torch

instruct_pipeline = pipeline(model="databricks/dolly-v2-12b", torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto")
response = instruct_pipeline("Explain to me the difference between nuclear fission and fusion.")
print(response)

在使用Dolly模型处理各种指令时，我对其快速准确的响应印象深刻。模型能够有效地解释复杂概念，并在多个任务中提供有用的信息。尽管存在一些性能限制，Dolly的实际应用潜力仍然巨大，尤其是在需要高度遵循指令的场景中。