Databricks Dolly:商用许可的指令跟随型大型语言模型

Databricks Dolly是一个商用许可的大型语言模型,专门设计用于遵循复杂指令,基于Databricks平台微调,适用于多种AI应用场景。
直达下载
回到上一页
clickgpt_line.png_noView
介绍

Databricks Dolly是由Databricks开发的基于指令的大型语言模型,采用了从EleutherAI的Pythia-12b派生的12亿参数模型,并在约15,000条由Databricks员工生成的指令/响应记录上进行了微调。这些记录涵盖了从脑力激荡到总结等多个能力领域,显示了Dolly在指令跟随任务上的出色表现。

模型概述

Dolly-v2-12b虽然不是最先进的生成语言模型,但其在遵循指令方面的表现令人惊讶,显示出不同于基础模型的高质量行为。模型的开发和微调过程充分展示了Databricks对推动人工智能变革力量的承诺。

性能与数据限制

尽管Dolly-v2-12b在定量基准测试中的表现还在持续评估中,但它在处理复杂句子结构、编程问题、数学运算和开放式问题回答等方面存在一些已知的挑战。此外,由于训练数据的限制,模型可能会反映出数据中的偏见或错误。

开始使用Dolly

对于希望测试模型但不进行训练的用户,可以直接在Hugging Face上访问databricks/dolly-v2-12b模型。以下是如何在配备A100 GPU的机器上使用transformers库运行模型的示例:

    
from transformers import pipeline
import torch

instruct_pipeline = pipeline(model="databricks/dolly-v2-12b", torch_dtype=torch.bfloat16, trust_remote_code=True, device_map="auto")
response = instruct_pipeline("Explain to me the difference between nuclear fission and fusion.")
print(response)

在使用Dolly模型处理各种指令时,我对其快速准确的响应印象深刻。模型能够有效地解释复杂概念,并在多个任务中提供有用的信息。尽管存在一些性能限制,Dolly的实际应用潜力仍然巨大,尤其是在需要高度遵循指令的场景中。

编程学习
编程学习 免费领取编程学习资料 进编程学习交流群
订阅号
视频号
公众号 关注公众号,回复关键字java领取大厂最新面试题
×
编程学习
免费领取编程学习资料 进编程学习交流群