BLOOMChat:多语言支持、可商用的聊天模型
BLOOMChat是一款开源、支持多语言、可商用的大语言模型,旨在提供优质的多语言对话支持,适用于各种商业和学术环境。
clickgpt_line.png_noView
介绍

在2023年5月19日,SambaNova和Together两家公司联合发布了BLOOMChat,这是一个支持多语言且可商用的开源聊天大语言模型(LLM)。它基于BLOOM基座模型,不仅可商用,还支持46种语言,包括中文,克服了当前市场上许多开源模型的局限。

BLOOMChat的开源与商用价值

1. 开源的重要性

开源项目如Meta的LLAMA、Vicuna以及清华和智谱AI的ChatGLM虽然在学术研究中有一席之地,但多数不允许商用。这在一定程度上限制了它们的应用范围,尤其是在商业环境中。而BLOOMChat的开源和可商用特性,为企业提供了更多的灵活性和自主权。

2. 多语言支持的挑战与突破

传统上,开源聊天模型大多以英语为主,对非英语的支持不足。但BLOOMChat利用其强大的1760亿参数模型,即使仅在英语数据集上进行了微调,也显著提高了对其他语言的支持能力。在与GPT-4和其他主流模型的比较中,BLOOMChat在多语言支持方面显示出了竞争力,尽管在与GPT-4的直接对比中略显不足。

BLOOMChat的技术与微调策略

1. 微调数据集的选择

BLOOMChat的微调策略包括使用OpenChatKit自动生成的大规模对话数据集以及Dolly 2.0和OASST1等高质量问答数据集。这种结合广度与深度的策略有效提升了模型的综合表现。

2. 微调过程

整个微调过程在SambaNova的AI平台上进行,分两步:先对OpenChatKit进行采样训练,再对Dolly 2.0和OASST1的合集进行深度微调。这一策略确保了模型在多种数据源上的适应性和效率。

性能评估与实验效果

1. 人类评估和模型质量

实验结果显示,BLOOMChat在多种语言的实际应用中表现优越。尽管只在英语上微调,但对于其他语言的回答质量也达到70%以上的正确或可接受率。

github_ai_big_model_bloomchat_1

2. WMT翻译任务的表现

在WMT翻译任务中,BLOOMChat同样展现出领先其他开源聊天模型的能力,虽然仍然无法与GPT-4媲美。

github_ai_big_model_bloomchat_2

BLOOMChat不仅开放源码,还支持商用。它在处理非英语对话时简直超出了我的预期,虽然与GPT-4等顶尖模型相比仍有差距,但BLOOMChat的多语种效果已经非常接近实用水平。

编程学习
编程学习 免费领取编程学习资料 进编程学习交流群
订阅号
视频号
公众号 关注公众号,回复关键字python领取大厂最新面试题
×
编程学习
免费领取编程学习资料 进编程学习交流群