元语智能ChatYuan

3年前更新 290 00

元语智能发布的一系列支持中英双语的功能型对话语言大模型，在微调数据、人类反馈强化学习、思维链等方面进行了优化。

收录时间：

2023-09-21

打开网站手机查看

元语智能ChatYuan

元语智能ChatYuan

元语智能发布的一系列支持中英双语的功能型对话语言大模型，在微调数据、人类反馈强化学习、思维链等方面进行了优化。

数据统计

相关导航

虎博TigerBot

TigerBot是一个多语言多任务的大规模语言模型（LLM）。TigerBot致力于开源，目前已经开源的成果包括模型（TigerBot-7B,TigerBot-7B-base,TigerBot-180B）、基本训练和推理代码、数据、API、领域数据等。另外TigerBot还致力于不同类型的插件研发，目前已经推出的代表性的插件有“TigetBot Search”。随着不断的研发，TigerBot还会为人们带来更多的便利与科技体验。

百川智能大模型

由百川智能推出的新一代开源大语言模型，采用 2.6 万亿 Tokens 的高质量语料训练，在多个权威的中文、英文和多语言的通用、领域 benchmark上取得同尺寸最佳的效果，发布包含有7B、13B的Base和经过PPO训练的Chat版本，并提供了Chat版本的4bits量化。

BELLE

开源了基于BLOOMZ和LLaMA优化后的一系列模型，同时包括训练数据、相关模型、训练代码、应用场景等，也会持续评估不同训练数据、训练算法等对模型表现的影响。

XVERSE-13B

深圳元象科技自主研发的支持多语言的大语言模型，使用主流 Decoder-only 的标准Transformer网络结构，支持 8K 的上下文长度（Context Length），为同尺寸模型中最长，构建了 1.4 万亿 token 的高质量、多样化的数据对模型进行充分训练，包含中、英、俄、西等 40 多种语言，通过精细化设置不同类型数据的采样比例，使得中英两种语言表现优异，也能兼顾其他语言效果；基于BPE算法使用上百GB 语料训练了一个词表大小为100,278的分词器，能够同时支持多语言，而无需额外扩展词表。

面壁智能知乎CPM-Bee

一个完全开源、允许商用的百亿参数中英文基座模型。它采用Transformer自回归架构（auto-regressive），在超万亿（trillion）高质量语料上进行预训练，拥有强大的基础能力。开发者和研究者可以在CPM-Bee基座模型的基础上在各类场景进行适配来以创建特定领域的应用模型。

Meta开源Chinese-LLaMA-Alpaca

Meta开源Chinese-LLaMA-Alpaca

中文LLaMA&Alpaca大语言模型+本地CPU/GPU部署，在原版LLaMA的基础上扩充了中文词表并使用了中文数据进行二次预训练

Meta开源Llama2-Chinese

Meta开源Llama2-Chinese

该项目专注于Llama2模型在中文方面的优化和上层建设，基于大规模中文数据，从预训练开始对Llama2模型进行中文能力的持续迭代升级。

PolyLM

多语种大模型