开源大语言模型(LLM)汇总

开源大语言模型(LLM)汇总(持续更新中)-LMLPHP

随着ChatGPT的火爆,越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总,跟踪每天不发的大语言模型和精调语言模型。

我将根据个模型采用的基础大模型进行分类,每个大模型下列出各派生模型。

Alpaca (Stanford)

  • 🏠Alpaca 官网: https://crfm.stanford.edu/2023/03/13/alpaca.html
  • ❤️Alpaca GitHub: https://github.com/tatsu-lab/stanford_alpaca
  • 💵是否可以商用: 否

以下是基于 Stanford Alpaca 项目的衍生模型或类似模型:

  • Alpaca.cpp
  • Alpaca-LoRA
  • Baize
  • Cabrita
  • BELLE
  • Luotuo
  • Vicuna
  • Chinese-Vicuna
  • GPT4All
  • Koala
  • llama.cpp
  • Lit-LLaMA ️

Alpaca.cpp

Alpaca-LoRA

Baize

Cabrita

  • ❤️GitHub: https://github.com/22-hours/cabrita

BELLE

  • ❤️GitHub: https://github.com/LianjiaTech/BELLE

Luotuo

Vicuna (FastChat)

Chinese-Vicuna

GPT4All

Koala

llama.cpp

Lit-LLaMA ️

BLOOM (BigScience)

以下是基于 BigScience BLOOM 项目的衍生模型或类似模型:

  • BLOOM-LoRA
  • Petals

BLOOM-LoRA

Petals

Flamingo (Google/Deepmind)

以下是基于 Flamingo 项目的衍生模型或类似模型:

  • Flamingo — Pytorch
  • OpenFlamingo

Flamingo — Pytorch

  • ❤️GitHub: https://github.com/lucidrains/flamingo-pytorch

OpenFlamingo

FLAN (Google)

以下是基于 FLAN 项目的衍生模型或类似模型:

  • Flan-Alpaca
  • Flan-UL2

Flan-Alpaca

Flan-UL2

GLM (General Language Model)

以下是基于 GLM 项目的衍生模型或类似模型:

  • GLM-130B
  • ChatGLM-6B

GLM-130B

ChatGLM-6B

GPT-J (EleutherAI)

  • ❤️GitHub: https://github.com/kingoflolz/mesh-transformer-jax/#gpt-j-6b
  • 💻Demo: https://6b.eleuther.ai/

以下是基于 GPT-J 项目的衍生模型或类似模型:

  • Dolly

Dolly (Databricks)

Cerebras-GPT (Cerebras)

GPT-NeoX

HuggingGPT

Polyglot

Pythia

Segment Anything

The RWKV Language Model

XGLM

  • ❤️GitHub: https://github.com/facebookresearch/fairseq/tree/main/examples/xglm
  • ❤️Hugging Face: https://huggingface.co/docs/transformers/model_doc/xglm
04-06 21:13