Menu
首页
搜索
SpringBoot
Vue
Vant
Python
Android
Harmony
InnoDB
BQW_
关注
发信
关注(28)
粉丝(399)
动态
文章
图片
文章
【自然语言处理】【大模型】BitNet:用1-bit Transformer训练LLM
【自然语言处理】BitNet b1.58:1bit LLM时代
【自然语言处理】【大模型】 ΨPO:一个理解人类偏好学习的统一理论框架
【自然语言处理】【大模型】VeRA:可调参数比LoRA小10倍的低秩微调方法
【自然语言处理】【大模型】赋予大模型使用工具的能力:Toolformer与ART
【自然语言处理】【长文本处理】RMT:能处理长度超过一百万token的Transformer
【深度学习】【分布式训练】DeepSpeed:AllReduce与ZeRO-DP
【深度学习】混合精度训练与显存分析
【自然语言处理】【大模型】ChatGLM-6B模型结构代码解析(单机版)
【自然语言处理】【大模型】CodeGen:一个用于多轮程序合成的代码大语言模型