模型_搜你所想

【大模型应用极简开发入门（2）】GPT模型简史：从GPT-1到GPT-4：从小数据量的微调到大数据量的强化学习不断优化模型

文章目录一. GPT-1：无监督与微调1. 在GPT-1之前的`监督学习`的问题2. GPT-1中新的学习过程-无监督的预训练3. 复杂任务下的微调4. GPT-1为更强大的模型铺平了道路二. GPT-2：context learning1. 核心思想：context learning2. GPT-2的数据集三. GPT-3：sparse attention与强化学习1. 数据集2. 模型结构...

(view)

从头开始构建自己的 GPT 大型语言模型

图片来源： Tatev Aslanyan 一、说明我们将使用 PyTorch 从头开始构建生成式 AI、大型语言模型——包括嵌入、位置编码、多头自注意、残差连接、层归一化，Baby GPT 是一个探索性项目，旨在逐步构建类似 GPT 的语言模型。在这个项目中，我不会太详细地解释理论，而是主要展示编码部分。该项目从一个简单的 Bigram 模型开始，并逐渐融入了 Transforme...

(view)

一周学会Django5 Python Web开发-Django5模型数据修改

第2讲 Django5安装、第3讲 Django5创建项目(用命令方式)等，UP主更多精彩视频，请关注UP账号。https://www.bilibili.com/video/BV14Z421z78C/模型数据修改和添加都是用的save方法。我们结合案例先实现下；我们在views.py里先定义preUpdate方法，修改预处理，根据id获取图书信息，以及获取图书类别列表； def preUpdate...

(view)

探索设计模式的魅力：融合AI大模型与函数式编程、开启智能编程新纪元

🌈 个人主页：danci_ 🔥 系列专栏：《设计模式》 💪🏻 制定明确可量化的目标，坚持默默的做事。 ✨欢迎加入探索AI大模型与函数式编程模式融合之旅✨ 在编程世界的广阔疆域里，两大巨人的邂逅引发了前所未有的激荡。当AI大模型这一科技巨擘，遇上历经岁月沉淀的函数式编程思想，一场跨时代的思想碰撞正悄然上演。它们之间的交融，究竟会擦出怎样耀眼的火花？又将如何颠覆我们对编程的认知？ ...

(view)

【大模型应用极简开发入门（1）】LLM概述：LLM在AI中所处位置、NLP技术的演变、Transformer与GPT、以及GPT模型文本生成逻辑

文章目录一. AI中大语言模型的位置与技术发展1. 从AI到Transformer2. NLP：自然语言处理3. LLM大型语言模型：NLP的一种特定技术3.1. LLM定义3.2. LLM的技术发展3.2.1. n-gram模型3.2.2. RNN与LSTM 二. Transformer在LLM中脱颖而出1. Transformer架构能力2. 注意力机制2.1. 交叉注意力2.2. 自注意力机...

(view)

《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》【大模型思维链】

-1、Cot的好处3-2、Cot的缺陷3-3、Cot的适用四、变体4-1、自我验证（self-consistency checking）总结前言思维链，是一系列中间推理步骤，可以显著提高大语言模型执行复杂推理的能力。一、思维链介绍与传统Prompt的区别：传统Prompt的流程是直接从输入到输出的映射，而Cot则是输入——思维链——输出。下图为COT实例：《输入——思维链——输出》 1...

(view)

GPT-Engineer：一个基于OpenAI的GPT-4模型的开源项目，旨在自动化软件工程任务，如代码生成、需求澄清和规范生成

GPT-Engineer是一个基于OpenAI的GPT-4模型的开源项目，旨在自动化软件工程任务，如代码生成、需求澄清和规范生成等38。它通过与GPT-4模型以对话方式交互，根据提供的提示或指令自动生成代码库或完成特定的软件开发任务256。这个工具特别适合于快速原型设计和开发复杂应用程序，因为它能够根据简短的提示语创建完整的应用程序913。 GPT-Engineer的工作流程包括定义详细的项目描述（p...

(view)

欢迎 Llama 3：Meta 的新一代开源大语言模型

本也已作为 Llama Guard 2 (安全微调版本) 发布。我们与 Meta 密切合作，确保其产品能够无缝集成进 Hugging Face 的生态系统。在 Hub 上，您可以找到这五个开放获取的模型 (包括两个基础模型、两个微调模型以及 Llama Guard) 。本次发布的主要特性和集成功能包括： Hub 上的模型并提供了模型卡片和许可证信息https://hf.co/meta-llama🤗...

(view)

【深度学习实战（12）】训练之模型参数初始化

一、初始化方式在常见的CNN深度学习模型中，最常出现的是Conv卷积和BatchNorm算子。（1）对于Conv卷积，权重初始化的方式有‘normal’，‘xavier’,‘kaiming’,‘orthogonal’ 以‘normal’方式为例：对Conv卷积的weight通常是以均值为0，标准差为0.02的正态分布进行参数初始化（2）对于BatchNorm算子，通常是使用‘normal’方式...

(view)

广东首个大模型和算法创新服务中心在深圳前海揭牌

推动大模型技术合规化规模化应用讯记者李晓旭报道：4月17日，“深圳（前海）大模型和算法创新服务中心”正式揭牌。该中心围绕大模型和算法备案，向粤港澳大湾区企业提供备案咨询、辅导培训和预测试等服务，帮助企业快速推进大模型与算法的研发和上市，有力推动大模型技术的合规化、规模化应用。同时，该中心将充分整合深圳“数、算、网”优质资源，为企业提供数据流通交易、数据跨境指导、算力资源调度、高速网络服务以及奖补资金...

(view)

上一页 1 3 4 5 6 7 8 9 10 下一页