语言模型_搜你所想

【LangChain】（三）如何利用LangChain和TruLens提升大规模语言模型的质量？全面教程与实战案例！

大规模语言模型（LLM）已经展现出了令人瞩目的成就。可随之而来的模型质量和不确定性问题，也引发了广泛关注。如何有效评估和优化模型质量，成为了我们面临的一大挑战。🤔 在这篇文章中，我们将深入探讨LangChain框架和TruLens工具，它们将帮助我们评估和提升模型质量，并通过量化的方法对抗不确定性。无论你是AI领域的初学者还是资深专家，这篇文章都将为你提供实用的指导和丰富的案例。如果你还没有使用过AI...

(view)

重要性分层：让大型语言模型的微调更高效

在自然语言处理（NLP）领域，随着大型语言模型（LLMs）的不断发展，参数高效微调（PEFT）方法成为了适应这些模型的热门选择。然而，许多现有的PEFT方法在微调过程中采用均匀的架构设计，忽视了层与层之间的重要性差异，从而导致微调效果不理想。正如一位厨师在烹饪时，如果不根据食材的特点调整火候，那么即使是顶级食材也难以做出美味的菜肴。本文提出了一种新颖的方法——重要性感知稀疏微调（IST），旨在充分利用层...

(view)

探索人工智能在数学教育上的应用——使用大规模语言模型解决数学问题的潜力和挑战

刻的理解。随着人工智能技术的发展，机器对数学各方面的全面理解是超越单纯技术成就的重要一步，也是迈向更具通用性和适应性的人工智能的重要一步。这是迈向更具通用性和适应性的人工智能的重要一步。特别是大规模语言模型的出现彻底改变了人工智能领域，使其成为复杂任务自动化的有力工具。事实证明，大规模语言模型是发现数学解题中细微差别的宝贵资源。这些模型为探索语言与逻辑之间的相互作用提供了新的途径，促进了这一领域的探索。...

(view)

利用大规模语言模型提高生物医学 NER 性能的新方法

概述论文地址：https://arxiv.org/pdf/2404.00152.pdf 大规模语言模型在零拍摄和四拍摄任务中表现出色，但在生物医学文本的独特表达识别（NER）方面仍有改进空间。例如，Gutiérrez 等人（2022 年）的一项研究表明，即使使用相同数量的数据，采用上下文学习（In-Context Learning）的 GPT-3 的性能也不如小型微调模型。生物医学文本充满了专业术语，...

(view)

Llamam-omni：低延迟与高质量语音交互的创新语言模型

2. 安装包3. 安装fairseq4. 安装flash-attention5. 下载预训练模型6. 启动Gradio Web服务器7. 访问Web界面结语引言在当今人工智能飞速发展的时代，大型语言模型如雨后春笋般涌现，为我们的生活和工作带来了极大的便利。然而，目前大多数语言模型主要支持文本交互，这在一定程度上限制了其在某些场景中的应用。如今，LLaMA-Omni 的出现为我们带来了全新的突破，实现...

(view)

提示词优化、GPTs逆向工程、大语言模型原理、大语言模型优化、开源模型本地私有化部署、从零构建大语言模型、智能体构建以及大语言模型的发展趋势

深入理解和掌握大语言模型的前言技术，涵盖了提示词优化、GPTs逆向工程、大语言模型原理、大语言模型优化、开源模型本地私有化部署、从零构建大语言模型、智能体构建以及大语言模型的发展趋势。通过系统化的学习，不仅掌握理论知识，还能在实际操作中获得宝贵经验。学习如何优化提示词，掌握GPTs逆向工程技术，了解并应用Transformer、BERT、GPT等模型的工作原理，精通检索增强生成、微调和量化技术，掌握开源...

(view)

基于Python的自然语言处理系列（19）：基于LSTM的语言模型实现

在本篇博文中，我们将深入探讨如何使用长短期记忆网络（LSTM）构建一个简单的语言模型。这一模型的基本原理与ChatGPT相似，但实现方式更加简单。我们将以论文《Regularizing and Optimizing LSTM Language Models》为基础，逐步实现代码。 1. 加载数据集我们使用WikiText数据集，它包含丰富的文本内容，非常适合语言建模任务。...

(view)

探索大型语言模型在文化常识方面的理解能力与局限性

介绍论文地址：https://arxiv.org/pdf/2405.04655v1 近年来，大型语言模型（LLM）不仅被广泛应用于各个领域，而且通过大量的基准评估，证明它们能够理解人类所拥有的常识（=Commonsense）。这里的常识指的是世界上大多数人所共有的关于世界的广泛而基本的常识，包括关于日常事件、现象和关系的一般知识。LLM群体在过去投入了大量精力，除了公共常识外，还建立了更为专业的知识库...

(view)

TensorRT-LLM——优化大型语言模型推理以实现最大性能的综合指南

引言随着对大型语言模型 (LLM) 的需求不断增长，确保快速、高效和可扩展的推理变得比以往任何时候都更加重要。NVIDIA 的 TensorRT-LLM 通过提供一套专为 LLM 推理设计的强大工具和优化，TensorRT-LLM 可以应对这一挑战。TensorRT-LLM 提供了一系列令人印象深刻的性能改进，例如量化、内核融合、动态批处理和多 GPU 支持。这些改进使推理速度比传统的基于 CPU 的...

(view)

如何在本地部署大语言模型

近年来，随着大语言模型（如GPT、BERT等）的迅速发展，越来越多的开发者和研究人员希望在本地环境中部署这些强大的模型，以便用于特定的应用场景或进行个性化的研究。本文将详细介绍如何在本地部署大语言模型，涵盖必要的环境配置、模型选择、代码实现及后续优化等方面，助你轻松上手。 1. 环境准备 1.1 硬件要求在部署大语言模型之前，首先需要确保你的硬件环境能够满足模型的运行要求。以下是推荐的硬件配置： CPU...

(view)

上一页 1 2 3 4 5 6 7 8 10 下一页