Trans_搜你所想

【AI大模型】Transformers大模型库（七）：单机多卡推理之device_map

二、单机多卡推理之device_map 2.1 概述 2.2 自动配置，如device_map="auto" 2.3 手动配置，如device_map="cuda:1" 三、总结一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。本文重点介绍如何使用device_map进行单机多卡推理。二、单机多...

(view)

ESP-IDF OTA升级过程中遇到的“esp_transport_read returned:-1 and errno:128”问题（3）

接前一篇文章：ESP-IDF OTA升级过程中遇到的“esp_transport_read returned:-1 and errno:128”问题（2）这几天一直在和乐鑫ESP-IDF的OTA机制和工程代码较劲。自从比笔者打开蓝牙功能，使得App固件文件陡然变大之后（223KB -> 1567KB），原本100%可以升级成功的程序成功率突然降得很低了。第一天反复测试得到的现象是：（1）同一程序在升级...

(view)

【JAVA进阶篇教学】第十九篇：Spring Boot中使用@Transactional注解

目录一、什么是事务二、@Transactional注解的使用三、代码示例 3.1. 创建实体类 3.2. 创建Repository接口 3.3. 创建服务类 3.4. 创建控制器四、事务失效场景五、事务传播和隔离级别 5.1. 事务传播 5.2. 隔离级别一、什么是事务事务是一组操作，这些操作要么全部执行成功，要么全部回滚，确保数据的一致性。事务的四个重要特性（ACID）是：原子性 (A...

(view)

用 Sentence Transformers v3 训练和微调嵌入模型

Sentence Transformers 是一个 Python 库，用于使用和训练各种应用的嵌入模型，例如检索增强生成 (RAG)、语义搜索、语义文本相似度、释义挖掘 (paraphrase mining) 等等。其 3.0 版本的更新是该工程自创建以来最大的一次，引入了一种新的训练方法。在这篇博客中，我将向你展示如何使用它来微调 Sentence Transformer 模型，以提高它们在特定任务上的性...

(view)

自然语言处理中的RNN、LSTM、TextCNN和Transformer比较

引言在自然语言处理（NLP）领域，理解和应用各种模型架构是必不可少的。本文将介绍几种常见的深度学习模型架构：RNN（循环神经网络）、LSTM（长短期记忆网络）、TextCNN（文本卷积神经网络）和Transformer，并通过PyTorch代码展示其具体实现。这些模型各具特点，适用于不同类型的NLP任务。 1. 循环神经网络（RNN）概述 RNN是一种用于处理序列数据的神经网络。与传统的神经网络不同，...

(view)

【AI大模型】Transformers大模型库（四）：AutoTokenizer

目录一、引言二、自动分词器（AutoTokenizer） 2.1 概述 2.2 主要特点 2.3 代码示例三、总结一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测、训练等服务。本文重点介绍自动分词器（AutoTokenizer）。二、自动分词器（AutoTokenizer） 2.1 ...

(view)

融合Transformer与CNN，实现各任务性能巅峰，可训练参数减少80%

论文er看过来，今天给各位推荐一个热门创新方向：CNN+Transformer。众所周知，CNN通过多层卷积自动学习空间层级特征，能够有效提取图像局部特征。而Transformer通过自注意力机制全局建模，能够有效处理长距离依赖关系。通过结合这两者的优势，我们不仅可以在保持运算效率的同时，提高模型在多种计算机视觉任务中的性能，还能实现较好的延迟和精度之间的权衡。目前，这种策略通过多种方式融合两种模型的...

(view)

Cloud Translation 价格

Cloud Translation 价格您需要按月为 Cloud Translation 处理的内容量付费。您需要支付的具体费用取决于您使用的 API 方法和翻译模型。所列价格以美元 (USD) 为单位。如果您使用非美元货币付费，请参阅 Cloud Platform SKU 上以您的币种列出的价格。如需详细了解价格信息，请参阅下列任一版本的 Cloud Translation 价格： Cloud Tr...

(view)

C#面：Server.Transfer和Response.Redirect的区别

C#中的Server.Transfer和Response.Redirect都是用于在Web应用程序中进行页面跳转的方法，但它们有一些区别。服务器传输： Server.Transfer方法是在服务器端进行页面跳转的方法。它通过将请求转发给另一个页面来实现跳转，而不会向客户端发送任何响应。跳转后的页面可以访问原始页面的所有上下文信息，如请求参数、表单数据等。Response.Redirect方法是在客户端进行...

(view)

INS 论文分享：一种用于交通流预测的多通道时空Transformer模型

我们在长期交通流预测方面的最新研究成果，该成果已发表在信息学领域的顶级期刊《Information Sciences》上，论文题目为《A Multi-Channel Spatial-Temporal Transformer Model for Traffic Flow Forecasting》。该论文的第一作者及通讯作者为肖建力老师，第二作者为硕士生龙佰超。此研究展示了我们团队在该领域的最新进展，并为未来的...

(view)

上一页 1 2 3 4 5 6 7 8 10 下一页