面试题45:C++中的字符串如何存储

在C++中,字符串可以通过多种方式存储,但最常见和推荐使用的方式是通过 std::string 类,该类位于 <string> 头文件中。std::string 是一个类模板的实例,通常用于存储字符数组,特别是char类型的数组。
std::string 内部使用动态分配的内存来存储字符数据,这样可以灵活地处理不同长度的字符串。这种动态分配的内存管理使得 std::string 能够自动处理字符串的创建、复制、赋值、拼接和销毁,而无需手动管理内存。
std::string的内部结构包含以下几个部分:
(1)字符数组:存储实际的字符数据,包括字符串的字符内容。
(2)长度信息:通常是一个整数,记录字符串中字符的数量(不包括终止字符’\0’)。
(3)容量信息:指示已分配内存的大小,这通常大于或等于字符串的实际长度,以便在添加更多字符时不需要频繁重新分配内存。
当创建一个 std::string 对象时,它会根据需要自动分配足够的内存来存储字符串。例如:

std::string str = "abc123";

在这个例子中, str 是一个 std::string 对象,它包含字符串 “abc123” 。str 内部会自动分配足够的内存来存储这 7 个字符(包括结束字符’\0’),以及使用成员变量存储的字符串信息(如长度和容量)。
使用 std::string 的好处之一是它自动处理内存管理,减少了内存管理错误(如内存泄漏或越界访问)的风险。此外,std::string 还提供了丰富的成员函数,用于执行常见的字符串操作,如拼接、查找、替换等。
除了 std::string ,C++还提供了 std::wstring 用于存储宽字符( wchar_t 类型)的字符串,可以用于处于多种字符集(如 utf-8 、 gb2312 等)。

面试题46:std::string 如何管理内存

std::string 在 C++ 中管理内存的方式是通过其内部实现的自动内存管理机制。这通常涉及到动态内存分配和释放,以及对内存使用的优化。以下是 std::string 如何管理内存的一些关键点:
(1)动态内存分配:当创建 std::string 对象或向现有字符串添加内容时,如果需要更多空间来存储字符, std::string 会动态地分配内存。这通常涉及到调用 new (或相应的内存分配函数)来分配足够大小的内存块。
(2)内存增长策略:当 std::string 需要扩展其内部缓冲区以容纳更多字符时,它通常会分配比当前需要更大的内存块。这是为了减少频繁的内存重新分配和复制操作,从而提高性能。这种策略称为内存预留( memory reservation )。
(3)内存释放:当 std::string 对象被销毁或缩小其大小时,它会释放不再需要的内存。这通常是通过调用 delete[](或相应的内存释放函数)来完成的。然而,值得注意的是,std::string通常不会立即释放所有内存回到系统,而是保留一些内存以便将来使用,这被称为内存池( memory pooling )。
(4)字符串拷贝和赋值:当 std::string 对象被拷贝或赋值时, std::string 会创建一个新的内存块来存储字符串内容,而不是共享内存。这是为了避免对原始字符串的修改影响到副本。
(5)内存效率: std::string 的设计通常旨在提供合理的内存使用效率。例如,当缩小字符串大小时,std::string 可能不会立即释放所有额外内存,而是保留一部分以便未来增长。这减少了频繁的内存分配和释放操作,从而提高了性能。
(6)异常安全性: std::string 的内存管理实现通常是异常安全的,这意味着即使在内存分配失败的情况下,它也不会导致程序崩溃或数据损坏。
(7)RAII原则: std::string 遵循资源获取即初始化( Resource Acquisition Is Initialization , RAII )原则,这意味着其内存管理与其生命周期紧密相关。当std::string对象超出其作用域或被销毁时,其内存也会被自动释放。
总的来说,std::string通过动态内存分配、内存增长策略、内存释放和其他优化技术来管理其内存。这使得 std::string 成为处理字符串时高效且安全的选择。

面试题47:如何处理大量的字符串拼接操作

如果处理大量的字符串拼接操作,或者每次拼接的字符串都非常大,那么性能可能会成为一个问题。在这种情况下,可以考虑以下优化策略:
使用 std::stringstream :
std::stringstream 允许像使用流一样的方式拼接字符串。它内部使用优化过的缓冲区来存储字符串,从而减少内存分配和复制的次数。

std::stringstream ss;  
ss << "abc" << "123" << "def" << std::endl;  
std::string str = ss.str();

预先分配内存:
如果知道最终字符串的大致大小,可以使用 std::string 的 reserve 成员函数预先分配足够的内存。这可以避免在拼接过程中频繁地重新分配内存。
注意拼接需要使用 append() 方法,使用该方法时,字符串的拼接是在现有 std::string 对象的内存块中进行的,这意味着不需要分配新的内存块来存储结果。因此,在需要频繁拼接字符串的情况下,使用 append() 函数通常比使用 + 运算符更高效。

std::string result;  
result.reserve(estimated_final_size);  
// 然后使用 append() 进行拼接操作

避免小字符串拼接:
如果需要拼接大量的小字符串,可以考虑将它们先存储在一个容器中(如std::vectorstd::string),然后再一次性拼接起来。这样可以减少内存分配和复制的次数。
自定义字符串处理:
对于特定的应用场景,可以考虑实现自定义的字符串处理函数,例如使用特定的算法或数据结构来优化拼接操作。

面试题48:描述 std::string 与其他类型的相互转换

std::string 可以与其他数据类型进行相互转换。以下是一些常见的转换示例:
转换为整数类型
使用 std::stoi、std::stol、std::stoul 等函数可以将 std::string 转换为整数类型(如 int、long、unsigned long 等)。如下为样例代码:

std::string str = "12345";  
int val = std::stoi(str); // 将字符串转换为整数

如果字符串不能被解析为有效的整数,std::stoi 等函数将抛出 std::invalid_argument 异常,或者如果转换结果超出了目标类型的表示范围,将抛出 std::out_of_range 异常。
转换为浮点数类型
使用 std::stof、std::stod 等函数可以将 std::string 转换为浮点数类型(如 float、double)。如下为样例代码:

std::string str = "3.14159";  
float val1 = std::stof(str); // 将字符串转换为单精度浮点数
double val2 = std::stod(str); // 将字符串转换为双精度浮点数

同样,如果字符串不能被解析为有效的浮点数,这些函数将抛出异常。
从整数或浮点数转换为 std::string
使用 std::to_string 函数可以将整数或浮点数转换为 std::string 。如下为样例代码:

int val1 = 12345;  
std::string str1 = std::to_string(val1); // 将整数转换为字符串  
  
double val2 = 3.14159;  
std::string str2 = std::to_string(val2); // 将双精度浮点数转换为字符串

从 std::string 转换为字符数组(C字符串)
使用 c_str() 方法可以将 std::string 转换为字符数组(C字符串)。如下为样例代码:

std::string str = "abc123";  
const char* chStr = str.c_str(); // 获取指向字符串内容的指针

注意:c_str() 返回的是一个指向 std::string 内部数据的常量指针,该数据在 std::string 对象生命周期内有效。如果需要在 std::string 对象之外保留这个字符串,则需要使用 memcpy 做字符串复制。
从字符数组(C字符串)转换为 std::string
可以直接将C风格的字符串(字符数组)赋值给 std::string。如下为样例代码:

const char* chStr = "abc123";  
std::string str(chStr); // 使用C字符串初始化 std::string
std::string str2;  
str2.assign(chStr); // 也可以使用 assign() 方法

面试题49:std::string 的 swap 方法为什么比传统的字符串交换更快

std::string 的 swap 成员函数比传统的字符串交换更快,主要原因是它通常只交换两个字符串对象的内部指针,而不是实际复制字符串内容。这种操作通常被称为无开销交换或无拷贝交换。
传统的字符串交换通常涉及以下步骤:
(1)分配足够的内存来存储其中一个字符串的内容。
(2)将第一个字符串的内容复制到新分配的内存中。
(3)释放第一个字符串原本占用的内存。
(4)将第二个字符串的内容复制到第一个字符串原本占用的内存中。
(5)释放第二个字符串原本占用的内存。
(6)将新分配的内存地址赋给第二个字符串。
这个过程涉及多次内存分配和释放,以及字符串内容的复制,因此效率较低。
相比之下,std::string 的 swap 成员函数只是交换了两个字符串对象内部的指针,不涉及任何内存分配、释放或内容复制。这种操作的开销非常小,因此通常比传统的字符串交换更快。

面试题50:编程实例题:替换所有子字符串(replace() 方法)

std::string 类没有内置的直接替换所有子字符串的方法。可以在一个循环中多次调用 find() 和 replace() 方法,直到 find () 方法返回 std::string::npos ,表示没有更多的匹配项。如下为实现代码:

#include <iostream>  
#include <string>  

void replaceAll(std::string& str, const std::string& strFrom, const std::string& strTo) 
{
	size_t pos = 0;
	while ((pos = str.find(strFrom, pos)) != std::string::npos)
	{
		str.replace(pos, strFrom.length(), strTo);
		pos += strTo.length(); // 更新搜索起始位置  
	}
}

int main() 
{
	std::string str = "abcdefabcdef";
	replaceAll(str, "abc", "123");
	// str 现在为 "123def123def"  
	return 0;
}

面试题51:编程实例题:分割子字符串(split() 方法)

std::string 没有内置的 split 方法来分割字符串。可以使用 std::istringstream 以及 std::getline 函数来分割字符串。如下为实现代码:

#include <iostream>  
#include <sstream>  
#include <vector>  
#include <string>  

std::vector<std::string> split(const std::string& str, char delimiter) 
{
	std::vector<std::string> tokens;
	std::istringstream tokenStream(str);
	std::string token;

	while (std::getline(tokenStream, token, delimiter)) 
	{
		tokens.push_back(token);
	}

	return tokens;
}

int main() {
	std::string str = "abc,123,def";
	char delimiter = ',';
	std::vector<std::string> tokens = split(str, delimiter);

	// tokens 现在为 {"abc","123","def"}

	return 0;
}
02-14 08:37