突破编程_C++_面试（基础知识（13））

面试题45：C++中的字符串如何存储

在C++中，字符串可以通过多种方式存储，但最常见和推荐使用的方式是通过 std::string 类，该类位于 <string> 头文件中。std::string 是一个类模板的实例，通常用于存储字符数组，特别是char类型的数组。
std::string 内部使用动态分配的内存来存储字符数据，这样可以灵活地处理不同长度的字符串。这种动态分配的内存管理使得 std::string 能够自动处理字符串的创建、复制、赋值、拼接和销毁，而无需手动管理内存。
std::string的内部结构包含以下几个部分：
（1）字符数组：存储实际的字符数据，包括字符串的字符内容。
（2）长度信息：通常是一个整数，记录字符串中字符的数量（不包括终止字符’\0’）。
（3）容量信息：指示已分配内存的大小，这通常大于或等于字符串的实际长度，以便在添加更多字符时不需要频繁重新分配内存。
当创建一个 std::string 对象时，它会根据需要自动分配足够的内存来存储字符串。例如：

std::string str = "abc123";

在这个例子中， str 是一个 std::string 对象，它包含字符串 “abc123” 。str 内部会自动分配足够的内存来存储这 7 个字符（包括结束字符’\0’），以及使用成员变量存储的字符串信息（如长度和容量）。
使用 std::string 的好处之一是它自动处理内存管理，减少了内存管理错误（如内存泄漏或越界访问）的风险。此外，std::string 还提供了丰富的成员函数，用于执行常见的字符串操作，如拼接、查找、替换等。
除了 std::string ，C++还提供了 std::wstring 用于存储宽字符（ wchar_t 类型）的字符串，可以用于处于多种字符集（如 utf-8 、 gb2312 等）。

面试题46：std::string 如何管理内存

std::string 在 C++ 中管理内存的方式是通过其内部实现的自动内存管理机制。这通常涉及到动态内存分配和释放，以及对内存使用的优化。以下是 std::string 如何管理内存的一些关键点：
（1）动态内存分配：当创建 std::string 对象或向现有字符串添加内容时，如果需要更多空间来存储字符， std::string 会动态地分配内存。这通常涉及到调用 new （或相应的内存分配函数）来分配足够大小的内存块。
（2）内存增长策略：当 std::string 需要扩展其内部缓冲区以容纳更多字符时，它通常会分配比当前需要更大的内存块。这是为了减少频繁的内存重新分配和复制操作，从而提高性能。这种策略称为内存预留（ memory reservation ）。
（3）内存释放：当 std::string 对象被销毁或缩小其大小时，它会释放不再需要的内存。这通常是通过调用 delete[]（或相应的内存释放函数）来完成的。然而，值得注意的是，std::string通常不会立即释放所有内存回到系统，而是保留一些内存以便将来使用，这被称为内存池（ memory pooling ）。
（4）字符串拷贝和赋值：当 std::string 对象被拷贝或赋值时， std::string 会创建一个新的内存块来存储字符串内容，而不是共享内存。这是为了避免对原始字符串的修改影响到副本。
（5）内存效率： std::string 的设计通常旨在提供合理的内存使用效率。例如，当缩小字符串大小时，std::string 可能不会立即释放所有额外内存，而是保留一部分以便未来增长。这减少了频繁的内存分配和释放操作，从而提高了性能。
（6）异常安全性： std::string 的内存管理实现通常是异常安全的，这意味着即使在内存分配失败的情况下，它也不会导致程序崩溃或数据损坏。
（7）RAII原则： std::string 遵循资源获取即初始化（ Resource Acquisition Is Initialization , RAII ）原则，这意味着其内存管理与其生命周期紧密相关。当std::string对象超出其作用域或被销毁时，其内存也会被自动释放。
总的来说，std::string通过动态内存分配、内存增长策略、内存释放和其他优化技术来管理其内存。这使得 std::string 成为处理字符串时高效且安全的选择。

面试题47：如何处理大量的字符串拼接操作

如果处理大量的字符串拼接操作，或者每次拼接的字符串都非常大，那么性能可能会成为一个问题。在这种情况下，可以考虑以下优化策略：
使用 std::stringstream ：
std::stringstream 允许像使用流一样的方式拼接字符串。它内部使用优化过的缓冲区来存储字符串，从而减少内存分配和复制的次数。

std::stringstream ss;  
ss << "abc" << "123" << "def" << std::endl;  
std::string str = ss.str();

预先分配内存：
如果知道最终字符串的大致大小，可以使用 std::string 的 reserve 成员函数预先分配足够的内存。这可以避免在拼接过程中频繁地重新分配内存。
注意拼接需要使用 append() 方法，使用该方法时，字符串的拼接是在现有 std::string 对象的内存块中进行的，这意味着不需要分配新的内存块来存储结果。因此，在需要频繁拼接字符串的情况下，使用 append() 函数通常比使用 + 运算符更高效。

std::string result;  
result.reserve(estimated_final_size);  
// 然后使用 append() 进行拼接操作

避免小字符串拼接：
如果需要拼接大量的小字符串，可以考虑将它们先存储在一个容器中（如std::vectorstd::string），然后再一次性拼接起来。这样可以减少内存分配和复制的次数。
自定义字符串处理：
对于特定的应用场景，可以考虑实现自定义的字符串处理函数，例如使用特定的算法或数据结构来优化拼接操作。

面试题48：描述 std::string 与其他类型的相互转换

std::string 可以与其他数据类型进行相互转换。以下是一些常见的转换示例：
转换为整数类型
使用 std::stoi、std::stol、std::stoul 等函数可以将 std::string 转换为整数类型（如 int、long、unsigned long 等）。如下为样例代码：

std::string str = "12345";  
int val = std::stoi(str); // 将字符串转换为整数

如果字符串不能被解析为有效的整数，std::stoi 等函数将抛出 std::invalid_argument 异常，或者如果转换结果超出了目标类型的表示范围，将抛出 std::out_of_range 异常。
转换为浮点数类型
使用 std::stof、std::stod 等函数可以将 std::string 转换为浮点数类型（如 float、double）。如下为样例代码：

std::string str = "3.14159";  
float val1 = std::stof(str); // 将字符串转换为单精度浮点数
double val2 = std::stod(str); // 将字符串转换为双精度浮点数

同样，如果字符串不能被解析为有效的浮点数，这些函数将抛出异常。
从整数或浮点数转换为 std::string
使用 std::to_string 函数可以将整数或浮点数转换为 std::string 。如下为样例代码：

int val1 = 12345;  
std::string str1 = std::to_string(val1); // 将整数转换为字符串  
  
double val2 = 3.14159;  
std::string str2 = std::to_string(val2); // 将双精度浮点数转换为字符串

从 std::string 转换为字符数组（C字符串）
使用 c_str() 方法可以将 std::string 转换为字符数组（C字符串）。如下为样例代码：

std::string str = "abc123";  
const char* chStr = str.c_str(); // 获取指向字符串内容的指针

注意：c_str() 返回的是一个指向 std::string 内部数据的常量指针，该数据在 std::string 对象生命周期内有效。如果需要在 std::string 对象之外保留这个字符串，则需要使用 memcpy 做字符串复制。
从字符数组（C字符串）转换为 std::string
可以直接将C风格的字符串（字符数组）赋值给 std::string。如下为样例代码：

const char* chStr = "abc123";  
std::string str(chStr); // 使用C字符串初始化 std::string
std::string str2;  
str2.assign(chStr); // 也可以使用 assign() 方法

面试题49：std::string 的 swap 方法为什么比传统的字符串交换更快

std::string 的 swap 成员函数比传统的字符串交换更快，主要原因是它通常只交换两个字符串对象的内部指针，而不是实际复制字符串内容。这种操作通常被称为无开销交换或无拷贝交换。
传统的字符串交换通常涉及以下步骤：
（1）分配足够的内存来存储其中一个字符串的内容。
（2）将第一个字符串的内容复制到新分配的内存中。
（3）释放第一个字符串原本占用的内存。
（4）将第二个字符串的内容复制到第一个字符串原本占用的内存中。
（5）释放第二个字符串原本占用的内存。
（6）将新分配的内存地址赋给第二个字符串。
这个过程涉及多次内存分配和释放，以及字符串内容的复制，因此效率较低。
相比之下，std::string 的 swap 成员函数只是交换了两个字符串对象内部的指针，不涉及任何内存分配、释放或内容复制。这种操作的开销非常小，因此通常比传统的字符串交换更快。

面试题50：编程实例题：替换所有子字符串（replace() 方法）

std::string 类没有内置的直接替换所有子字符串的方法。可以在一个循环中多次调用 find() 和 replace() 方法，直到 find () 方法返回 std::string::npos ，表示没有更多的匹配项。如下为实现代码：

#include <iostream>  
#include <string>  

void replaceAll(std::string& str, const std::string& strFrom, const std::string& strTo) 
{
	size_t pos = 0;
	while ((pos = str.find(strFrom, pos)) != std::string::npos)
	{
		str.replace(pos, strFrom.length(), strTo);
		pos += strTo.length(); // 更新搜索起始位置  
	}
}

int main() 
{
	std::string str = "abcdefabcdef";
	replaceAll(str, "abc", "123");
	// str 现在为 "123def123def"  
	return 0;
}

面试题51：编程实例题：分割子字符串（split() 方法）

std::string 没有内置的 split 方法来分割字符串。可以使用 std::istringstream 以及 std::getline 函数来分割字符串。如下为实现代码：

#include <iostream>  
#include <sstream>  
#include <vector>  
#include <string>  

std::vector<std::string> split(const std::string& str, char delimiter) 
{
	std::vector<std::string> tokens;
	std::istringstream tokenStream(str);
	std::string token;

	while (std::getline(tokenStream, token, delimiter)) 
	{
		tokens.push_back(token);
	}

	return tokens;
}

int main() {
	std::string str = "abc,123,def";
	char delimiter = ',';
	std::vector<std::string> tokens = split(str, delimiter);

	// tokens 现在为 {"abc","123","def"}

	return 0;
}

breakthrough_01