当前位置: 首页 > news >正文

c++ string字符串详解

一.string背景以及需要了解的知识点

1.1STL

string是STL的一部分,但是STL创建的比string晚一些,后面才把string加入到STL里。STL(standard template library)是c++的重要组成部分,可以简单理解为一个囊括了数据结构里面我们学的结构与算法的集合。STL里把顺序表,字符串,链表等数据结构整理整合起来。因为如果是我们自己实现这些东西,可能每个人实现的方法,逻辑,名字可能都不一样,在使用时会存在问题,为了便于使用,c++的祖师爷选择统一这些。STL不仅仅是一个可以不同人多人使用的组件库,也是保罗数据结构与算法的软件框架。

STL具有许多版本,这里作者主要说的是SGI版本的。STL有着六大组件,分别有:

容器(container):各种基本数据结构

迭代器(iterator):常使用在遍历容器,又可以用在连接容器和算法;

算法(algorithm):提供了各种基本算法如sort、search等;

适配器(也称作配接器)(adapter):可改变容器(containers )、迭代器(iterators)或函数对象(function object)接口的一种组件;

函数对象(也称作仿函数)(function object):用类型包装函数,将函数类型化;

分配器(也称作空间配置器)(allocator):内部调用malloc分配空间;

示意图如下

因为string类创建比STL早一些,没有STL里其他那些数据结构那么熟练,因此string提供的函数有些冗余,有的可能会比较重复,所以这里作者主要介绍一部分常用的和必须了解的成员函数。点此处即可查看官网string。

1.2string的迭代器遍历的前情知识点

string类要使用的时候需要引用头文件string

#include<string>

1.2.1auto关键字

auto关键字主要用于替换长代码,简化代码,在敲代码的时候我们可能会检查遇到需要用命名空间::变量名的方式去指定某个对象,有的时候这种方式还是多层的,例如命名空间::类对象::变量,可能一个变量这样的前缀没有太多感受,但是一行代码通常是需要多次使用变量的,那个时候多次累加下来代码会非常冗余。因此就出现了auto。

auto主要用于使它修饰的变量在编译器里会自动推导该变量应该是什么类型的,通常使用在for循环遍历数据结构时。

用auto声明指针类型时,用auto和auto*没有任何区别,但是auto声明引用类型时必须要添加&。

当在同一行声明指针类型时,这些变量必须是相同的类型,否则编译器会报错,因为编译器实际只对第一个类型进行推导,然后按照这个来推导剩下的其他指针的类型。

auto不能作为函数的参数,可以做返回值,但是建议谨慎使用。并且auto不能声明数组

1.2.2for循环遍历

这里的for循环使用到了auto,格式如下:

string x(10,'x'); for( auto : x) { ..... }

for循环实际上是借助迭代器(begin(),end())来实现的,迭代器可以让不同的数据结构都用同一个方式来运行,不需要关注底层结构和实现细节。比方说链表和顺序表,链表物理上不连续,开辟的空间东一块西一块,访问下一个节点需要指向下一个节点的指针,顺序表则是简单的指针++即可,但是迭代器就可以忽略这些,只需要按照迭代器就可以依次遍历。这也不仅仅只适用于库里面已经有的数据结构,我们自己写的数据结构也可以使用。只需要额外写begin(),end()函数,有需要也可以写rbegin()和rend()函数,下面是四者的指向图:

需要说明begin()和end()是正向迭代器,通过++来继续往下走,我们想要迭代器里面的内容时就需要解引用(可以理解为指针,但是注意迭代器不是指针)。而rbegin()和rend()两者是反向迭代器,可以通过++来倒着遍历,这里rbegin++就是朝着容器起始位置移动,是与正向迭代器的方向相反的。

范围for可以作用到容器和数组对象上进行遍历,下面是使用案例:

string x(10, 'x'); auto ch=x.begin(); for(ch ; ch!=x.end() ; ch++) { cout << *ch << " "; }

一般人们基本上都会用第一个auto 遍历的那个,上面这个仅仅作为演示。

二.string常用接口

2.1string类对象的常见构造

官网:点击这里进入

下面是类string的成员变量:

//这里作者仅仅列出来比较重要的一部分,详细情况可以去前面给的官网查看 class string { private: char* _str; size_t _size; //已经存放个数,从1开始计算 size_t _capacity; //空间开辟的大小 };

首先就是默认构造函数,会构造空的string类对象,内容就是空字符串。还有传char*对象来构造,传n个字符c构造,传其他字符串构造等,下面是示例:

string a(); //默认构造 string b("xxxxx"); //传char*对象 string c(10,'x'); //构造n个c字符的字符串 string d(b); //传其他的字符串构造

2.2string类对象的容量操作

首先如表格所示:

函数名称功能说明
size()返回字符串的有效数据个数
length()返回字符串有效字符长度,与size()作用相同
capacity()返回字符串开辟的空间总大小
empty()检查字符串是否为空

clear()

清除字符串的所有有效数据
reserve()为字符串预留指定空间
resize()将有效字符的个数改为n个,多出来的空间用字符c来填充

需要注意的是reserve函数一般是用于建立好对象之后知道要存放多少内容,就提前开辟出空间,不用因为数据内容过多而一直扩容的效率浪费,如果调整时字符串存储数据,并且调整后的capacity<size,那么reserve函数会缩小到size大小,而不会损失数据内容。resize函数则是用来改变size的大小的,假设调整后size为size2,调整前为size1,那么如果size1<size2,那么会用给定的参数字符c来添加到剩余的空间里,直到填充满size2。当size1>size2,那么这里就会删除数据。

size()与length()方法两者底层实现原理相同,引入size()的目的是为了和其他容器的接口保持一致,一般基本情况下基本用size()。

clear()函数只是把string里面的有效数据清空,并不会改变capacity的大小,开辟好的空间还是在那里放着。

resize( size_t n)与resize( size_t n, char c)都是把有效字符个数改变到n个,前者会用0来填充多余的空间,后者用字符c来填充。如果size变小,那么capacity的大小不会改变,而size变大则有可能改变capacity的大小,即可能增容。

2.3string类对象的访问以及遍历操作

还是先看表:

函数名称功能说明
operator[ ]返回对应下标位置的数据,可以用于修改数据
begin(),end()begin()获得第一个有效数据的迭代器,end()获得最后一个有效数据的下一个位置的迭代器
rbegin(),rend()rbegin()是倒数的第一个有效数据,rend是倒数最后一个数据(即第一个数据)的下一个位置
范围forc++11支持的更简洁的范围for的遍历

这里的begin和end还有rbegin和rend都是前面说的迭代器(或者说用这几个会返回对应位置的迭代器)。迭代器一般有四种,iterator , const_iterator , reverse_iterator , const_reverse_iterator。分别代表普通迭代器,不可变迭代器,反向迭代器,不可变反向迭代器,这里的不可变是指不可以通过迭代器改变数据,而不是迭代器不可以++来改变迭代器指向的数据。

2.4string类对象的修改操作

还是先看表:

函数名称函数名称
push_back()尾插一个字符
append()在尾部追加字符串
operator+=在字符串后追加字符或字符串
c_str返回c语言格式的字符串(char*)
find()从给定位置往后查找字符
rfind()从给定位置倒着往前开始查找字符
substr()从给定位置开始截取n个字符并返回

这里find函数会从pos位置开始找如果不传pos,那么就会默认从0位置开始找,如果找不到就会返回npos也就是size_t类型最大值,表示找不见。

在字符串 x 尾部追加字符c 的时候,x.push_back(c)或者x.append(c)或者x+=c,这三张都可以,只不过一般常用+=,因为这个不近可以连接字符,也可以连接字符串。

2.5string类非成员函数

依旧是表:

函数功能说明
operator+跟+=作用一样,只是参数第一个可能不是this指针。需要注意这个传值所以拷贝比较多,深拷贝效率低,尽量少用。
operator>>我们可以cin >> 输入字符串内容
operator<<我们可以cout << 输出字符串内容
getline()获取字符串以换行符为结束标志(空格也算做字符串内容)
relational operators关系运算符,用来比较大小(> , < , == , != , >= , <= )

这些函数不写在类里面做成员函数是因为成员函数传参会默认第一个this指针,而这些函数第一个参数不是类变量,如果这些函数里面有用到成员变量那么就只能用友元来访问。

三.拷贝问题拓展

拷贝一般分为浅拷贝,深拷贝和写时拷贝。

浅拷贝是把对象的值进行拷贝,只拷贝值,当对象的数据存储在动态开辟也就是堆里面的时候,浅拷贝就不能很好的使用。对于动态开辟的空间,浅拷贝只是把空间的地址给了拷贝完成对象,这个时候两个对象都共同指向同一块动态开辟的空间,一个修改了之后另一个对象的数据也会改变,并且如果释放一个对象的空间,另一个也被释放,等到释放后者时就会报错。浅拷贝只适用于内置类型或不需要申请资源的对象。对于需要申请资源的对象的拷贝就需要进行深拷贝。

深拷贝针对需要申请资源的对象,当对象存储在堆里面需要我们自己开辟空间的时候,拷贝时就需要我们自己申请空间并且把对方的数据写入我们新申请好的空间里,这样两者的数据修改,释放空间就不会影响到对方。深拷贝是需要我们自己手动实现并且专门针对需要申请空间的对象。

写时拷贝是一种直到大难临头才开始拯救的做法。他会多开一块空间来存放一个数,记录这块空间有多少个引用,如果是一个引用那么就说明只有一个变量指向他。但如果是多个引用就要开始注意了,当其中的变量只是访问数据那么什么事情都不会有,但如果是要修改数据,那么就会重新开辟一块空间来存放数据并修改,同时原来那个数据的引用计数会--。对于多个引用的空间,当我们想对其中一个对象释放空间的操作,则只是删除指针并且引用计数减一而并不释放对象,只有当引用计数为0时才会释放空间。

http://www.jsqmd.com/news/648143/

相关文章:

  • 渗透测试中的优先级选择:以Misdirection靶机为例解析如何避免死磕
  • IndexTTS-2-LLM与Tacotron2对比:新一代TTS优势分析
  • DeepSeek linux-6.19/net/ipv6/addrconf.c 源码分析
  • 2025_NIPS_MASTER: Enhancing Large Language Model via Multi-Agent Simulated Teaching
  • 从Word2Vec到BERT:前馈网络(FFNN)在NLP预训练模型里扮演了什么角色?
  • 深入理解Millennium的FFI机制:TypeScript与Lua的完美交互
  • 未来5年最“钱“景岗位揭晓:AI产品经理,普通人如何从0到1逆袭?(内含3步进阶法+学习资源)
  • 2025_NIPS_HyperMARL: Adaptive Hypernetworks for Multi-Agent RL
  • Windows 10/11网络配置全攻略:手把手教你修改IPv4地址(含子网掩码自动计算)
  • 「游戏史话第1期」莉莉丝的远征:从“差评”打工人,到狂揽百亿的出海领军者
  • translategemma-4b-it多场景:单图翻译、批量图处理、API服务、桌面应用
  • C++递归算法使用;C++指针的使用;
  • AutoLisp实战:从零到一构建你的第一个绘图工具
  • 2026年质量好的宠物用品铁罐推荐品牌厂家 - 行业平台推荐
  • TG个人发卡机器人系统源码 支持双语言 二次开发版本
  • GPT-6爆表!200万Token+原生多模态,AI编码能力直接起飞!
  • 石榴解 × KnowFlow:一套面向 C 端用户的健康科普 AI 知识库解决方案,如何跑通落地
  • 豆包 Rocky Linux 10.1 环境下 100 道 grep 命令高频面试题 + 详细答案
  • BFF 架构决策与落地实践:从第一性原理到工程取舍
  • **发散创新:基于Go语言的轻量级Web容器实战与性能优化**在现代微服务架构中,**Web容器**不仅是应用运
  • 从翻译到定制:手把手教你用Buildroot 2025.05手册玩转嵌入式Linux BSP开发
  • Lychee开源大模型部署案例:哈工大深圳NLP团队出品的图文检索精排方案
  • 终极指南:如何在资源受限嵌入式系统中高效实现Modbus通信
  • 006、规划模块(三):分层任务网络与自动化规划器
  • 任务管理器怎么打开?【图文讲解】电脑卡死怎么关程序?任务管理器快捷键?电脑结束任务快捷键?6 种超简单方法,电脑卡死一键救急!
  • Java工程师视角:j-langchain 快速上手 Agent
  • 四轴机械臂从仿真到动起来:基于STM32和ROS的MoveIt串口通信保姆级教程
  • Spring Cloud知识点总结
  • 【从零开始学 React | 第九章】Class类组件zustand
  • 中国首部纯 AI 制作院线电影《第一大道》高清资源下载与观影指南