目录
- 1、创建字符串
- 1.1 使用 ’ ’ 或 " " 创建字符串
- 1.2 使用 str()函数 转换为字符串
- 2、访问字符串
- 2.1 下标索引访问
- 2.2 切片访问
- 2.3 for循环遍历字符串
- 2.4 检查元素是否存在
- 3、字符串基础知识
- 3.1 字符串更新
- 3.2 字符串连接(合并)/复制(重复)
- 3.3 转义字符
- 3.4 打印原始字符 r / R
- 3.5 格式字符串
- 3.6 三引号
- 3.7 f-string
- 3.8 Unicode 字符串
- 4、内置函数
- 4.1 打印输出 print()
- 4.2 确定字符串长度 len()
- 4.3 返回变量类型 type()
- 4.4 转换为字符串 str()
- 4.5 字符串最大/小字符 max()、min()
- 4.6 删除字符串 del
- 5、内置方法
- 5.1 转换
- 5.1.1 字符(串)转换 capitalize()、casefold()、lower()、upper()、title()、swapcase()
- 5.1.2 判断大小写 islower()、isupper()、istitle()
- 5.2 搜索值
- 5.2.1 返回出现次数 count()
- 5.2.2 从左搜索并返回 find()、index()
- 5.2.3 从右搜索并返回 rfind()、rindex()
- 5.3 以 str 开头/结束 startswith()、endswith()
- 5.4 编/解码 encode()、decode()
- 5.5 填充对齐 center()、ljust()、rjust()、zfill()
- 5.6 删除左/右指定字符 lstrip()、rstrip()、strip()
- 5.7 判断字符(串)
- 5.7.1 空白字符 isspace()
- 5.7.2 可打印 isprintable()
- 5.7.3 标识符 isidentifier()
- 5.7.4 字母/数字 isalnum()
- 5.7.5 字母/中文 isalpha()
- 5.7.6 数字 isdigit()、isnumeric()、isdecimal()
- 5.8 格式字符串中指定值 format()、format_map()
- 5.9 拆分/截取字符串 split()、rsplit()、splitlines()
- 5.10 拆分字符串(返回元组) partition()、rpartition()
- 5.11 字符串转换 maketrans()、translate()
- 5.12 元组项目连接到字符串 join()
- 5.13 字符串替换 replace()
- 5.14 字符串 Tab 转换 expandtabs()
- 6、总结
- 总结
字符串是Python中最常用的数据类型
1、创建字符串
1.1 使用 ’ ’ 或 " " 创建字符串
创建字符串很简单,我们可以使用引号(’ ’ 或 " ")来创建字符串,只需为变量分配一个值即可。
str = 'Hello Python'
str = "hello python"
1.2 使用 str()函数 转换为字符串
当然,除了使用引号直接创建字符串之外,我们还可以使用 str() 函数将其他数据类型或对象转换为字符串,其具体用法见下方内置函数。
2、访问字符串
和列表、元组一样,我们既可以使用下标索引访问字符串中的某个元素(得到是一个字符),也可以使用切片访问字符串中的一组元素(得到是子字符串)。
2.1 下标索引访问
下标索引访问字符串分为两大类,即正向索引和反向索引,格式为 str_name[i] ,其中,str_name 表示字符串名,i表示索引值,i可以是正数(正向索引)也可以是负数(反向索引)。
可以得知,str_name[0]表示字符串的第一个字符,str_name[-1]则表示字符串的最后一个字符。
str = 'Hello Py'
print(str[0])
print(str[-1])
H
y
正向索引:从第一个(下标0)开始、第二个(下标1)…
反向索引:从倒数第一个(下标-1)、倒数第二个(下标-2)…
2.2 切片访问
如若对上方描述不太理解,可参考下表:
字符串值 | H | e | l | l | o | P | y | |
正向索引 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
反向索引 | -8 | -7 | -6 | -5 | -4 | -3 | -2 | -1 |
Python访问子字符串,可以使用中括号 [ ] 来截取字符串,即切片访问。
使用切片访问字符串的格式为 str_name[strat : end : step] ,其中,start 表示起始索引,end 表示结束索引,step 表示步长。
str = 'Hello Py'
print(str[0:5])
print(str[-8:-1])
print(str[:])
print(str[::2])
Hello
Hello P
Hello Py
HloP
截取字符串的一部分,遵循左闭右开原则,str[0:2] 是不包含第 3 个字符的。
2.3 for循环遍历字符串
使用 for 循环遍历字符串时,将会输出字符串中的每一个字符。
str_h = 'Hi Py'
for char in str_h:
print(char)
H
i
P
y
2.4 检查元素是否存在
如果我们需要确定在一个字符串中,是否存在相同的字符或者子字符串,可以使用成员运算符中的 in 和 not in 关键字。
关键字 | 描述 |
in | 如果字符串中包含给定的字符返回 True。 |
not in | 如果字符串中不包含给定的字符返回 True。 |
str = 'Hello Python'
print('H' in str)
print('Python' not in str)
True
False
3、字符串基础知识
3.1 字符串更新
我们可以截取字符串的一部分并与其他字段拼接,如下实例:
str = 'Hello World'
print(str[:6] + 'Python')
Hello Python
3.2 字符串连接(合并)/复制(重复)
同列表和元组一样,字符串之间可以使用 + 号和 * 号分别实现字符串的连接(合并)和复制(重复),这意味着它们可以生成一个新的字符串。
1、+连接(合并)
a = 'Hello'
b = 'Python'
print(a + b)
HelloPython
2、*复制(重复)
c = 'Hello'
print(c *)
HelloHelloHelloHelloHello
3.3 转义字符
如果需要在字符中使用特殊字符时,则使用反\斜杠 \ 转义字符,如下表:
3.4 打印原始字符 r / R
原始字符串:所有的字符串都是直 接按照字面的意思来使用,没有转义特殊或不能打印的字符。
原始字符串除在字符串的第一个引号前加上字母 r / R (可以大小写)以外,与普通字符串有着几乎完全相同的语法。
print(r'\n')
print(R'\n')
print(r'\t')
print(r'\a')
\n
\n
\t
\a
3.5 格式字符串
Python支持格式化字符串的输出。尽管这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。
print('我叫 %s ,今年 %d 岁!' % ('pink',))
我叫 pink ,今年 21 岁!
在Python中,字符串格式化使用与 C语言 中 printf() 函数一样的用法。
Python字符串格式化符号如下表所示:
符 号 | 描述 |
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %f 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
格式化操作符辅助指令:
符号 | 功能 |
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
<sp> | 在正数前面显示空格 |
# | 在八进制数前面显示零(‘0’),在十六进制前面显示’0x’或者’0X’(取决于用的是’x’还是’X’) |
0 | 显示的数字前面填充’0’而不是默认的空格 |
% | ‘%%‘输出一个单一的’%’ |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。
3.6 三引号
Python三引号允许一个字符串跨多行,字符串中可以包含换行符、制表符以及其他特殊字符。实例如下:
str = """这是一个多行字符串
多行字符串可以使用制表符
TAB[\t]
也可以使用换行符[\n]
"""
print(str)
这是一个多行字符串
多行字符串可以使用制表符
TAB[ ]
也可以使用换行符[
]
三引号让程序员从引号和特殊字符串的泥潭里面解脱出来,自始至终保持一小块字符串的格式是所谓的WYSIWYG(所见即所得)格式的。
当你需要一块HTML或者SQL时,这时用字符串组合,特殊字符串转义将会非常的繁琐。
errHTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
'''
cursor.execute('''
CREATE TABLE users (
login VARCHAR(),
uid INTEGER,
prid INTEGER)
''')
3.7 f-string
f-string 是 python3.6 之后版本添加的,称之为字面量格式化字符串,是新的格式化字符串的语法。
之前我们习惯用百分号 (%):
name = 'pink'
print('Hello %s' % name)
f-string 格式化字符串以 f 开头,后面跟着字符串,字符串中的表达式用大括号 {} 包起来,它会将变量或表达式计算后的值替换进去,实例如下:
name = 'pink'
print(f'Hello {name}')
print(f'{ + 2}')
baidu = {'name': 'Baidu', 'url': 'https://www.baidu.com'}
print(f'{baidu["name"]}:{baidu["url"]}')
Hello pink
3
Baidu:https://www.baidu.com
用了这种方式明显更简单了,不用再去判断使用 %s,还是 %d。
在 Python 3.8 的版本中可以使用 = 符号来拼接运算表达式与结果:
x =
print(f'{x +}')
y =
print(f'{x + = }')
2
x + 1 = 2
3.8 Unicode 字符串
在Python2中,普通字符串是以8位ASCII码进行存储的,而Unicode字符串则存储为16位unicode字符串,这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀 u。
在Python3中,所有的字符串都是Unicode字符串。
4、内置函数
4.1 打印输出 print()
1、print()函数
print() 函数的功能我们已经非常熟悉了,就是打印输出。
str = 'Hello Python'
print(str)
Hello Python
4.2 确定字符串长度 len()
2、len()函数
当我们要确定一个字符串中有多少个字符时,我们可以使用 len() 函数。
str = 'Hello Python'
print(len(str))
12
4.3 返回变量类型 type()
3、type()函数
使用 type() 函数可以确定变量是什么类型(字符串、列表、元组、字典或集合)。
str = 'Hello Python'
print(type(str))
<class 'str'>
当对 str3 使用 type() 确定变量类型时,会返回 <class 'str'> ,表明这是一个字符串。
4.4 转换为字符串 str()
4、str()函数
我们可以使用 str() 函数将列表、元组、字典、集合和区间等对象转换为字符串,以下将会一一介绍:
将列表转换为字符串
list = ['a', 'b', 'c']
print(type(str(list)))
print(str(list))
<class 'str'>
['a', 'b', 'c']
将元组转换为字符串
tuple = ('A', 'B', 'C')
print(type(str(tuple)))
print(str(tuple))
<class 'str'>
('A', 'B', 'C')
将字典转换为字符串
dict = {'name': 'pink'}
print(type(str(dict)))
print(str(dict))
<class 'str'>
{'name': 'pink'}
将集合转换为字符串
set = {'name', 'gender'}
print(type(str(set)))
print(str(set))
<class 'str'>
{'name', 'gender'}
将区间转换为字符串
range = range(0, 10)
print(type(str(range)))
print(str(range))
<class 'str'>
range(0, 10)
4.5 字符串最大/小字符 max()、min()
5、max()函数和min()函数
max() 函数的作用是返回字符串中最大的字符。min() 函数的作用是返回字符串中最小的字符。
str_m = 'AazZ'
print(max(str_m))
print(min(str_m))
z
A
4.6 删除字符串 del
在Python中,del 函数并不支持删除字符串中的单个字符,但我们可以使用 del 函数删除整个字符串:
str = 'Hello Python'
del str
print(str)
当我们使用 del 函数删除某字符串后,如果再使用 print() 函数打印输出时,会报错NameError: name 'str1' is not defined,表明该字符串未被定义。
5、内置方法
5.1 转换
5.1.1 字符(串)转换 capitalize()、casefold()、lower()、upper()、title()、swapcase()
1、 capitalize()方法
capitalize() 将字符串的第一个字母变成大写,其他字母变小写。
语法
string.capitalize()
参数值
无参数
实例
str = 'hello python'
print(str.capitalize())
Hello python
2、casefold()方法
casefold() 方法返回一个字符串,其中所有字符均为小写。
语法
string.casefold()
参数值
无参数
实例
str = 'Hello Python'
print(str.casefold())
hello python
此方法与 lower() 方法相似,但是 casefold() 方法更强大,更具攻击性,这意味着它将更多字符转换为小写字母,并且在比较两个用 casefold() 方法转换的字符串时会找到更多匹配项。
3、lower()方法
lower() 方法转换字符串中所有大写字符为小写(符号和数字将被忽略)。
语法
string.lower()
参数值
无参数
实例
str = 'Hello Python'
print(str.lower())
hello python
4、upper()方法
upper() 方法将字符串中的小写字母转为大写字母(符号和数字将被忽略)。
语法
string.upper()
参数值
无参数
实例
str = 'Hello Python'
print(str.upper())
HELLO PYTHON
5、title()方法
title() 方法返回"标题化"的字符串,就是说所有单词的首个字母转化为大写,其余字母均为小写。
语法
string.title()
参数值
无参数
实例
str = 'HELLO Python'
print(str.title())
Hello Python
6、swapcase()方法
swapcase() 方法用于对字符串的大小写字母进行转换,即将大写字母转换为小写字母,小写字母会转换为大写字母。
语法
string.swapcase()
参数值
无参数
实例
str = 'Hello Python'
print(str.swapcase())
hELLO pYTHON
5.1.2 判断大小写 islower()、isupper()、istitle()
1、islower()方法
islower() 方法检测字符串是否由小写字母组成。
语法
string.islower()
参数值
无参数
str = 'Hello Python'
print(str.islower())
False
如果所有字符均为小写,则 islower() 方法返回 True,否则返回 False。不检查数字、符号和空格,仅检查字母字符。
2、isupper()方法
isupper() 方法检测字符串中所有的字母是否都为大写。
语法
string.isupper()
参数值
无参数
实例
str = 'Hello Python'
print(str.isupper())
False
如果所有字符均大写,则 isupper() 方法返回 True,否则返回 False。不检查数字、符号和空格,仅检查字母字符。
3、istitle()方法
istitle() 方法检测字符串中所有的单词拼写首字母是否为大写,且其他字母为小写。
语法
string.istitle()
参数值
无参数
实例
str = 'Hello Python'
print(str.istitle())
True
如果文本中的所有单词均以大写字母开头,而单词的其余部分均为小写字母,则 istitle() 方法返回 True。否则返回 False。符号和数字将被忽略。
5.2 搜索值
5.2.1 返回出现次数 count()
count()方法
count() 方法用于统计字符串里某个字符出现的次数。可选参数为在字符串搜索的开始与结束位置。
语法
string.count(value, start, end)
参数值
参数 | 描述 |
value | 必需。字符串。要检索的字符串。 |
start | 可选。整数。开始检索的位置。默认是 0。 |
end | 可选。整数。结束检索的位置。默认是字符串的结尾。 |
实例
txt = "I love apples, apple are my favorite fruit"
print(txt.count("apple",, 24))
1
5.2.2 从左搜索并返回 find()、index()
1、find()方法
find() 方法检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,如果指定范围内如果包含指定索引值,返回的是索引值在字符串中的起始位置。如果不包含索引值,返回 -1。
语法
string.find(value, start, end)
参数值
参数 | 描述 |
value | 必需。要检索的值。 |
start | 可选。开始检索的位置。默认是 0。 |
end | 可选。结束检索的位置。默认是字符串的结尾。 |
实例
字母 “e” 在文本总首次出现的位置:
txt = "Hello, welcome to my world."
x = txt.find("e")
print(x)
1
如果只搜索位置 5 到 10 时,字母 “e” 在文本总首次出现的位置:
txt = "Hello, welcome to my world."
x = txt.find("e",, 10)
print(x)
8
如果找不到该值,则 find() 方法返回 -1,但是 index() 方法将引发异常:
txt = "Hello, welcome to my world."
print(txt.find("q"))
print(txt.index("q"))
Traceback (most recent call last):
File "C:\Users\MK\Desktop\Python方法\str.py", line, in <module>
print(txt.index("q"))
ValueError: substring not found
-
2、index()方法
index() 方法检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,该方法与 find() 方法一样,只不过如果str不在 string中会报一个异常。
语法
string.index(value, start, end)
参数值
参数 | 描述 |
value | 必需。要检索的值。 |
start | 可选。在哪里开始检索。默认是 0。 |
end | 可选。在哪里结束检索。默认是字符串的末尾。 |
实例
字母 “e” 在文本中首次出现在哪里?
txt = "Hello, welcome to my world."
x = txt.index("e")
print(x)
1
如果只在位置 5 和 10 之间搜索时,字母 "e"首次首先在哪里?
txt = "Hello, welcome to my world."
x = txt.index("e",, 10)
print(x)
8
如果找不到该值,则 find() 方法返回 -1,但是 index() 方法将引发异常:
txt = "Hello, welcome to my world."
print(txt.find("q"))
print(txt.index("q"))
-
Traceback (most recent call last):
File "C:\Users\MK\Desktop\Python方法\str.py", line, in <module>
print(txt.index("q"))
ValueError: substring not found
3、find() 和 index() 区别
find() 方法与 index() 方法几乎相同,唯一的区别是,如果找不到该值,index() 方法将引发异常,则 find() 方法将返回 -1。
5.2.3 从右搜索并返回 rfind()、rindex()
1、rfind()方法
rfind() 返回字符串最后一次出现的位置,如果没有匹配项则返回 -1 。
语法
string.rfind(value, start, end)
参数值
参数 | 描述 |
value | 必需。要检索的值。 |
start | 可选。从何处开始检索。默认是 0。 |
end | 可选。在何处结束检索。默认是到字符串的末尾。 |
实例
在哪里最后出现文本中的字母 “e”?
txt = "Hello, welcome to my world."
x = txt.rfind("e")
print(x)
13
如果只在位置 5 和位置 10 之间搜索,文本中最后出现的字母 “e” 在何处?
txt = "Hello, welcome to my world."
x = txt.rfind("e",, 10)
print(x)
8
如果找不到该值,则 rfind() 方法返回 -1,但是 rindex() 方法将引发异常:
txt = "Hello, welcome to my world."
print(txt.rfind("q"))
print(txt.rindex("q"))
-
Traceback (most recent call last):
File "C:\Users\MK\Desktop\Python方法\str.py", line, in <module>
print(txt.rindex("q"))
ValueError: substring not found
2、rindex()方法
rindex() 返回子字符串 str 在字符串中最后出现的位置,如果没有匹配的字符串会报异常,你可以指定可选参数[beg:end]设置查找的区间。
语法
string.rindex(value, start, end)
参数值
参数 | 描述 |
value | 必需。要检索的值。 |
start | 可选。从何处开始检索。默认是 0。 |
end | 可选。在何处结束检索。默认是到字符串的末尾。 |
实例
在哪里最后出现文本中的字母 “e”?
txt = "Hello, welcome to my world."
x = txt.rindex("e")
print(x)
13
如果只在位置 5 和位置 10 之间搜索,文本中最后出现的字母 “e” 在何处?
txt = "Hello, welcome to my world."
x = txt.rindex("e",, 10)
print(x)
8
如果找不到该值,则 rfind() 方法返回 -1,但是 rindex() 方法将引发异常:
txt = "Hello, welcome to my world."
print(txt.rfind("q"))
print(txt.rindex("q"))
-1
Traceback (most recent call last):
File "C:\Users\MK\Desktop\Python方法\str.py", line 3, in <module>
print(txt.rindex("q"))
ValueError: substring not found
3、rfind() 和 rindex() 区别
rfind() 和 rindex() 都是查找指定值的最后一次出现。如果找不到该值,则 rfind() 方法将返回 -1,而 rindex() 方法将引发异常。
5.3 以 str 开头/结束 startswith()、endswith()
1、startswith()方法
startswith() 方法用于检查字符串是否是以指定子字符串开头,如果是则返回 True,否则返回 False。如果参数 beg 和 end 指定值,则在指定范围内检查。
语法
string.startswith(value, start, end)
参数值
参数 | 描述 |
value | 必需。检查字符串是否以其开头的值。 |
start | 可选。整数,规定从哪个位置开始搜索。 |
end | 可选。整数,规定结束搜索的位置。 |
实例
检查位置 7 到 20 是否以字符 “wel” 开头:
txt = "Hello, welcome to my world."
x = txt.startswith("wel",, 20)
print(x)
True
如果字符串以指定的值开头,则 startswith() 方法返回 True,否则返回 False。
2、endswith()方法
endswith() 方法用于判断字符串是否以指定后缀结尾,如果以指定后缀结尾返回 True,否则返回 False。可选参数 “start” 与 “end” 为检索字符串的开始与结束位置。
语法
string.endswith(value, start, end)
参数值
参数 | 描述 |
value | 必需。检查字符串是否以之结尾的值。 |
start | 可选。整数。规定从哪个位置开始检索。 |
end | 可选。整数。规定从哪个位置结束检索。 |
实例
检查字符串是否以短语 “my world.” 结尾:
txt = "Hello, welcome to my world."
x = txt.endswith("my world.")
print(x)
True
检查位置 5 至 11 是否以短语 “my world.” 结尾:
txt = "Hello, welcome to my world."
x = txt.endswith("my world.",, 11)
print(x)
False
如果字符串以指定值结尾,则 endswith() 方法返回 True,否则返回 False。
5.4 编/解码 encode()、decode()
encode()和 decode()
encode() 方法以指定的编码格式编码字符串,decode() 方法以指定的解码格式解码字符串。
errors参数可以指定不同的错误处理方案。
语法
string.encode(encoding=encoding, errors=errors)
string.decode(decoding=decoding, errors=errors)
参数值
参数 | 描述 |
encoding / decoding | 可选。字符串。规定要使用的编码/解码。默认是 UTF-8。 |
errors | 可选。字符串。规定错误方法。合法值是: ‘backslashreplace’ - 使用反斜杠代替无法编码的字符 ‘ignore’ - 忽略无法编码的字符 ‘namereplace’ - 用解释字符的文本替换字符 ‘strict’ - 默认值,失败时引发错误 ‘replace’ - 用问号替换字符 ‘xmlcharrefreplace’ - 用 xml 字符替换字符 |
实例
str = 'pink老师'
str_utf = str.encode("UTF-8")
str_gbk = str.encode("GBK")
print("UTF- 编码:", str_utf8)
print("GBK 编码:", str_gbk)
print("UTF- 解码:", str_utf8.decode('UTF-8', 'strict'))
print("GBK 解码:", str_gbk.decode('GBK', 'strict'))
UTF-8 编码: b'pink\xe8\x80\x81\xe5\xb8\x88'
GBK 编码: b'pink\xc0\xcf\xca\xa6'
UTF-8 解码: pink老师
GBK 解码: pink老师
5.5 填充对齐 center()、ljust()、rjust()、zfill()
1、center()方法
center() 方法返回一个指定的宽度 width 居中的字符串,fillchar 为填充的字符,默认为空格。
语法
string.center(length, character)
参数值
参数 | 描述 |
length | 必需。所返回字符串的长度。 |
character | 可选。填补两侧缺失空间的字符。默认是 " "(空格)。 |
实例
使用字母 “O” 作为填充字符:
txt = "banana"
x = txt.center(, "O")
print(x)
OOOOOOObananaOOOOOOO
2、ljust()方法
ljust() 方法返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串。如果指定的长度小于原字符串的长度则返回原字符串。
语法
string.ljust(length, character)
参数值
参数 | 描述 |
length | 必需。所返回字符串的长度。 |
character | 可选。用于填充缺少空间(在字符串的右侧)的字符。默认值为 " "(空格)。 |
实例
使用字母 “O” 作为填充字符:
txt = "banana"
x = txt.ljust(, "O")
print(x)
bananaOOOOOOOOOOOOOO
3、rjust()方法
rjust() 返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串。如果指定的长度小于字符串的长度则返回原字符串。
语法
string.rjust(length, character)
参数值
参数 | 描述 |
length | 必需。所返回字符串的长度。 |
character | 可选。用于填充缺失空间(在字符串的左侧)字符。默认值为 " "(空格)。 |
实例
使用字母 “O” 作为填充字符:
txt = "banana"
x = txt.rjust(, "O")
print(x)
OOOOOOOOOOOOOObanana
4、zfill()方法
zfill() 方法返回指定长度的字符串,原字符串右对齐,前面填充0。
语法
string.zfill(len)
参数值
参数 | 描述 |
len | 必需。数字,规定要删除的元素的位置。 |
实例
用零填充字符串,直到它们长为 10 个字符:
a = "hello"
b = "welcome to my world"
c = ".000"
print(a.zfill())
print(b.zfill())
print(c.zfill())
00000hello
welcome to my world
000010.000
zfill() 方法在字符串的开头添加零(0),直到达到指定的长度。如果 len 参数的值小于字符串的长度,则不执行填充。
5.6 删除左/右指定字符 lstrip()、rstrip()、strip()
1、lstrip()方法
lstrip() 方法用于截掉字符串左边的空格或指定字符。
语法
string.lstrip(characters)
参数值
参数 | 描述 |
characters | 可选。一组作为前导字符要删除的字符。 |
实例
删除前导字符:
txt = ",,,,,ssaaww.....banana"
x = txt.lstrip(",.asw")
print(x)
banana
2、rstrip()方法
rstrip() 删除 string 字符串末尾的指定字符,默认为空白符,包括空格、换行符、回车符、制表符。
语法
string.rstrip(characters)
参数值
参数 | 描述 |
characters | 可选。一组作为结尾字符要删除的字符。 |
实例
删除结尾字符:
txt = "banana,,,,,ssaaww....."
x = txt.rstrip(",.asw")
print(x)
banan
3、strip()方法
strip() 方法用于移除字符串头尾指定的字符(默认为空格)或字符序列。
语法
string.strip(characters)
参数值
参数 | 描述 |
characters | 可选。一组字符,要删除的前导/尾随字符的字符。 |
实例
删除前导和尾随字符:
txt = ",,,,,rrttgg.....banana....rrr"
x = txt.strip(",.grt")
print(x)
banana
5.7 判断字符(串)
5.7.1 空白字符 isspace()
1、isspace()方法
isspace() 方法检测字符串是否只由空白字符组成。
语法
string.isspace()
参数值
无参数
实例
txt = " s "
x = txt.isspace()
print(x)
False
如果字符串中的所有字符都是空格,则 isspace() 方法将返回 True,否则返回 False。
5.7.2 可打印 isprintable()
2、isprintable()方法
isprintable() 方法检查文本中的所有字符是否可打印。
语法
string.isprintable()
参数值
无参数
实例
txt = "Hello!\nAre you #?"
x = txt.isprintable()
print(x)
False
如果所有字符都是可打印的,则 isprintable() 方法返回 True,否则返回 False。不可打印的字符可以是回车和换行符。
5.7.3 标识符 isidentifier()
3、isidentifier()方法
isidentifier() 方法检查字符串是否是有效标识符。
语法
string.isidentifier()
参数值
无参数
实例
a = "MyFolder"
b = "Demo"
c = "bring"
d = "my demo"
print(a.isidentifier())
print(b.isidentifier())
print(c.isidentifier())
print(d.isidentifier()
True
True
False
False
如果字符串是有效标识符,则 isidentifier() 方法返回 True,否则返回 False。
如果字符串仅包含字母数字字母(a-z)和(0-9)或下划线(_),则该字符串被视为有效标识符。有效的标识符不能以数字开头或包含任何空格。
5.7.4 字母/数字 isalnum()
4、isalnum()方法
isalnum() 方法检测字符串是否由字母和数字组成。
语法
string.isalnum()
参数值
无参数
实例
检查文本中的所有字符是否都是字母数字:
txt = "Company"
x = txt.isalnum()
print(x)
False
如果所有字符均为字母数字,即字母(a-z)和数字(0-9),则 isalnum() 方法返回 True。
非字母数字的例子:(space)!#%&? 等等。
5.7.5 字母/中文 isalpha()
5、isalpha()方法
isalpha() 方法检测字符串是否只由字母或文字组成。
语法
string.isalpha()
参数值
无参数
实例
检查文本中的所有字符是否都是字母:
txt = "Company"
x = txt.isalpha()
print(x)
False
如果所有字符都是字母(a-z),则 isalpha() 方法将返回 True。
非字母的字符例子:(space)!#%&? 等等。
5.7.6 数字 isdigit()、isnumeric()、isdecimal()
6.1、isdigit()方法
isdigit() 方法检测字符串是否只由数字组成。
语法
string.isdigit()
参数值
无参数
实例
检查文本中的所有字符是否都是字母:
a = "\u" # unicode for 0
b = "\uB2" # unicode for ²
print(a.isdigit())
print(b.isdigit())
True
True
如果所有字符都是数字,则 isdigit() 方法将返回 True,否则返回 False。
指数(例如²)也被视作数字。
6.2、isnumeric()方法
isnumeric() 方法检测字符串是否只由数字组成,数字可以是: Unicode 数字,全角数字(双字节),罗马数字,汉字数字。
指数类似 ² 与分数类似 ½ 也属于数字。
语法
string.isnumeric()
参数值
无参数
实例
检查字符是否为数字:
a = "\u" # unicode for 0
b = "\uB2" # unicode for ²
c = "km2"
print(a.isnumeric())
print(b.isnumeric())
print(c.isnumeric())
True
True
False
如果所有字符均为数字(0-9),则 isumeric() 方法返回 True,否则返回 False。
指数(比如 ² 和 ¾)也被视为数字值。
6.3、isdecimal()方法
isdecimal() 方法检查 unicode 对象中的所有字符是否都是小数。
语法
string.isdecimal()
参数值
无参数
实例
检查 unicode 中的所有字符是否都是小数:
a = "\u" # unicode for 0
b = "\u" # unicode for G
print(a.isdecimal())
print(b.isdecimal())
True
False
如果所有字符均为小数(0-9),则 isdecimal() 方法将返回 True。
此方法用于 unicode 对象。
5.8 格式字符串中指定值 format()、format_map()
1、format()方法
format() 方法格式化指定的值,并将其插入字符串的占位符内,占位符使用大括号 {} 定义。
语法
string.format(value1, value2...)
参数值
参数 | 描述 |
value1, value2… | 必需。一个或多个应该格式化并插入字符串的值。值可以是数字,用于指定要删除的元素的位置。 这些值可以是用逗号分隔的值列表、键=值列表,或两者的组合。 这些值可以是任何数据类型。 |
占位符
可以使用命名索引 {price}、编号索引{0}、甚至空的占位符 {} 来标识占位符。
实例
使用不同的占位符值:
txt = "My name is {fname}, I'am {age}".format(fname="Bill", age=64)
txt = "My name is {0}, I'am {1}".format("Bill", 64)
txt = "My name is {}, I'am {}".format("Bill", 64)
print(txt)
print(txt)
print(txt)
My name is Bill, I'am 64
My name is Bill, I'am 64
My name is Bill, I'am 64
格式化类型
在占位符内,您可以添加格式化类型以格式化结果:
格式化类型 | 描述 |
:< | 左对齐结果(在可用空间内) |
:> | 右对齐结果(在可用空间内) |
:^ | 居中对齐结果(在可用空间内) |
:= | 将标志放置在最左侧 |
:+ | 使用加号指示结果是正数还是负数 |
:- | 负号仅用于负值 |
: | 使用空格在正数之前插入一个多余的空格(在负数之前使用减号) |
:, | 使用逗号作为千位分隔符 |
:_ | 使用下划线作为千位分隔符 |
:b | 二进制格式 |
:c | 将值转换为相应的 unicode 字符 |
:d | 十进制格式 |
:e | 科学格式,带有小写字母 E |
:E | 科学格式,带有大写字母 E |
:f | 定点数字格式 |
:F | 定点数字格式,以大写形式显示(将 inf 和 nan 显示为 INF 和 NAN) |
:g | 通用格式 |
:G | 通用格式(将大写 E 用作科学计数法) |
😮 | 八进制格式 |
:x | 十六进制格式,小写 |
:X | 十六进制格式,大写 |
:n | 数字格式 |
:% | 百分比格式 |
2、format_map()方法
format_map() 方法格式化字符串中的指定值。
语法
str.format_map(mapping)
参数值
参数描述mapping字典类型的数据。
实例
str_a = '我是 {name} 老师 {gender} {age} 岁'
dict_ = {'name': 'pink', 'gender': '男', 'age': 21}
print(str_a.format_map(dict_))
我是 pink 老师 男 21 岁
5.9 拆分/截取字符串 split()、rsplit()、splitlines()
1、split()方法
split() 通过指定分隔符从左侧对字符串进行切片,如果第二个参数 num 有指定值,则分割为 num+1 个子字符串。
语法
string.split(separator, max)
参数值
参数 | 描述 |
separator | 可选。规定分割字符串时要使用的分隔符。默认值为空白字符。 |
max | 可选。规定要执行的拆分数。默认值为 -1,即“所有出现次数”。 |
实例
使用逗号后跟空格作为分隔符,分割字符串:
txt = "hello, my name is Bill, I am years old"
x = txt.split(", ")
print(x)
['hello', 'my name is Bill', 'I am 63 years old']
使用 # 号字符作为分隔符:
txt = "apple#banana#cherry#orange"
x = txt.split("#")
print(x)
['apple', 'banana', 'cherry', 'orange']
将字符串拆分为最多 2 个项目的列表:
txt = "apple#banana#cherry#orange"
# 将 max 参数设置为,将返回包含 2 个元素的列表!
x = txt.split("#",)
print(x)
['apple', 'banana#cherry#orange']
split() 方法将字符串拆分为列表。
您可以指定分隔符,默认分隔符是任何空白字符。
**注释:**若指定 max,列表将包含指定数量加一的元素。
2、rsplit()方法
rsplit() 通过指定分隔符从右侧对字符串进行切片,如果第二个参数 num 有指定值,则分割为 num+1 个子字符串。
语法
string.rsplit(separator, max)
参数值
参数 | 描述 |
separator | 可选。规定分割字符串时要使用的分隔符。默认值为空白。 |
max | 可选。指定要执行的拆分数。默认值为 -1,即“所有出现次数”。 |
实例
将字符串拆分为最多 2 个项目的列表:
txt = "apple, banana, cherry"
# 将 max 参数设置为,将返回包含 2 个元素的列表!
x = txt.rsplit(", ",)
print(x)
['apple, banana', 'cherry']
rsplit() 方法从右侧开始将字符串拆分为列表。
如果未指定 “max”,则此方法将返回与 split() 方法相同的结果。
注释: 若指定 max,列表将包含指定数量加一的元素。
3、splitlines()方法
splitlines() 按照行(‘\r’, ‘\r\n’, \n’)分隔,返回一个包含各行作为元素的列表,如果参数 keepends 为 False,不包含换行符,如果为 True,则保留换行符。
语法
string.splitlines(keeplinebreaks)
参数值
参数 | 描述 |
keeplinebreaks | 可选。规定是否应包含换行符(True)或不包含(False)。默认值不包含(False)。 |
实例
拆分字符串,但保留换行符:
txt = "Thank you for your visiting\nWelcome to China"
x = txt.splitlines(True)
print(x)
['Thank you for your visiting\n', 'Welcome to China']
5.10 拆分字符串(返回元组) partition()、rpartition()
1、partition()方法
partition() 方法搜索指定的字符串,并将该字符串拆分为包含三个元素的元组。
第一个元素包含指定字符串之前的部分,第二个元素包含指定的字符串,第三个元素包含字符串后面的部分。
注释:此方法搜索指定字符串的第一个匹配项。
语法
string.partition(value)
参数值
参数 | 描述 |
value | 必需。要检索的字符串。 |
实例
搜索单词 “bananas”,并返回包含三个元素的元组: 1 - “匹配”之前的所有内容2 - “匹配”3 - “匹配”之后的所有内容
txt = "I could eat bananas all day"
x = txt.partition("bananas")
print(x)
('I could eat ', 'bananas', ' all day')
如果找不到指定的值,则 partition() 方法将返回一个元组,其中包含:1 - 整个字符串,2 - 空字符串,3 - 空字符串:
txt = "I could eat bananas all day"
x = txt.partition("apples")
print(x)
('I could eat bananas all day', '', '')
2、rpartition()方法
rpartition() 方法搜索指定字符串的最后一次出现,并将该字符串拆分为包含三个元素的元组。
第一个元素包含指定字符串之前的部分,第二个元素包含指定的字符串,第三个元素包含字符串之后的部分。
语法
string.rpartition(value)
参数值
参数 | 描述 |
value | 必需。要检索的字符串。 |
实例
搜索单词 “bananas” 的最后一次出现,并返回包含三个元素的元组:
- 1 - “匹配”之前的所有内容
- 2 - “匹配”
- 3 - “匹配”之后的所有内容
txt = "I could eat bananas all day, bananas are my favorite fruit"
x = txt.rpartition("bananas")
print(x)
('I could eat bananas all day, ', 'bananas', ' are my favorite fruit')
如果找不到指定的值,则 rpartition() 方法将返回一个元组,其中包含:1 - 整个字符串,2 - 一个空字符串,3 - 一个空字符串:
txt = "I could eat bananas all day, bananas are my favorite fruit"
x = txt.rpartition("apples")
print(x)
('', '', 'I could eat bananas all day, bananas are my favorite fruit')
5.11 字符串转换 maketrans()、translate()
1、maketrans()方法
maketrans() 方法用于创建字符映射的转换表,对于接受两个参数的最简单的调用方式,第一个参数是字符串,表示需要转换的字符,第二个参数也是字符串表示转换的目标。
两个字符串的长度必须相同,为一一对应的关系。
语法
string.maketrans(x[, y[, z]])
参数值
参数 | 描述 |
x | 必需,字符串中要替代的字符组成的字符串。 |
y | 可选,相应的映射字符的字符串。 |
z | 可选,要删除的字符。 |
2、translate()方法
translate() 返回被转换的字符串。
实例
字母 B 替换为 b
txt = "www.Baidu.com"
url = txt.maketrans('B', 'b')
print(txt.translate(url))
www.baidu.com
使用字符串设置要替换的字符,一一对应
x = "aeiou"
y = ""
trans = str.maketrans(x, y)
str = "this is a string"
print(str.translate(trans))
th3s 3s 1 str3ng
设置要删除的字符参数:
txt = "baidu z alibaba Z tencent"
x = "bat"
y = "BAT"
z = "zZ" # 设置删除的字符
trans = txt.maketrans(x, y, z)
print(txt.translate(trans))
print(trans)
BAidu AliBABA TencenT
{98: 66, 97: 65, 116: 84, 122: None, 90: None
5.12 元组项目连接到字符串 join()
join()方法
join() 方法用于将序列中的元素以指定的字符连接生成一个新的字符串。
语法
string.join(iterable)
参数值
参数 | 描述 |
iterable | 必需。所有返回值均为字符串的任何可迭代对象。 |
实例
使用哈希字符作为分隔符,将元组中的所有项目连接到字符串中:
tuple_ = ("baidu", "alibaba", "tencent")
x = "#".join(tuple_)
print(x)
baidu#alibaba#tencent
使用单词 “TEST” 作为分隔符,将字典中的所有项目连接成一个字符串:
dict_ = {"name": "Bill", "country": "USA"}
separator = "TEST"
x = separator.join(dict_)
print(x)
nameTESTcountry
5.13 字符串替换 replace()
replace()方法
replace() 方法把字符串中的 old(旧字符串) 替换成 new(新字符串),如果指定第三个参数max,则替换不超过 max 次。
语法
string.replace(oldvalue, newvalue, count)
参数值
参数 | 描述 |
oldvalue | 必需。要检索的字符串。 |
newvalue | 必需。替换旧值的字符串。 |
count | 可选。数字,指定要替换的旧值出现次数。默认为所有的出现。 |
实例
替换单词 “bananas”:
txt = "I like bananas"
x = txt.replace("bananas", "apples")
print(x)
I like apples
替换所有出现的单词 “one”:
txt = "one one was a race horse, two two was one too."
x = txt.replace("one", "three")
print(x)
three three was a race horse, two two was three too.
替换前两次出现的单词 “one”:
txt = "one one was a race horse, two two was one too."
x = txt.replace("one", "three",)
print(x)
three three was a race horse, two two was one too.
5.14 字符串 Tab 转换 expandtabs()
expandtabs()方法
expandtabs() 方法把字符串中的 tab 符号 \t 转为空格,tab 符号 \t 默认的空格数是 8,在第 0、8、16…等处给出制表符位置,如果当前位置到开始位置或上一个制表符位置的字符数不足 8 的倍数则以空格代替。
语法
string.exandtabs(tabsize)
参数值
参数 | 描述 |
tabsize | 可选。规定制表符大小的数字。默认的 tabsize 是 8。 |
实例
将制表符大小设置为 2 个空格:
txt = "H\te\tl\tl\to"
x = txt.expandtabs()
print(x)
H e l l o
请看看不同制表符大小的结果:
txt = "H\te\tl\tl\to"
print(txt)
print(txt.expandtabs())
print(txt.expandtabs())
print(txt.expandtabs())
print(txt.expandtabs())
H e l l o
H e l l o
H e l l o
H e l l o
H e l l o
6、总结
函数 | 描述 |
print() | 打印输出 |
len() | 确定字符串长度 |
type() | 返回变量类型 |
str() | 转换为字符串 |
max() | 字符串最大字符 |
min() | 字符串最小字符 |
del | 删除字符串 |
方法 | 描述 |
capitalize() | 把首字符转换为大写 |
casefold() | 把字符串转换为小写(处理其他语言且存在大小写) |
lower() | 把字符串转换为小写 |
islower() | 如果字符串中的所有字符都是小写,则返回 True |
upper() | 把字符串转换为大写 |
isupper() | 如果字符串中的所有字符都是大写,则返回 True |
title() | 返回"标题化"字符串:所有单词都以大写开始,其余字母均为小写 |
istitle() | 如果字符串遵循标题规则,则返回 True |
swapcase() | 将字符串中大写转换为小写,小写转换为大写 |
count(str, beg, end) | 返回str出现的次数,beg和end指定范围 |
find(str, beg, end) | 搜索指定的值并返回该位置,beg 和 end 指定范围,不存在返回-1 |
index(str, beg, end) | 搜索指定的值并返回该位置,beg 和 end 指定范围,不存在报异常 |
rfind(str, beg, end) | 类似于 find() ,不过是从右边开始 |
rindex( str, beg, end) | 类似于 index(),不过是从右边开始 |
startswith(str, beg, end) | 检查是否以 str 开头,beg 和 end 指定范围,如果是,返回 True,否则返回 False |
endswith(str, beg, end) | 检查是否以 str 结束,beg 和 end 指定范围,如果是,返回 True,否则返回 False |
encode(‘UTF-8’, ‘strict’) | 编码,出错默认报 ValueError 异常,除非 errors 指定的是’ignore’或者’replace’ |
decode(‘UTF-8’, ‘strict’) | 解码,出错默认报 ValueError 异常,除非 errors 指定的是’ignore’或者’replace’ |
center(width, fillchar) | 返回一个指定的宽度width居中的字符串,fillchar为填充的字符,默认为空格 |
ljust(width, fillchar) | 字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格 |
rjust(width, fillchar) | 字符串右对齐,并使用 fillchar 填充至长度 width 的新字符串,fillchar 默认为空格 |
zfill (width) | 返回长度为 width 的字符串,原字符串右对齐,前面填充0 |
lstrip() | 删除字符串左边的空格或指定字符 |
rstrip() | 删除字符串末尾的空格或指定字符 |
strip() | 在字符串上执行 lstrip()和 rstrip(),返回字符串的剪裁版本 |
isspace() | 如果字符串中的所有字符都是空白字符,则返回 True |
isprintable() | 如果字符串中的所有字符都是可打印的,则返回 True |
isidentifier() | 如果字符串是标识符,则返回 True |
isalnum() | 如果字符串至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False |
isalpha() | 如果字符串至少有一个字符并且所有字符都是字母或中文字则返回 True, 否则返回 False |
isdigit() | 如果字符串只包含数字则返回 True ,否则返回 False |
isnumeric() | 如果字符串中的所有字符都是数字,则返回 True |
isdecimal() | 检查所有字符是否都是十进制数(0~9),是则返回 True, 否则返回 False |
format() | 格式化字符串中的指定值 |
format_map() | 格式化字符串中的指定值(字典) |
split(str, num) | 以 str 为分隔符截取,若 num 指定,则截取 num+1 个子字符串,并返回列表(从左) |
rsplit() | 以 str 为分隔符截取,若 num 指定,则截取 num+1 个子字符串,并返回列表(从右) |
splitlines() | 在换行符处拆分字符串并返回列表 |
partition() | 返回元组,其中的字符串分为三部分(搜索 str 第一次出现) |
rpartition() | 返回元组,其中的字符串分为三部分(搜索 str 最后出现) |
maketrans(x[, y[, z]]) | x – 必需,要替代的字符串, y – 可选,相应映射的字符串, z – 可选,要删除的字符 |
translate() | 返回被转换的字符串 |
join() | 使用字符作为分隔符,将元组中的所有项目连接到字符串中 |
replace(old, new [, max]) | 将字符串中的 old 替换成 new,如果 max 指定,则替换不超过 max |
expandtabs(tabsize) | 把字符串 string 中的 tab 符号转为空格,tab 符号默认的空格数是 8 |