python无疑是最近最受欢迎的编程语言之一,尤其以语法简洁著称。

人生苦短,我用Python。

Python字符串是一个很神奇的东西,尤其是字符串格式化的部分。我们现在来看看。

首先,明确一点,Python中单引号、双引号引起来的都是字符串,两者并没有区别。与Java中不一样,Java中,单引号只能引起一个字符,双引号才是字符串。

注意,#在Python中表示注释的开始,类似于Java中的//。

字符串常用操作,现在假设names="developer":

判断字符串以什么开头,或以什么结尾

names.startswith("deve") # 返回True,和Java中的names.startsWith("deve")作用一样。

names.endswith("oper") # 返回True,和Java中的names.endsWith("deve")作用一样。

判断字符串是否全是字母、或数字、或空格

names.isalpha() # 判断names是否都是字母,此处返回True。

names.isdigit() # 判断names是否都是数字,此处返回False。

names.isspace() # 判断names是否都是空白符号(空格、制表符、回车换行符),此处返回False。

判断字符串是否全是大写、或小写

names.islower() # 判断是否全是小写字母。

names.isupper() # 判断是否全是大写字母。

字符串中查找字符串

names.find("e") # 查找e在names中第一次出现的位置,找不到返回-1。

find的函数会返回"e"在names中第一次出现的位置,那要查找最后一次出现的位置呢?用rfind()

names.rfind('e') # 从右边开始查找,查找e在names中最后一次出现的位置,找不到返回-1,类似于Java中的lastIndexOf()。

把列表中的每个元素用字符串连接起来

names.join(['1', '2']) # 返回"1developer2",列表中需要全部是str类型,否则出错。

把字符串转成小写、或大写

names.lower()

names.upper()

names.swapcase() # 如果现在names是大写,那么转成小写,反之亦然。

字符串特定字符替换成指定字符

names.replace(old, new[, count]) # 把names中的old字符串替换成new,最多替换count次。不支持正则表达式替换。其中,如果指定第三个参数count,则表示最多替换count次。

例如:

names.replace("er", "sir") # 返回"developsir",不支持正则表达式。要想使用正则表达式替换则应使用re.sub(pattern, repl, string[, count=0])

字符串分割

names.split() # 按照空白字符分割(换行符制表符空格都是空白字符),不支持正则表达式。

names.split("e") # 按照"e"分割,返回["d", "v", "lop", "r"]。

names.split("e", 1) # 按照e分割,最大分割次数为1,返回["d", "veloper"]。

names.rsplit([sep[, maxsplit]]) # 根据sep,从右边开始,分割names,最多分割maxsplit次。

例如:

names.rsplit("e", 1) # 返回["develop", "r"]。

去除字符串两端的字符

names.strip() # 去除names两边的字符,可以传参数,不传参数代表只去除两边的空白字符,返回去除后剩余的字符串。

names.lstrip() # 去除左边的特定字符,默认是空白符。

names.rstrip() # 去除右边的特定字符,默认是空白符。

names.strip("dre") # 返回"velop"。

按指定顺序,一个一个替换字符串中的字符

translate函数,例如:

from string import maketrans

names.translate(maketrans('ab', 'cd')) # 表示按照顺序,把names中的a替换c、b替换成d,返回替换后的字符串。

字符串格式化(重点):

类似于printf的格式化

Python中字符串的格式化可以使用百分号,例如:

"%s %d" % ("kzc",18) # 返回"kzc 18"。

使用关键字来格式化

"%(year)s, %(month)d" % {"year": "2017", "month": 12} # 返回"2017, 12"。

()函数格式化(重点中的重点):

使用位置参数来格式化

"{0},{1}".format("kzc",18) # 返回"kzc,18"。

注意,使用位置参数来格式化时, 字符串中大括号里的数字代表的是参数位置。如果参数使用dict,同时参数也是数字,则会有问题,例如:

mydict = {"5": "five"}

"{5}".format(**mydict) # IndexError: tuple index out of range,Python默认把format大括号中的数字当做索引来解析。

这个时候,就应该去掉这个索引,例如:

"{},{}".format("kzc",18) # 返回"kzc,18"。

使用关键字参数来格式化

"{name},{age}".format(age=18,name="kzc") # 返回"kzc,18"。

又例如:

people = {"name": "chen", "age": 18}

"{name},{age}".format(**people) # 返回"chen,18"。

使用列表参数来格式化

"{0[0]},{0[1]}".format(["kzc",18]) # 返回"kzc,18"。

指定格式化后的占位宽度

"{:>8}".format("189") # 返回" 189",表明输出需要占8个字符的宽度,不足8个字符的,用空白符补齐。

又例如:

"{:0>8}".format("189") # 返回"00000189",表明输出需要占8个字符的宽度,不足8个字符的,用0补齐。

格式化浮点数

"{:.2f}".forma) # 返回"321.33",其中".2f"表明小数位数保留2位。

指定输出数字的进制

"{:x}".format(17) # x表示按照16进制输出,此处返回"11"。

格式化数字,一般是比较大的数字,使用千分位

"{:,}".format(1234567890) # 返回"1,234,567,890"

更多文章

  1. Python爬虫框架之Scrapy详解

  2. Python爬虫框架Scrapy之爬取糗事百科大量段子数据

  3. Python爬虫框架Scrapy架构和爬取糗事百科段子结果

  4. Python网络爬虫requests、bs4爬取空姐网图片

  5. Python网络爬虫:空姐网、糗百、xxx结果图与源码

Python爬虫源码地址:

相关推荐