【Go】strings库字符串处理详说

2023-12-18 10:43:04

一、引入

strings 包实现了用于操作字符的简单函数

import "strings"

二、使用

EqualFold | 判断两个utf-8编码字符串（将unicode大写、小写、标题三种格式字符视为相同）是否相同

func EqualFold(s, t string) bool

fmt.Println(strings.EqualFold("Go", "go"))

HasPrefix | 判断s是否有前缀字符串prefix

func HasPrefix(s, prefix string) bool

HasSuffix | 判断s是否有后缀字符串suffix

func HasSuffix(s, suffix string) bool

Contains | 判断字符串s是否包含子串substr

func Contains(s, substr string) bool

fmt.Println(strings.Contains("seafood", "foo"))
fmt.Println(strings.Contains("seafood", "bar"))
fmt.Println(strings.Contains("seafood", ""))
fmt.Println(strings.Contains("", ""))

输出:
true
false
true
true

ContainsRune 判断字符串s是否包含utf-8码值r

func ContainsRune(s string, r rune) bool

ContainsAny 判断字符串s是否包含字符串chars中的任一字符

func ContainsAny(s, chars string) bool

Count 返回字符串s中有几个不重复的sep子串

func Count(s, sep string) int

Index 子串sep在字符串s中第一次出现的位置，不存在则返回-1

func Index(s, sep string) int

fmt.Println(strings.Index("chicken", "ken"))
fmt.Println(strings.Index("chicken", "dmr"))

输出:
4
-1

IndexByte 字符c在s中第一次出现的位置，不存在则返回-1

func IndexByte(s string, c byte) int

IndexRune unicode码值r在s中第一次出现的位置，不存在则返回-1

func IndexRune(s string, r rune) int

IndexAny 字符串chars中的任一utf-8码值在s中第一次出现的位置，如果不存在或者chars为空字符串则返回-1

func IndexAny(s, chars string) int

fmt.Println(strings.IndexAny("chicken", "aeiouy"))
fmt.Println(strings.IndexAny("crwth", "aeiouy"))

输出:
2
-1

IndexFunc s中第一个满足函数f的位置i（该处的utf-8码值r满足f®==true），不存在则返回-1

func IndexFunc(s string, f func(rune) bool) int

f := func(c rune) bool {
    return unicode.Is(unicode.Han, c)
}
fmt.Println(strings.IndexFunc("Hello, 世界", f))
fmt.Println(strings.IndexFunc("Hello, world", f))

输出:
7
-1

LastIndex | 子串sep在字符串s中最后一次出现的位置，不存在则返回-1

func LastIndex(s, sep string) int

fmt.Println(strings.Index("go gopher", "go"))
fmt.Println(strings.LastIndex("go gopher", "go"))
fmt.Println(strings.LastIndex("go gopher", "rodent"))

输出:
0
3
-1

LastIndexAny | 字符串chars中的任一utf-8码值在s中最后一次出现的位置，如不存在或者chars为空字符串则返回-1。

func LastIndexAny(s, chars string) int

LastIndexFunc | s中最后一个满足函数f的unicode码值的位置i，不存在则返回-1。

func LastIndexFunc(s string, f func(rune) bool) int

Title | 返回s中每个单词的首字母都改为标题格式的字符串拷贝。

BUG: Title用于划分单词的规则不能很好的处理Unicode标点符号。
func Title(s string) string

fmt.Println(strings.Title("her royal highness"))

输出: Her Royal Highness

ToLower | 返回将所有字母都转为对应的小写版本的拷贝。

func ToLower(s string) string

fmt.Println(strings.ToLower("Gopher"))

输出: gopher

ToLowerSpecial | 使用_case规定的字符映射，返回将所有字母都转为对应的小写版本的拷贝。

func ToLowerSpecial(_case unicode.SpecialCase, s string) string

ToUpper | 返回将所有字母都转为对应的大写版本的拷贝。

func ToUpper(s string) string

fmt.Println(strings.ToUpper("Gopher"))
输出:

GOPHER

ToUpperSpecial | 使用_case规定的字符映射，返回将所有字母都转为对应的大写版本的拷贝

func ToUpperSpecial(_case unicode.SpecialCase, s string) string

ToTitle | 返回将所有字母都转为对应的标题版本的拷贝

func ToTitle(s string) string

fmt.Println(strings.ToTitle("loud noises"))
fmt.Println(strings.ToTitle("хлеб"))

输出:

LOUD NOISES
ХЛЕБ

ToTitleSpecial | 使用_case规定的字符映射，返回将所有字母都转为对应的标题版本的拷贝

func ToTitleSpecial(_case unicode.SpecialCase, s string) string

Repeat | 返回count个s串联的字符串

func Repeat(s string, count int) string

Example
fmt.Println("ba" + strings.Repeat("na", 2))

输出: banana

Replace | 返回将s中前n个不重叠old子串都替换为new的新字符串，如果n<0会替换所有old子串

func Replace(s, old, new string, n int) string

fmt.Println(strings.Replace("oink oink oink", "k", "ky", 2))
fmt.Println(strings.Replace("oink oink oink", "oink", "moo", -1))

输出:
oinky oinky oink
moo moo moo

Map | 将s的每一个unicode码值r都替换为mapping®，返回这些新码值组成的字符串拷贝。

如果mapping返回一个负值，将会丢弃该码值而不会被替换。（返回值中对应位置将没有码值）
func Map(mapping func(rune) rune, s string) string

rot13 := func(r rune) rune {
    switch {
    case r >= 'A' && r <= 'Z':
        return 'A' + (r-'A'+13)%26
    case r >= 'a' && r <= 'z':
        return 'a' + (r-'a'+13)%26
    }
    return r
}
fmt.Println(strings.Map(rot13, "'Twas brillig and the slithy gopher..."))

输出: 'Gjnf oevyyvt naq gur fyvgul tbcure…

Trim | 返回将s前后端所有cutset包含的utf-8码值都去掉的字符串

func Trim(s string, cutset string) string

fmt.Printf("[%q]", strings.Trim(" !!! Achtung! Achtung! !!! ", "! "))

输出: [“Achtung! Achtung”]

TrimSpace | 返回将s前后端所有空白（unicode.IsSpace指定）都去掉的字符串

func TrimSpace(s string) string

fmt.Println(strings.TrimSpace(" \t\n a lone gopher \n\t\r\n"))

输出: a lone gopher

TrimFunc | 返回将s前后端所有满足f的unicode码值都去掉的字符串

func TrimFunc(s string, f func(rune) bool) string

TrimLeft | 返回将s前端所有cutset包含的utf

func TrimLeft(s string, cutset string) string
-8码值都去掉的字符串。

TrimLeftFunc 返回将s前端所有满足f的unicode码值都去掉的字符串。

func TrimLeftFunc(s string, f func(rune) bool) string

TrimPrefix | 返回去除s可能的前缀prefix的字符串

func TrimPrefix(s, prefix string) string

var s = "Goodbye,, world!"
s = strings.TrimPrefix(s, "Goodbye,")
s = strings.TrimPrefix(s, "Howdy,")
fmt.Print("Hello" + s)

输出: Hello, world!

TrimRight | 返回将s后端所有cutset包含的utf-8码值都去掉的字符串

func TrimRight(s string, cutset string) string

TrimRightFunc | 返回将s后端所有满足f的unicode码值都去掉的字符串

func TrimRightFunc(s string, f func(rune) bool) string

TrimSuffix | 返回去除s可能的后缀suffix的字符串

func TrimSuffix(s, suffix string) string

var s = "Hello, goodbye, etc!"
s = strings.TrimSuffix(s, "goodbye, etc!")
s = strings.TrimSuffix(s, "planet")
fmt.Print(s, "world!")

输出: Hello, world!

Fields | 返回将字符串按照空白

（unicode.IsSpace确定，可以是一到多个连续的空白字符）分割的多个字符串。如果字符串全部是空白或者是空字符串的话，会返回空切片。
func Fields(s string) []string

fmt.Printf("Fields are: %q", strings.Fields("  foo bar  baz   "))

输出: Fields are: [“foo” “bar” “baz”]

FieldsFunc | 类似Fields，但使用函数f来确定分割符（满足f的unicode码值）。

如果字符串全部是分隔符或者是空字符串的话，会返回空切片。
func FieldsFunc(s string, f func(rune) bool) []string

f := func(c rune) bool {
    return !unicode.IsLetter(c) && !unicode.IsNumber(c)
}
fmt.Printf("Fields are: %q", strings.FieldsFunc("  foo1;bar2,baz3...", f))

输出: Fields are: [“foo1” “bar2” “baz3”]

Split | 用去掉s中出现的sep的方式进行分割，

会分割到结尾，并返回生成的所有片段组成的切片（每一个sep都会进行一次切割，即使两个sep相邻，也会进行两次切割）。如果sep为空字符，Split会将s切分成每一个unicode码值一个字符串。
func Split(s, sep string) []string

fmt.Printf("%q\n", strings.Split("a,b,c", ","))
fmt.Printf("%q\n", strings.Split("a man a plan a canal panama", "a "))
fmt.Printf("%q\n", strings.Split(" xyz ", ""))
fmt.Printf("%q\n", strings.Split("", "Bernardo O'Higgins"))

输出:
[“a” “b” “c”]
["" “man " “plan " “canal panama”]
[” " “x” “y” “z” " “]
[””]

SplitN

func SplitN(s, sep string, n int) []string
用去掉s中出现的sep的方式进行分割，会分割到结尾，并返回生成的所有片段组成的切片（每一个sep都会进行一次切割，即使两个sep相邻，也会进行两次切割）。如果sep为空字符，Split会将s切分成每一个unicode码值一个字符串。参数n决定返回的切片的数目：

n > 0 : 返回的切片最多n个子字符串；最后一个子字符串包含未进行切割的部分。
n == 0: 返回nil
n < 0 : 返回所有的子字符串组成的切片

fmt.Printf("%q\n", strings.SplitN("a,b,c", ",", 2))
z := strings.SplitN("a,b,c", ",", 0)
fmt.Printf("%q (nil = %v)\n", z, z == nil)

输出:
[“a” “b,c”]
[] (nil = true)

SplitAfter | 用从s中出现的sep后面切断的方式进行分割，

会分割到结尾，并返回生成的所有片段组成的切片（每一个sep都会进行一次切割，即使两个sep相邻，也会进行两次切割）。如果sep为空字符，Split会将s切分成每一个unicode码值一个字符串。
func SplitAfter(s, sep string) []string

fmt.Printf("%q\n", strings.SplitAfter("a,b,c", ","))

输出: [“a,” “b,” “c”]

SplitAfterN | 用从s中出现的sep后面切断的方式进行分割，

会分割到结尾，并返回生成的所有片段组成的切片（每一个sep都会进行一次切割，即使两个sep相邻，也会进行两次切割）。如果sep为空字符，Split会将s切分成每一个unicode码值一个字符串。参数n决定返回的切片的数目：

n > 0 : 返回的切片最多n个子字符串；最后一个子字符串包含未进行切割的部分。
n == 0: 返回nil
n < 0 : 返回所有的子字符串组成的切

func SplitAfterN(s, sep string, n int) []string

fmt.Printf("%q\n", strings.SplitAfterN("a,b,c", ",", 2))

输出: [“a,” “b,c”]

Join 将一系列字符串连接为一个字符串，之间用sep来分隔。

func Join(a []string, sep string) string

s := []string{"foo", "bar", "baz"}
fmt.Println(strings.Join(s, ", "))

输出: foo, bar, baz

NewReader | 创建一个从s读取数据的Reader

本函数类似bytes.NewBufferString，但是更有效率，且为只读的。
func NewReader(s string) *Reader

Len Len返回r包含的字符串还没有被读取的部分。

func (r *Reader) Len() int

type Reader

Reader类型通过从一个字符串读取数据，实现了io.Reader、io.Seeker、io.ReaderAt、io.WriterTo、io.ByteScanner、io.RuneScanner接口。

type Reader struct {
    // 内含隐藏或非导出字段
}

func (*Reader) Read
func (r *Reader) Read(b []byte) (n int, err error)
func (*Reader) ReadByte
func (r *Reader) ReadByte() (b byte, err error)
func (*Reader) UnreadByte
func (r *Reader) UnreadByte() error
func (*Reader) ReadRune
func (r *Reader) ReadRune() (ch rune, size int, err error)
func (*Reader) UnreadRune
func (r *Reader) UnreadRune() error
func (*Reader) Seek
func (r *Reader) Seek(offset int64, whence int) (int64, error)
Seek实现了io.Seeker接口。

(*Reader) ReadAt
func (r *Reader) ReadAt(b []byte, off int64) (n int, err error)

WriteTo实现了io.WriterTo接口。
func (r *Reader) WriteTo(w io.Writer) (n int64, err error)

type Replacer

类型进行一系列字符串的替换。
type Replacer struct {
// 内含隐藏或非导出字段
}

NewReplacer | 使用提供的多组old、new字符串对创建并返回一个*Replacer。替换是依次进行的，匹配时不会重叠。

func NewReplacer(oldnew …string) *Replacer

Replace**返回s的所有替换进行完后的拷贝。

func (r *Replacer) Replace(s string) string

WriteString**向w中写入s的所有替换进行完后的拷贝。

func (r *Replacer) WriteString(w io.Writer, s string) (n int, err error)

参考
https://studygolang.com/pkgdoc

完

码农公寓