最近准备写一些关于golang的技术博文,本文是之前在GitHub上看到的golang技术译文,感觉很有帮助,先给各位读者分享一下。
前言
Go 是一门简单有趣的编程语言,与其他语言一样,在使用时不免会遇到很多坑,不过它们大多不是 Go 本身的设计缺陷。如果你刚从其他语言转到 Go,那这篇文章里的坑多半会踩到。
如果花时间学习官方 doc、wiki、讨论邮件列表、 Rob Pike 的大量文章以及 Go 的源码,会发现这篇文章中的坑是很常见的,新手跳过这些坑,能减少大量调试代码的时间。
初级篇:1-35(二)
18. string 与索引操作符
对字符串用索引访问返回的不是字符,而是一个 byte 值。
这种处理方式和其他语言一样,比如 PHP 中:
如果需要使用 迭代访问字符串中的字符(unicode code point / rune),标准库中有 包来做 UTF8 的相关解码编码。另外 utf8string 也有像 等很方便的库函数。
19. 字符串并不都是 UTF8 文本
string 的值不必是 UTF8 文本,可以包含任意的值。只有字符串是文字字面值时才是 UTF8 文本,字串可以通过转义来包含其他数据。
判断字符串是否是 UTF8 文本,可使用 "unicode/utf8" 包中的 函数:
20. 字符串的长度
在 Python 中:
然而在 Go 中:
Go 的内建函数 返回的是字符串的 byte 数量,而不是像 Python 中那样是计算 Unicode 字符数。
如果要得到字符串的字符数,可使用 "unicode/utf8" 包中的
注意:并不总是返回我们看到的字符数,因为有的字符会占用 2 个 rune:
参考:normalization
21. 在多行 array、slice、map 语句中缺少 `,` 号
声明语句中 折叠到单行后,尾部的 不是必需的。
22. `log.Fatal` 和 `log.Panic` 不只是 log
log 标准库提供了不同的日志记录等级,与其他语言的日志库不同,Go 的 log 包在调用 、 时能做更多日志外的事,如中断程序的执行等:
23. 对内建数据结构的操作并不是同步的
尽管 Go 本身有大量的特性来支持并发,但并不保证并发的数据安全,用户需自己保证变量等数据以原子操作更新。
goroutine 和 channel 是进行原子操作的好方法,或使用 "sync" 包中的锁。
24. range 迭代 string 得到的值
range 得到的索引是字符值(Unicode point / rune)第一个字节的位置,与其他编程语言不同,这个索引并不直接是字符在字符串中的位置。
注意一个字符可能占多个 rune,比如法文单词 café 中的 é。操作特殊字符可使用norm 包。
for range 迭代会尝试将 string 翻译为 UTF8 文本,对任何无效的码点都直接使用 0XFFFD rune(�)UNicode 替代字符来表示。如果 string 中有任何非 UTF8 的数据,应将 string 保存为 byte slice 再进行操作。
25. range 迭代 map
如果你希望以特定的顺序(如按 key 排序)来迭代 map,要注意每次迭代都可能产生不一样的结果。
Go 的运行时是有意打乱迭代顺序的,所以你得到的迭代结果可能不一致。但也并不总会打乱,得到连续相同的 5 个迭代结果也是可能的,如:
如果你去 Go Playground 重复运行上边的代码,输出是不会变的,只有你更新代码它才会重新编译。重新编译后迭代顺序是被打乱的:
26. switch 中的 fallthrough 语句
语句中的 代码块会默认带上 break,但可以使用 来强制执行下一个 case 代码块。
不过你可以在 case 代码块末尾使用 ,强制执行下一个 case 代码块。
也可以改写 case 为多条件判断:
27. 自增和自减运算
很多编程语言都自带前置后置的 、 运算。但 Go 特立独行,去掉了前置操作,同时 、 只作为运算符而非表达式。
28. 按位取反
很多编程语言使用 作为一元按位取反(NOT)操作符,Go 重用 XOR 操作符来按位取反:
同时 也是按位异或(XOR)操作符。
一个操作符能重用两次,是因为一元的 NOT 操作 ,与二元的 XOR 操作 是一致的。
Go 也有特殊的操作符 AND NOT 操作符,不同位才取1。
29. 运算符的优先级
除了位清除(bit clear)操作符,Go 也有很多和其他语言一样的位操作符,但优先级另当别论。
优先级列表:
30. 不导出的 struct 字段无法被 encode
以小写字母开头的字段成员是无法被外部直接访问的,所以 在进行 json、xml、gob 等格式的 encode 操作时,这些私有字段会被忽略,导出时得到零值:
31. 程序退出时还有 goroutine 在执行
程序默认不等所有 goroutine 都执行完才退出,这点需要特别注意:
如下, 主程序不等两个 goroutine 执行完就直接退出了:
常用解决办法:使用 "WaitGroup" 变量,它会让主程序等待所有 goroutine 执行完毕再退出。
如果你的 goroutine 要做消息的循环处理等耗时操作,可以向它们发送一条 消息来关闭它们。或直接关闭一个它们都等待接收数据的 channel:
执行结果:
看起来好像 goroutine 都执行完了,然而报错:
fatal error: all goroutines are asleep - deadlock!
为什么会发生死锁?goroutine 在退出前调用了 ,程序应该正常退出的。
原因是 goroutine 得到的 "WaitGroup" 变量是 的一份拷贝值,即 传参只传值。所以哪怕在每个 goroutine 中都调用了 , 主程序中的 变量并不会受到影响。
运行效果:
32. 向无缓冲的 channel 发送数据,只要 receiver 准备好了就会立刻返回
只有在数据被 receiver 处理时,sender 才会阻塞。因运行环境而异,在 sender 发送完数据后,receiver 的 goroutine 可能没有足够的时间处理下一个数据。如:
运行效果:
33. 向已关闭的 channel 发送数据会造成 panic
从已关闭的 channel 接收数据是安全的:
接收状态值 是 时表明 channel 中已没有数据可以接收了。类似的,从有缓冲的 channel 中接收数据,缓存的数据获取完再没有数据可取时,状态值也是
向已关闭的 channel 中发送数据会造成 panic:
运行结果:
针对上边有 bug 的这个例子,可使用一个废弃 channel 来告诉剩余的 goroutine 无需再向 ch 发送数据。此时 的结果是 :
运行效果:
34. 使用了值为 `nil ` 的 channel
在一个值为 nil 的 channel 上发送和接收数据将永久阻塞:
runtime 死锁错误:
fatal error: all goroutines are asleep - deadlock!
goroutine 1 [chan receive (nil chan)]
利用这个死锁的特性,可以用在 select 中动态的打开和关闭 case 语句块:
运行效果:
35. 若函数 receiver 传参是传值方式,则无法修改参数的原有值
方法 receiver 的参数与一般函数的参数类似:如果声明为值,那方法体得到的是一份参数的值拷贝,此时对参数的任何修改都不会对原有值产生影响。
除非 receiver 参数是 map 或 slice 类型的变量,并且是以指针方式更新 map 中的字段、slice 中的元素的,才会更新原有值:
运行结果:
系列文章
本文转载自https://github.com/wuYin/blog/blob/master/50-shades-of-golang-traps-gotchas-mistakes.md
领取专属 10元无门槛券
私享最新 技术干货