util: Explicitly decode/encode in utf-8.
authorGabe Black <gabeblack@google.com>
Thu, 27 Aug 2020 08:52:04 +0000 (01:52 -0700)
committerGabe Black <gabeblack@google.com>
Thu, 27 Aug 2020 20:31:25 +0000 (20:31 +0000)
commit52f392b947cd46064fac464f89decaa4a313ea73
tree5a135bc53db7c571426cc20a60bee7e4e8fb0b9e
parent94000aefe610d7084eb142cd41a8c66cd4670bbd
util: Explicitly decode/encode in utf-8.

The default encoding for python 2 is ascii which can't handle some
characters in, for instance, people's names which have accented letters.
This change explicitly selects the utf-8 encoding which pacifies python
and is mostly equivalent except in these rare cases.

In python 3, the default encoding is utf-8 to begin with, and it's no
longer possible to change it. In this case, explicitly selecting the
encoding is redundant but harmless.

When we support only python 3, then this change can be reverted.

Thanks to Lakin Smith for proposing a related solution and pointing out
some information that led to this one.

Change-Id: I99bd59063c77edd712954ffe90d7de320ade49ea
Reviewed-on: https://gem5-review.googlesource.com/c/public/gem5/+/33575
Maintainer: Gabe Black <gabeblack@google.com>
Tested-by: kokoro <noreply+kokoro@google.com>
Reviewed-by: Lakin Smith <lakindsmith@gmail.com>
Reviewed-by: Jason Lowe-Power <power.jg@gmail.com>
util/git-pre-commit.py
util/style/repo.py
util/style/verifiers.py