我在UTF-8中有一些字幕文件.有时,这些文件中有一些零星的多字节字符,这会在某些应用程序中引起问题.
如果某个文件包含任何多字节字符,我如何在linux中检查(并可能找到这些文件).
解决方法:
您可以使用文件命令
chalet16$echo test > a.txt
chalet16$echo testก > b.txt #One of Thai characters
chalet16$file *.txt
a.txt: ASCII text
b.txt: UTF-8 Unicode text