识别utf-8编码字符的正则表达式应为   "/[\xf0-\xf7][\x80-\xbf]{3}|[\xe0-\xef][\x80-\xbf]{2}|[\xc2-\xdf][\x80-\xbf]|[\x01-\x7f]/。

据传是因为utf8的汉字编码有1-4个字节组成