这个是判断字符的,给你借鉴下。如果是判断汉字,需要根据你网页的编码来计算。
如果是GBK\GB2312编码,2个字节=1个汉字
如果是unicode\utf-8编码,里面汉字是长度不是一定的,有的长、有的短,2~4=1个汉字