由于 MySQL 数据库默认使用 iso-8859-1 编码方式,所以获取的 Headers 通常是使用 iso-8859-1 进行编码的,但由于 Linux 服务器通常使用 UTF-8 编码中文,我们只要对获得的 string 进行两次重编码即可,具体 C#代码如下:
HttpWebRequest Myrq = (HttpWebRequest)HttpWebRequest.Create(URL); //URL 为网址 HttpWebResponse myrp = (HttpWebResponse)Myrq.GetResponse(); WebHeaderCollection whc = myrp.Headers; Encoding e1 = Encoding.GetEncoding("iso-8859-1"); Encoding e2 = Encoding.Default; string s = whc[1]; //这里获取第二个属性来举例 byte[] ss = e1.GetBytes(s); byte[] sss = Encoding.Convert(Encoding.UTF8, e2, ss); //再次用 UTF-8 编码 string t = e2.GetString(sss);//正常的字符串 t = t.Substring(t.IndexOf("\"") + 1, t.LastIndexOf("\"") - t.IndexOf("\"") - 1);//去掉其它内容
也不排除有些网站用的是其它编码,在上文中只需修改 e1 即可,但是英文不管什么编码肯定是没有问题的。
参考资料:http://shadowlin.iteye.com/blog/706744(JAVA 中的实现)
Comments | NOTHING