解决 C#获取的 HTTP Headers 的中文为乱码(获取下载地址的真实文件名)

发布于 2014-04-25  1899 次阅读


由于 MySQL 数据库默认使用 iso-8859-1 编码方式,所以获取的 Headers 通常是使用 iso-8859-1 进行编码的,但由于 Linux 服务器通常使用 UTF-8 编码中文,我们只要对获得的 string 进行两次重编码即可,具体 C#代码如下:

HttpWebRequest Myrq = (HttpWebRequest)HttpWebRequest.Create(URL); //URL 为网址
HttpWebResponse myrp = (HttpWebResponse)Myrq.GetResponse();
WebHeaderCollection whc = myrp.Headers;

Encoding e1 = Encoding.GetEncoding("iso-8859-1");
Encoding e2 = Encoding.Default;
string s = whc[1]; //这里获取第二个属性来举例
byte[] ss = e1.GetBytes(s);
byte[] sss = Encoding.Convert(Encoding.UTF8, e2, ss); //再次用 UTF-8 编码

string t = e2.GetString(sss);//正常的字符串
t = t.Substring(t.IndexOf("\"") + 1, t.LastIndexOf("\"") - t.IndexOf("\"") - 1);//去掉其它内容

也不排除有些网站用的是其它编码,在上文中只需修改 e1 即可,但是英文不管什么编码肯定是没有问题的。

参考资料:http://shadowlin.iteye.com/blog/706744(JAVA 中的实现)


寻找属于自己的1%