UnicodeToGB2312

你是否遇到类似于:\u5355\u4f4d之类的让人纠结的字符?

一个JS文件中一堆一堆的全都是这种,分析起来很吃力?

快来试用…………………………??

广告完毕……

效果:

主要代码:

/// <summary>
/// 将Unicode编码转换为汉字字符串
/// </summary>
/// <param name="str">Unicode编码字符串</param>
/// <returns>汉字字符串</returns>
public static string ToGB2312(string str)
{
    string tempStr = str;
    MatchCollection mc = Regex.Matches(str, @"\\u([\w]{2})([\w]{2})", RegexOptions.Compiled | RegexOptions.IgnoreCase);
    byte[] bts = new byte[2];
    foreach (Match m in mc)
    {
        bts[0] = (byte)int.Parse(m.Groups[2].Value, NumberStyles.HexNumber);
        bts[1] = (byte)int.Parse(m.Groups[1].Value, NumberStyles.HexNumber);
        tempStr = tempStr.Replace(m.Value, Encoding.Unicode.GetString(bts));
    }
    return tempStr;
}

源码:

程序:

需要.net 3.5

使用右键菜单时如果选择了多个文件则会打开多个程序(据说可以用Windows外壳扩展实现选择多个只打开一个程序,但是杀鸡焉用牛刀……)

不过可以拖动多个文本文件到程序图标上,这个是没影响的。

转换源码是搜索到的,不过他的代码有点问题,被我改了,至于谁写的我也不清楚……

原谅我的无知吧……鄙人没有那么大的能力,在那么多的标着“原创”的代码里找出谁才是真正的作者……

网上太多转载了,没意思,不写了。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据