您现在的位置:计算机技术学习网 > 技术中心 > WEB编程 > JSP >

从原理上解决Tomcat中文问题

来源:未知 责任编辑:智问网络 发表时间:2013-10-30 11:09 点击:

  很多开源软件都有国际化和本地化的问题,其实国际化本没有那么复杂,只是总有些公司希望通过拒绝国际标准来提高市场占有率,所以也就渐渐导致了现在的情况。很多开源软件首要支持的便是UTF编码,然后才是其他编码。(by gashero)当然也有些不着调的软件首选的是ISO-8859-1编码,甚至是ASCII编码。好了,下面先讲讲编码,因为tomcat(一个很好用的JSP运行平台)也是一种不着调的软件。

  常见的中文编码有GB2312、GBK、GB18030等等,当然没有包括繁体中文,这些编码都是表示编码,而并非是显示编码。现在越来越多的软件,在其核心使用的显示编码或者说处理编码,是Unicode编码。Unicode编码使用2字节表示了世界上几乎所有的文字符号,作软件的内部国际化处理再适合不过了。

  只是有些龌龊公司,为了商业目的,对内核的Unicode编码API全部屏蔽,对外只提供本地化编码。(by gashero)比如M$公司在中文软件上就主推GBK编码。

  还有一个问题就是用C/C++编写的很老的软件,字符串结束标志是,而使用Unicode的话,会无故的截断一些字符串。所以UTF-8就应运而生了,这种变长编码既可以减小字符串的体积,也可以防止阶段而传输Unicode编码。

  至于传统的英文编码,最常见的就是两种。一是ASCII,这种字符集高位为0,用7位表示数据。另一种是ISO-8859-1,每个字符1字节,用8位表示一个字符。

  tomcat(一个很好用的JSP运行平台)的内置编码就是使用了ISO-8859-1。这也是本文最关键的一句,各种技巧的根本。

  由此可知由网页所提交的数据就需要从ISO-8859-1解码,如下是获得提交参数number的例子。

  String number=new String(request.getParameter("number").getBytes("ISO-8859-1"),"UTF-8");

  这句就成功的实现了从ISO-8859-1向UTF-8编码的转换。

  有经验的读者应该遇到过通过<jsp(SUN企业级应用的首选):param>标签传递网页间参数时出错的问题。(by gashero)接收到的字符串只要是无论如何都是一堆问号。其实这也是tomcat(一个很好用的JSP运行平台)内部编码所导致的。如果可以顺应tomcat(一个很好用的JSP运行平台)的内部编码就可以传递中文字符串了。

  比如一个页面间的内部重定向:

  <?xml(标准化越来越近了):namespace prefix = jsp(SUN企业级应用的首选) /><jsp(SUN企业级应用的首选):forward page="index.jsp(SUN企业级应用的首选)">

  <jsp(SUN企业级应用的首选):param name="name" value="<%=new String(" % 中文参数?.getBytes(?UTF-8?),?ISO-8859-1?)>" />

  </jsp(SUN企业级应用的首选):forward>

  而在目的页面接收参数的时候也需要再次从ISO-8859-1编码转换到UTF-8编码。这样就实现了在页面之间传递中文参数。

    发表评论
    请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
    用户名: 验证码:点击我更换图片
    最新评论 更多>>

    推荐热点

    • JSP与Servlet
    • 自己动手写MiniBBS系列(基本篇)之用户登录
    • JSP取当前日期
    • JDBC 入门(一)
    • 打开一个jsp页面默认查询所有数据,调用action
    • 使用JSP标签库验证用户的输入(2)完
    • 自定义JSP标签(tag)浅议
    • WIN98/2000下的jsp服务器
    • JSP内建对象(二)
    网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
    Copyright © 2008-2015 计算机技术学习交流网. 版权所有

    豫ICP备11007008号-1