学习Java的中文编程与配置心得

来源:互联网 责任编辑:栏目编辑 发表时间:2013-07-01 20:11 点击:

Java的中文编程与配置心得

Java的中文问题历史悠久,连绵不绝,至今也没有完全解决,但是上有政策下有对策,我们总是有办法搞定它的。跟Java相关的中文问题主要有两类,一类是编程的问题,涉及到I/O,内码转换等。第二类是Java运行环境的配置,涉及字体,属性配置等。我刚刚用了一天的时间解决这些问题,觉得很有必要给自己写个备忘录之类的。
我看还是从问题入手吧,这样不致于让大家打瞌睡。我想写个程序,这个程序有个基本功能就是显示文件内容,我用JTextArea来做显示的事情,程序简单的到家了,但是就是中文都是乱码。我的配置是JBuilder7,JBuilder自带的JDK1.3.3_b24,我自己装的JDK是JDK1.4.0_02_b02,都是主流的JDK。操作系统是英文Windows2000加中文支持包。
我尝试换JDK,1.3.3和1.4.0都不行,down一个最新的j2sdk-1_4_1-rc也是不行,好像不是JDK的问题,于是我就把精力集中到I/O的编码转换上,我查阅了网上若干关于JAVA中文问题的文章,把编码转换搞的倍儿清楚,可是怎么试,换什么编码折腾都不行,反而显示的更糟糕,当初还是乱的有些规矩,就是象在纯英文系统上显示的那样,好歹我还知道那是汉字,只是显示不出来,等我折腾编码,就变得都是问号了。唉,郁闷!

编码转换心得:
JAVA内部是UNICODE编码,在I/O时如果使用Reader/Writer就要发生编码转换,使用系统属性file.encoding作为编码方式。如果使用Stream就没有转换的事情了,那是Binary的数据。
有用的方法有:1。在Reader/Writer上加encoding的选项,注意编码的方向,在Reader中的encoding表示把数据从encoding转换成Unicode,writer就是把Unicode的字符转换成encoding格式的。2。用String.getByte()把字符串转换成指定编码。
常用的编码格式:ISO8859_1,这个是英文系统缺省的8bit编码,因为是8bit的,所以不会把汉字的高位删去,所以用它也是可以处理汉字的(我自己这么理解,总觉得有些不妥,但又不知道不妥在何处,还望高人指出)。GB2312和GBK,汉字编码,推荐使用GBK,它兼容GB2312并且支持更多汉字。UNICODE,一个大的字符集,不知是不是国际标准反正大家都支持,使用16位对每个字符编码,汉字虽然正合适,但英文却吃亏了,要用多一倍的空间来存储,所以很多人还是老大不乐意,写的程序不支持UNICODE。
JSP/Servlet的中文问题有两种解决办法:1。不在程序中进行编码转换,把这个工作交给浏览器,方法就是用javac –encoding GBK *.java来编译所有的bean,然后在JSP页面上加

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
用户名: 验证码:点击我更换图片
最新评论 更多>>

推荐热点

  • Java编程语言的八大优点
  • JVM对象生命周期详细介绍
  • Java平台上的CRM系统
  • Java 算数测试小程序
  • Command(命令模式)
  • Java 一个简单的画图程序
  • Java环境 使用Resin在NT环境下配置JSP环境
  • Java 日历的小程序
  • Java 统计代码的小工具
网站首页 - 友情链接 - 网站地图 - TAG标签 - RSS订阅 - 内容搜索
Copyright © 2008-2015 计算机技术学习交流网. 版权所有

豫ICP备11007008号-1