世界各国文字计算机编码之我见

  按照维持本性(该咋样就咋样)、自然分合(各国文字属不同类属、而文件是电脑中类属分类的基本单位)、独立发展(留有余量、以备扩充)、充分利用(不浪费)的原则,我觉得世界各国文字的计算机编码应该如下进行:
  1、不同的文字应该各自独立编码,都可以使用前128个字符;在一个国家内涉及别国文字的场合通常很少,所以一般情况下不需要用一个全球编码,只需要一个国内编码即可;
  2、还需要一个代表文字属别的标识位于同类文字首,可以用00000000,00000000+双字节的文字属别编码来标识;文字属别编码用双字节可以标识65536种文字,想来够用了。

  这样编码的好处是:(相对于用一个全球码文件)
  1、对于那些只需要单字节但却排在第256个字符后的文字、可以增加约一倍的处理速度同时减少约一半的文件大小;
  2、各国文字混排的时候依然能够增加处理速度和减小文件大小;
  3、机动性好,有利于各国文字的自我发展,譬如汉字就可以不必从1万多开始编码了;
  4、汉字用两个字节表示只能编码65536个汉字,日常应用足够;对于65536外的生僻汉字和死字,我们可以再申请一个属别编码,这样就能使用13,1072个汉字了。