.NET Compact Framework中解码GB2312怎么实现

本篇内容介绍了“.NET Compact Framework中解码GB2312怎么实现”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

代码如下:

Imports System.Text
Imports System.IO
Module Module1Module Module1

 Sub Main()Sub Main()
 Dim sr As New StreamReader("D:gb2312.txt")
 Dim fs As New FileStream("D:gb2312.dat", FileMode.Create)
 Dim sw As New BinaryWriter(fs)
 For i As Integer = 1 To 70
 sr.ReadLine()
 Next
 Do Until sr.EndOfStream
 Dim ss As String() = sr.ReadLine.Split
 Dim HEX As Short = CShort(Val(ss(1).Replace("0x", "&H")))
 Dim offset As Integer = (CInt(Val(ss(0).Replace("0x", "&H"))) - &H2121) * 2
 sw.BaseStream.Position = offset
 sw.Write(HEX)
 Loop
 sw.Close()
 End Sub

End Module

使用的时候将欲解码的GB2312编码减去0x8080,再减去0x2121(偏移),也就是说减去0xA1A1,然后将 FileStream.Position指向所得到的结果的2倍(两个字节一个码)并读取一个Int16就可以得到对应的Unicode码。下面是我在掌 心IP通中的一段代码。

 public class GB2312ToUnicode
 {
 private FileStream fs;
 private BinaryReader br;
 public GB2312ToUnicode(string index)
 {
 fs=new FileStream(index, FileMode.Open);
 br = new BinaryReader(fs);
 }

 public char Convert(byte[] b)
 {
 int index = ((b[0] << 8) + b[1] - 0xa1a1)*2;
 fs.Position = index;
 int tmp = (int)br.ReadInt16() & 0xFFFF;
 return System.Convert.ToChar(tmp);
 }

 ~GB2312ToUnicode()
 {
 br.Close();
 }

 }

这样就方便的得到了GB2312的解码器。

另外,如果打开GB2312.DAT文件可以看到,数据中有很多的0。本来可以通过重新计算偏移的方法来压缩数据,但是考虑到PocketPC上面的速度,尤其是要解码大量文本的时候,就只好用空间换取时间了。

“.NET Compact Framework中解码GB2312怎么实现”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/240185.html

(0)
上一篇 2022年2月15日
下一篇 2022年2月15日

相关推荐

发表回复

登录后才能评论