Uuencode
2024-05-31 15:53:56 阿炯

uuencode这个名字是衍生自"Unix-to-Unix encoding",原先是Unix系统下将二进制的资料借由uucp邮件系统传输的一个编码程式,是一种二进制到文字的编码。uudecode是与uuencode搭配的解码程式,uuencode/decode常见于电子邮件中的档案传送以及usenet新闻组和BBS的贴文等等。近来已被MIME所大量取代。

编码程序

Uuencode的编码结果输出档案格式如下:
begin <输入档存取模式> <输入档名>
<编码内容>
[<编码内容>]
[...]
`
end

<输入档存取模式>
沿用自Unix系统档案存取权限模式,由三个八进制的数字组成,其构成形式为:
拥有人群组其他人
读取(r)写入(w)执行(x)读取(r)写入(w)执行(x)读取(r)写入(w)执行(x)


例而言:当<输入档存取模式>为 666,转换成二进制码为110110110,也就是拥有人、群组以及其他人对于这个档案都有读取以及写入的权力。


<输入档名>
将编码前的档名填入。

<编码内容>
当档案内容空无一物时,<编码内容>就不存在。否则<编码内容>会以下面形式出现:
<长度字元><编码字元字串>

Uuencode将输入资料以每三个字节为单位进行编码,如此重复进行。如果最后剩下的资料少于三个字节,不够的部分用零补齐。这三个字节共有24个Bit,以6-bit为单位分为4个群组,每个群组以十进制来表示所出现的数值只会落在0到63之间。将每个数加上32,所产生的结果刚好落在ASCII字元集中可打印字元(32-空白...95-底线)的范围之中。

<长度字元>
每60个编码输出(相当于45个输入字节)将输出为独立的一行,每行的开头会加上长度字元,除了最后一行之外,长度字元都应该是'M'这个ASCII字元(77=32+45),最后一行的长度字元为32+剩下的字节数目这个ASCII字元。

<编码字元字串>
<编码字元字串>是依照编码结果依序填入,惟独要注意一点:当6-bit的资料为零时,编码应为空白这个字元,但是在uuencode中都用`这个字元来取代,这是因为它们的末六bit都是 100.000。

例外状况
前面所说的只适用于使用ASCII字元集的电脑系统,有些比较旧型的电脑他们使用非ASCII字元集(如EBCDIC字元集)。要解决这个问题,Xxencode是较为适切的编码系统,它只使用到文数字字元集以及加减号字元。

编码范例

简短的例子
下面的表格显示如何将Cat这三个ASCII字元编码成uuencode的0V%T:
原始字元Cat
原始ASCII码(十进制)6797116
ASCII码(二进制)010000110110000101110100
新的十进制数值1654552
+3248863784
编码后的Uuencode字元0V%T


因此Cat这三个ASCII字元表示成uuencode的档案形式:
begin 644 cat.txt
#0V%T
`
end

长范例

底下是引用自英文版的一段文字,将其存成test.txt,引用文字如下:
Each group of sixty output characters (corresponding to 45 input bytes) is output as a separate line preceded by an encoded character giving the number of encoded bytes on that line. For all lines except the last, this will be the character 'M' (ASCII code 77 = 32+45). If the input is not evenly divisible by 45, the last line will contain the remaining N output characters, preceded by the character whose code is 32 + the number of remaining input bytes. Finally, a line containing just a single space (or grave character) is output, followed by one line containing the string "end".

使用uuencode编码后的档案为:
begin -666 test.txt
M16%C:"!G<F]U<"!O9B!S:7AT>2!O=71P=70@8VAA<F%C=&5R<R`H8V]R<F5S
M<&]N9&EN9R!T;R`T-2!I;G!U="!B>71E<RD@:7,@;W5T<'5T(&%S(&$@<V5P
M87)A=&4@;&EN92!P<F5C961E9"!B>2!A;B!E;F-O9&5D(&-H87)A8W1E<B!G
M:79I;F<@=&AE(&YU;6)E<B!O9B!E;F-O9&5D(&)Y=&5S(&]N('1H870@;&EN
M92X@1F]R(&%L;"!L:6YE<R!E>&-E<'0@=&AE(&QA<W0L('1H:7,@=VEL;"!B
M92!T:&4@8VAA<F%C=&5R("=-)R`H05-#24D@8V]D92`W-R`](#,R*S0U*2X@
M268@=&AE(&EN<'5T(&ES(&YO="!E=F5N;'D@9&EV:7-I8FQE(&)Y(#0U+"!T
M:&4@;&%S="!L:6YE('=I;&P@8V]N=&%I;B!T:&4@<F5M86EN:6YG($X@;W5T
M<'5T(&-H87)A8W1E<G,L('!R96-E9&5D(&)Y('1H92!C:&%R86-T97(@=VAO
M<V4@8V]D92!I<R`S,B`K('1H92!N=6UB97(@;V8@<F5M86EN:6YG(&EN<'5T
M(&)Y=&5S+B!&:6YA;&QY+"!A(&QI;F4@8V]N=&%I;FEN9R!J=7-T(&$@<VEN
M9VQE('-P86-E("AO<B!G<F%V92!C:&%R86-T97(I(&ES(&]U='!U="P@9F]L
M;&]W960@8GD@;VYE(&QI;F4@8V]N=&%I;FEN9R!T:&4@<W1R:6YG(")E;F0B
!+@``
`
end


对照表

下面的表格显示uuencode所使用到的ASCII字元集、6-bit二进制码以及十进制的对照。由上面Cat的例子可以看出其第一个编码为十进制的16,对应下面表格uuencode十进制表示字段,可以查出其uuencode的输出码为0。

可打印的字元十进制ASCII值uuencode
二进制表示
uuencode
十进制表示
 可打印的字元十进制ASCII值uuencode
二进制表示
uuencode
十进制表示
(space)32000 0000 @64100 00032
!33000 0011 A65100 00133
"34000 0102 B66100 01034
#35000 0113 C67100 01135
$36000 1004 D68100 10036
%37000 1015 E69100 10137
&38000 1106 F70100 11038
'39000 1117 G71100 11139
(40001 0008 H72101 00040
)41001 0019 I73101 00141
*42001 01010 J74101 01042
+43001 01111 K75101 01143
,44001 10012 L76101 10044
-45001 10113 M77101 10145
.46001 11014 N78101 11046
/47001 11115 O79101 11147
048010 00016 P80110 00048
149010 00117 Q81110 00149
250010 01018 R82110 01050
351010 01119 S83110 01151
452010 10020 T84110 10052
553010 10121 U85110 10153
654010 11022 V86110 11054
755010 11123 W87110 11155
856011 00024 X88111 00056
957011 00125 Y89111 00157
:58011 01026 Z90111 01058
;59011 01127 [91111 01159
<60011 10028 \92111 10060
=61011 10129 ]93111 10161
>62011 11030 ^94111 11062
?63011 11131 _95111 11163
     `96(1) 000 00064