Baudot代码
Baudot代码(法语发音: [boˈdo] )是一个早期的角色,编码了1870年代埃米尔·鲍多特(émileBaudot)发明的电报。它是国际电报字母2(ITA2)的前身,这是ASCII之前使用的最常见的电视代码。字母内的每个字符都由一系列五个位表示,这些五位是通过异步连续通信等通信通道(例如电报线或无线电信号)发送的。符号率测量称为波特,并源自同名。
历史
Baudot代码(ITA1)
别名 | 国际电报字母1 |
---|---|
当前状态 | 由ITA2取代(不相互兼容)。 |
分类 | 5位状态的基本拉丁编码 |
先于 | 摩尔斯密码 |
继之后 | ita2 |
在下表中,列I,II,III,IV和V列显示了代码;让。图列显示了大陆和英国版本的字母和数字;以及按顺序显示桌子的键:字母顺序,灰色和英国
欧洲 | 排序键 | 英国 | 排序键 | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
V | iv | I | ii | iii | 大陆 | 灰色的 | 让。 | 图。 | V | iv | I | ii | iii | 英国 | |||
- | - | - | |||||||||||||||
A | 1 | ● | A | 1 | ● | ||||||||||||
É | 和 | ● | ● | / | 1/ | ● | ● | ||||||||||
E | 2 | ● | E | 2 | ● | ||||||||||||
I | o | ● | ● | I | 3/ | ● | ● | ||||||||||
O | 5 | ● | ● | ● | O | 5 | ● | ● | ● | ||||||||
U | 4 | ● | ● | U | 4 | ● | ● | ||||||||||
Y | 3 | ● | Y | 3 | ● | ||||||||||||
● | B | 8 | ● | B | 8 | ● | ● | ||||||||||
● | C | 9 | ● | ● | C | 9 | ● | ● | ● | ||||||||
● | D | 0 | ● | ● | ● | D | 0 | ● | ● | ● | ● | ||||||
● | F | f | ● | ● | F | 5/ | ● | ● | ● | ||||||||
● | G | 7 | ● | G | 7 | ● | ● | ||||||||||
● | H | h | ● | ● | H | ¹ | ● | ● | ● | ||||||||
● | J | 6 | ● | J | 6 | ● | ● | ||||||||||
● | 数字 | 空白的 | 图。 | bl。 | ● | ||||||||||||
● | ● | 擦除 | 擦除 | * | * | ● | ● | ||||||||||
● | ● | K | ( | ● | K | ( | ● | ● | ● | ||||||||
● | ● | L | = | ● | ● | L | = | ● | ● | ● | ● | ||||||
● | ● | M | ) | ● | M | ) | ● | ● | ● | ||||||||
● | ● | N | n° | ● | ● | N | £ | ● | ● | ● | ● | ||||||
● | ● | P | % | ● | ● | ● | P | + | ● | ● | ● | ● | ● | ||||
● | ● | Q | / | ● | ● | Q | / | ● | ● | ● | ● | ||||||
● | ● | R | – | ● | R | – | ● | ● | ● | ||||||||
● | S | ; | ● | S | 7/ | ● | ● | ||||||||||
● | T | ! | ● | ● | T | ² | ● | ● | ● | ||||||||
● | V | ' | ● | ● | ● | V | ¹ | ● | ● | ● | ● | ||||||
● | W | ? | ● | ● | W | ? | ● | ● | ● | ||||||||
● | X | , | ● | X | 9/ | ● | ● | ||||||||||
● | Z | : | ● | ● | Z | : | ● | ● | ● | ||||||||
● | t | . | ● | – | . | ● | ● | ||||||||||
● | 空白的 | 信 | bl。 | 让。 | ● |
鲍多特(Baudot)于1872年开发了他的第一个多元电报,并于1874年获得了专利。1876年,他从六位数代码更改为五位代码,正如卡尔·弗里德里希·高斯(Carl Friedrich Gauss)和威廉·韦伯( Wilhelm Weber)在1834年所建议的那样,在间隔和隔离间隔平等。 ,它允许传输罗马字母,并包括标点符号和控制信号。该代码本身没有获得专利(仅是机器),因为法国专利定律不允许概念获得专利。
Baudot的5位代码适用于手动键盘发送,并且从未构建过以其原始形式使用它的Teprinter设备。该代码是在键盘上输入的,该键盘只有五个钢琴型键,并用左手的两个手指和右手的三个手指进行操作。按下密钥后,它们就被锁定,直到分配器单元中的机械触点通过连接到该特定键盘的扇区,键盘已解锁,可以使用可听见的单击(已知)输入下一个字符(已知作为“节奏信号”)警告操作员。操作员必须保持稳定的节奏,通常的操作速度为每分钟30个单词。
该表“显示了英国大陆和内陆服务邮局中使用的Baudot代码的分配。大陆代码中的许多字符被内陆代码中的分数取代。代码元素1、2和3已发送通过键1、2和3,它们是由右手的前三个手指操作的。代码元素4和5由键4和5传输,这些元素由左手的前两个手指操作。”
鲍多特的代码被称为国际电报字母1号( ITA1 )。它不再使用。
Murray代码
1901年,鲍多特的代码由唐纳德·默里( Donald Murray ,1865- 1945年)修改,这是由于他开发了打字机样键盘的原因。默里系统采用了中间步骤;键盘穿孔器,允许操作员打孔纸带和胶带发射器,用于从打孔胶带发送消息。在线路的接收端,打印机制将在纸带上打印,/或可用于制作消息的穿孔副本。由于操作员的手移动与传输的钻头之间不再有联系,因此不担心安排代码以最大程度地减少操作员的疲劳,而是Murray设计了代码以最大程度地减少机械上的磨损,将代码组合分配给了最少的代码组合打孔到最常用的字符。
例如,单孔字母为E和T。十个两个孔字母是aoinshrdlz,与Linotype机器中使用的“ Etaoin Shrdlu ”顺序非常相似。又有十个字母,bcgfjmpuwy,每个孔有三个孔,四孔字母为vxkq。
Murray代码还介绍了所谓的“格式效应器”或“控制字符” - CR (马车返回)和LF (线条提要)代码。 Baudot的一些代码从那以后一直搬到了他们一直留在的位置:零或空白和DEL代码。 null/blank用作空闲代码,用于何时发送消息,但是使用相同的代码来编码单词之间的空间分离。在消息的开始或结束时,使用了DEL代码的序列(完全打孔的列),从而可以轻松分离不同的消息。 (可以在这些序列中插入铃声代码,以向远程操作员发出信号,表明即将发布新消息或终止消息的传输)。
早期的英国信条机也使用了默里系统。
西联汇款
默里的代码被西联汇款采用,直到1950年代,它一直使用它,其中一些更改包括省略某些角色并添加更多的控制代码。引入了明确的SPC(空间)字符,代替空白/空的,而新的BEL代码会在接收器上响起铃铛或以其他方式产生了一个听觉信号。此外,WRU或“您是谁?”引入了代码,这导致接收计算机将标识流发送回发送者。
ita2
别名 | 国际电报字母2 |
---|---|
分类 | 5位状态的基本拉丁编码 |
先于 | ita1 |
继之后 | ITA 3(Van Duuren Code),ITA 5(ISO 646,ASCII) |
语言 | 俄语 |
---|---|
分类 | 5位状态的俄罗斯西里尔编码 |
先于 | 俄罗斯摩尔斯密码 |
继之后 | KOI-7 |
1924年, CCITT将国际电报( ITA2 )代码作为国际标准提出,该标准是基于西联汇款法规的,并有一些较小的变化。美国以ITA2版本为“美国电信器代码”(US TTY)标准化,该版本是5位TelepePewriter代码的基础,直到1963年7位ASCII首次亮相。
保留了一些代码点(在表中标记为蓝色)用于国家特定使用。
冲动模式(1 =标记,0 =空间) | 字母班次 | 图移 | |||||
---|---|---|---|---|---|---|---|
LSB在右上;代码元素:543·21 | LSB左;代码元素:12·345 | 打孔器计数 | ITA2标准 | Russianmtk-2变体 | Russianmtk-2变体 | ITA2标准 | 我们的TTY变体 |
000·00 | 00·000 | 0 | 无效的 | 转向西里尔字母 | 无效的 | ||
010·00 | 00·010 | 1 | 马车返回 | ||||
000·10 | 01·000 | 1 | 线饲料 | ||||
001·00 | 00·100 | 1 | 空间 | ||||
101·11 | 11·101 | 4 | Q | Я | 1 | ||
100·11 | 11·001 | 3 | W | В | 2 | ||
000·01 | 10·000 | 1 | E | Е | 3 | ||
010·10 | 01·010 | 2 | R | Р | 4 | ||
100·00 | 00·001 | 1 | T | Т | 5 | ||
101·01 | 10·101 | 3 | Y | Ы | 6 | ||
001·11 | 11·100 | 3 | U | У | 7 | ||
001·10 | 01·100 | 2 | I | И | 8 | ||
110·00 | 00·011 | 2 | O | О | 9 | ||
101·10 | 01·101 | 3 | P | П | 0 | ||
000·11 | 11·000 | 2 | A | А | – | ||
001·01 | 10·100 | 2 | S | С | ' | 钟 | |
010·01 | 10·010 | 2 | D | Д | wru? | $ | |
011·01 | 10·110 | 3 | F | Ф | Э | ! | |
110·10 | 01·011 | 3 | G | Г | Ш | 和 | |
101·00 | 00·101 | 2 | H | Х | Щ | £ | # |
010·11 | 11·010 | 3 | J | Й | Ю | 钟 | ' |
011·11 | 11·110 | 4 | K | К | ( | ||
100·10 | 01·001 | 2 | L | Л | ) | ||
100·01 | 10·001 | 2 | Z | З | + | " | |
111·01 | 10·111 | 4 | X | Ь | / | ||
011·10 | 01·110 | 3 | C | Ц | : | ||
111·10 | 01·111 | 4 | V | Ж | = | ; | |
110·01 | 10·011 | 3 | B | Б | ? | ||
011·00 | 00·110 | 2 | N | Н | , | ||
111·00 | 00·111 | 3 | M | М | . | ||
110·11 | 11·011 | 4 | 转向数字(FS) | 保留用于数字扩展 | |||
111·11 | 11·111 | 5 | 保留用于信件箱扩展 | 转移到字母(LS) /擦除 /删除 |
实际上,分配给NULL的代码位置仅用于发音器的空闲状态。在长时间的闲置时间内,两种设备之间的脉冲率没有同步(甚至可以在通勤电话线上关闭或不永久互连)。为了启动消息,首先有必要通过一组五个脉冲来校准脉冲速率,这是一组定期定时的“标记”脉冲(1),这也可以通过简单的被动电子设备来检测到,以打开电视连接。这种脉冲序列产生了一系列擦除/删除字符,同时还将接收器的状态初始化为字母移动模式。但是,第一个脉冲可能会丢失,因此可以通过单个无效的过程终止此过程的功率,然后终止擦除/删除字符。为了保留设备之间的同步,无效代码不能在消息中间任意使用(这是对没有明确区分空间的初始Baudot系统的改进,因此很难维护脉冲计数器以在重复空间上进行重复空间电信器)。但是,可以随时通过在消息中间发送null来重新同步设备(立即进行擦除/删除/LS控件(如果后面是字母),或者如果是字母,则通过FS控件(如果后面是图形)。发送空控件也不会导致纸带前进到下一行(因为没有打孔),因此节省了珍贵的拳带。另一方面,擦除/删除/LS控制代码始终被打孔,并始终转移到(初始)字母模式。根据一些消息来源,无效代码点仅用于国家内部用法。
向字母代码(LS)的转换也可用,作为一种读取后从打孔胶带中取消/删除文本的方式,可以在丢弃拳带之前安全地破坏消息。从功能上讲,它也可以扮演与ASCII中的删除代码相同的填充角色(或其他7位和8位编码,包括用于打孔卡的EBCDIC)。在文本片段中的代码被任意数量的LS代码取代后,下面仍然可以保留和解码。它也可以用作启动器,以确保第一个代码的解码不会给出数字页面或其他符号(因为可以在打孔频段的末尾或开始时任意插入空代码,并且必须忽略,而空间代码在文本中很重要)。
标记为用于扩展的保留的单元格(第二次使用LS代码(仅在第一个LS代码之后)从图形页面转移到字母偏移页面)已被定义为转移到新模式。在此新模式下,字母页面仅包含小写字母,但保留对大写字母的第三个代码页面的访问,要幺通过编码单个字母(通过在该字母前发送LS)或锁定(使用FS+LS)在解锁(带有单个LS)之前,无限数量的大写字母或数字返回小写模式。标记为“保留”的单元格也是可用的(使用图形移动页面中的FS代码)切换图(通常包含数字和国家小写字母或符号)的图页到第四页(国家字母是大写和大写的,其他符号可以编码)。
ITA2仍用于聋(TDD),电传和一些业余无线电应用的电信设备中,例如Radioteletype (“ RTTY”)。 ITA2还用于增强广播解决方案,这是DeutscheBörse指定的21世纪早期财务协议,以减少编码足迹的角色。
命名法
几乎所有20世纪的电视设备都使用了Western Union代码,ITA2或其变体。无线电业余爱好者随便称ITA2和变体称为错误,甚至是美国广播中继联盟的业余广播手册也这样做的,尽管在最近的版本中,代码表正确地将其识别为ITA2。
字符集
每个单元格中显示的值是Unicode Codepoints,用于比较。
原始的Baudot变体
英国国内的原始鲍多特
原始Baudot代码,英国国内版本(字母集,用0x10切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | A | E | / | Y | U | I | O | 无花果 | J | G | H | B | C | F | D |
1倍 | sp | - | X | Z | S | T | W | V | del | K | M | L | R | Q | N | P |
原始Baudot代码,英国国内版本(图集,用0x08切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | 1 | 2 | ⅟ | 3 | 4 | ³⁄ | 5 | sp | 6 | 7 | ¹ | 8 | 9 | ⁵⁄ | 0 |
1倍 | ltrs | . | ⁹⁄ | : | ⁷⁄ | ² | ? | ' | del | ( | ) | = | - | / | £ | + |
原始鲍多特,欧洲大陆
原始Baudot代码,欧洲大陆型变种(字母集,用0x10切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | A | E | É | Y | U | I | O | 无花果 | J | G | H | B | C | F | D |
1倍 | sp | ṯ | X | Z | S | T | W | V | del | K | M | L | R | Q | N | P |
原始Baudot代码,大陆变体(图集,用0x08切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | 1 | 2 | 和 | 3 | 4 | º | 5 | sp | 6 | 7 | H | 8 | 9 | F | 0 |
1倍 | ltrs | . | , | : | ; | ! | ? | ' | del | ( | ) | = | - | / | № | % |
原始Baudot,ITA 1
ITA 1(字母集,用0x10切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | A | E | Cr | Y | U | I | O | 无花果 | J | G | H | B | C | F | D |
1倍 | sp | 如果 | X | Z | S | T | W | V | del | K | M | L | R | Q | N | P |
ITA 1(图集,用0x08切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | 1 | 2 | Cr | 3 | 4 | pu | 5 | sp | 6 | 7 | + | 8 | 9 | pu | 0 |
1倍 | ltrs | 如果 | , | : | . | pu | ? | ' | del | ( | ) | = | - | / | pu | % |
Baudot – Murray变体
Murray代码
Murray代码(字母集,用0x04切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | sp | E | 上校 | A | ltrs | S | I | U | 如果 | D | R | J | N | F | C | K |
1倍 | T | Z | L | W | H | Y | P | Q | O | B | G | 无花果 | M | X | V | del / * |
Murray代码(图集,用0x1b切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | sp | 3 | 上校 | ltrs | ' | 8 | 7 | 如果 | ² | 4 | ⁷⁄ | − | ⅟ | ( | ⁹⁄ | |
1倍 | 5 | . | / | 2 | ⁵⁄ | 6 | 0 | 1 | 9 | ? | ³⁄ | 无花果 | , | £ | ) | del / * |
ITA 2和US-TTY
ITA2和US-TTY Baudot-Murray代码(字母集,用0x1F切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | E | 如果 | A | sp | S | I | U | Cr | D | R | J | N | F | C | K |
1倍 | T | Z | L | W | H | Y | P | Q | O | B | G | 无花果 | M | X | V | ltrs / del |
US-TTY Baudot – Murray代码(图集,用0x1b切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | 3 | 如果 | − | sp | 贝尔 | 8 | 7 | Cr | $ | 4 | ' | , | ! | : | ( |
1倍 | 5 | " | ) | 2 | # | 6 | 0 | 1 | 9 | ? | 和 | 无花果 | . | / | ; | ltrs |
ITA2 Baudot – Murray代码(图集,用0x1b切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | nul | 3 | 如果 | − | sp | ' | 8 | 7 | Cr | ENQ | 4 | 贝尔 | , | ! | : | ( |
1倍 | 5 | + | ) | 2 | £ | 6 | 0 | 1 | 9 | ? | 和 | 无花果 | . | / | = | ltrs |
天气代码
气象学家使用了ITA2的变体和图形符号,除了十位数字,BEL和其他一些字符,以天气符号代替:
气象Baudot – Murray代码(图集,用0x1b切换) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
0x | - | 3 | 如果 | ↑ | sp | 贝尔 | 8 | 7 | Cr | ↗ | 4 | ↙ | ⦷ | → | ◯ | ← |
1倍 | 5 | + | ↖ | 2 | ↓ | 6 | 0 | 1 | 9 | ⊕ | ↘ | 无花果 | . | / | ⦶ | ltrs |
细节
注意:该表假定鲍多特(Baudot)和默里(Murray)的“ 1”空间是最右边,也是最不重要的。制造商将传输位包装成较大的代码的方式。最常见的解决方案将位从最小的位分配给最有意义的位(留下三个字节未使用的三个最重要的位)。
在ITA2中,字符使用五位表示。 ITA2使用两个代码子集,即“字母移动”(LTRS)和“图形移动”(图)。无花果字符(11011)信号表明要将以下字符解释为无花果设置,直到LTRS(11111)字符重置为无花果设置。在使用中,将LTRS或无花果移动键按下并释放,将相应的移位字符传输到另一台计算机。然后输入所需的字母或数字字符。与打字机或现代计算机键盘不同,换档键在键入相应字符的同时不会保持凹陷。 “查询”将触发另一台计算机的应答。这意味着“你是谁?”
CR是马车返回,LF是线馈电,Bel是铃铛的角色,它响了一个小铃(通常用于提醒操作员传入消息),SP是空间,而Nul是无效的字符(空白磁带)。
注意:编码点的二进制转换通常以相反的顺序显示,具体取决于(可能是)从哪一侧查看纸带。进一步注意,选择了“控制”字符,以使它们是对称的或有用的对,以便插入胶带“倒置”不会导致设备的问题,并且可以解密所得的打印输出。因此,无花果(11011),LTRS(11111)和空间(00100)是不变的,而CR(00010)和LF(01000)(通常用作一对),无论按页打印机的订单如何处理。 LTRS也可以用来在纸胶带上删除以上的角色(就像7位ASCII中的DEL一样)。
序列ryryry ...通常用于测试消息,以及每个变速箱的开始。由于R为01010,Y为10101,因此该序列在最大应力下练习了电视连接的大部分机械组件。另外,一次使用两个彩色灯(每个音调)进行微调。 “ ryryry ...”生产了0101010101 ...,在调整正确时,灯光亮了。仅当ITA2与两色调FSK调制一起使用时,这种调整序列才有用,例如在Radiotelettys (RTTY)使用中通常可见。
Baudot代码的美国实现在添加几个字符(例如#和无花果层)上可能有所不同。
俄罗斯版的Baudot代码( MTK-2 )使用了三种班次模式;西里尔字母模式被角色(00000)激活。由于西里尔字母中的字符数量越大,角色! , & , £被西里尔(Cyrillics)省略并取代,而BEL的代码与西里尔(Cyrillic)信件相同。省略了西里尔字母ъ和ё ,并与数字4合并。
也可以看看
- 培根的密码-弗朗西斯·培根(Francis Bacon)在1605年设计的英语字母的5位二元编码。
- 信息系统字符集的列表
- CCIR 476