Unicode 1x 发布公告


统一码联盟(Unicode Consortium)正式发布了 Unicode 10 ,这次增加了 56 个表情,其中包括一些食物、动物以及比特币等。Unicode 10 增加了 8518 个字符,现在 Unicode 一共支持 136690 个符号。我们在2017年3月就看到了 Unicode 10 的新表情,自那以后,统一码联盟确定了最终稿。新增的表情包括:

疯狂的脸、盖头、恐龙、比特币符号、脸上凸起眉毛、爆炸头、小精灵、精灵、僵尸、人在蒸汽房、攀岩者、脑子、橙色心、围巾、手套、斑马、长颈鹿、刺猬、馅饼、罐头食品等
Unicode 6 发布
Unicode 7.0 发布
Unicode 8.0 发布
Unicode 14 标准发布
Unicode 于2021年9月宣布了 14.0 版本的标准,其中包括核心规范、附件和数据文件。此版本新增 838 个字符,共计达 144697 个字符。新增内容还包括 5 个新脚本,目前共计 159 个脚本,最后还增加了 37 个新的 emoji 表情符号。
Unicode 官方中文名称为统一码,是计算机科学领域的业界标准。它整理、编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字。
14.0 版本中的新脚本和字符增加了对波斯尼亚、印度、印度尼西亚、伊朗、爪哇、马来西亚、蒙古、缅甸、巴基斯坦和菲律宾的现代语言组以及非洲和北美的其他语言的支持,包括:
阿拉伯文字,包括用于古兰经的敬语和字符,以及用于书写非洲、巴尔干、南亚和东南亚语言的字符
历史上的维特库其 (Vithkuqi) 字母,曾经用来书写阿尔巴尼亚语,当前正对其进行现代复兴
坦撒 (Tangsa) 字母:用于书写坦撒语,在印度和缅甸使用
托托 (Toto) 字母:用于编写印度东北部托托语的字母
为扩展 IPA 添加了许多拉丁文脚本
此版本新增加了 37 个表情符号字符,包括几个用于情感和手势的新表情符号(笑脸、手势、动物和自然、食物和饮料、交通和活动)。同时更新了五个重要的 Unicode 附件:
换行算法、文本分割、标识符和模式语法、Han 数据库 (Unihan)、U-Source 象形文字
更新了三个重要的 Unicode 规范:
Unicode Collation Algorithm — 对 Unicode 文本进行排序
Unicode 安全机制 ——减少 Unicode 欺骗
Unicode IDNA Compatibility Processing — 非 ASCII URL 的兼容处理
Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和 Web(URL、HTML、XML、CSS、JSON 等)。Unicode 标准、其相关标准和数据构成了 CLDR 和 ICU 版本的基础。更多详情查看发布公告。
Unicode 15.0.0 草案已公布,新增 4488 个字符
Unicode 15.0.0 版本草案已于2022年2月下旬公布,该版本的 Unicode 字符数据库、代码表和附件预计在 9 月正式发布。而且由于新内容添加所需的大量编辑工作,15.0 版的核心规范PDF也仍待发布。因此关于 Unicode 15.0 能介绍的东西不多,目前放出来的内容包括:
增加了 4488 个字符共有 149185个字符,新增的内容包括 2 个新脚本总共 161 个脚本和 20 个新的表情符号Emoji字符。其中 4192 个新字符位于 CJK中日韩统一表意文字扩展 H 分类中,其他详细分类请参阅增量代码图表。几个重要的 Unicode 规范已针对版本 15.0 进行了更新,以下四个 Unicode 技术标准的版本与 Unicode 标准同步:
Unicode Collation Algorithm — 对 Unicode 文本进行排序
Unicode 安全机制——减少 Unicode 文本欺骗
Unicode IDNA Compatibility Processing — 非 ASCII URL 的兼容处理
Unicode Emoji — 与表情符号相关的数据和行为
Unicode 15.0 版通过对 Unihan 数据库进行重大更正和改进更新的源列表、正则表达式以及更新的字段,增强了对 CJK中日韩 统一表意文字的支持,包括对普通话、粤语、唐代汉语、日语、中日语、韩语和越南语的读音和校对支持,还有简体中文和繁体中文更好的切换。有关 Unihan/CJK 支持的更多信息,请参阅 UAX #38,Unicode Han 数据库 (Unihan)。
Unicode 标准第 15 版现已于2022年9月中旬正式推出,包括核心规范、附件和数据文件。这个版本增加了 4489 个字符,使总数达到 149186 个字符。这些新增内容包括两个新脚本,总共 161 个脚本。此外,该版本还有 20 个新的表情符号字符和 4193 个 CJK(中文、日文和韩文)表意文字。新脚本和字符增加了对现代语言组的支持,包括:
1.Nag Mundari,一种用于书写 Mundari 的现代文字,Mundari 是一种在印度使用的语言。
2.一个卡纳达语字符,用于在印度书写 Konkani、Awadhi 和 Havyaka Kannada 。
3.卡克托维克数字,由阿拉斯加卡克托维克的伊努皮亚克人设计,用于因纽特语和尤皮克语的计数系统
新增的 20 个新的表情符号(emoji),包括 鹅、长笛、折扇、姜、豌豆、粉色爱心、驴、水母等等。

有关新 emoji 字符的完整列表,请参阅 Unicode 15.0 的表情符号 。Unicode 15.0 版本的其他符号和添加包括:
巴哈伊信仰成员使用的九颗白星
天文学家和占星家使用的八种天体符号
29 个额外的埃及象形文字格式控件,使埃及学家能够更好地表示文本
对语言和学术工作的支持包括:
Kawi,一种在东南亚发现的历史文字,用于书写古爪哇语和其他语言
阿拉伯语脚本的三个附加字符以支持土耳其使用的古兰经标记
在手写和印刷文件中发现三个 Khojki 字符
十个梵文字符,用于表示铭文和手稿中的吉祥标志
马拉雅拉姆语音译中使用的六个拉丁字母
音标中使用的 63 个西里尔修饰字母
重要的图表字体更新包括:
埃及象形文字的一组更新字形,以及标准化的变化序列以支持文本中的旋转字形
改进了统一加拿大土著音节的字形,为运营商和其他语言提供更好的支持
一种新的 Wancho 字体,具有改进和简化的形状
对 CJK (中日韩)块的更新添加:
新的 CJK 统一表意文字扩展 H 块中的 4192 个表意文字
CJK 统一表意文字扩展 C 块中的一个表意文字
以下六个 Unicode 标准附件和技术标准在 15.0 版进行了更新(Unicode 属性和规范决定了文本在计算机和手机上的行为):
Unicode 双向算法,修改了 UAX9-C2 中的注释,强调使用更高级别的协议来减轻潜在的源代码欺骗攻击。
Unicode 标识符和模式语法,为默认标识符的配置文件提供了更多指导,阐明了标识符中默认可忽略代码点的使用,并讨论了 Pattern_White_Space 和编程语言中的双向排序问题之间的关系。
Unicode Han 数据库,添加了 kAlternateTotalStrokes 属性。将 kCihaiT 属性的类别更改为字典索引,扩展 kKangXi 属性,并添加第 3.0、3.10 和 4.5 节。
Unicode 安全机制,将零宽度连接符 (ZWJ) 和零宽度非连接符 (ZWNJ) 字符从 Identifier_Status=Allowed 更改为 Identifier_Status=Restricted;因此,默认情况下,通用安全配置文件不再允许它们。
U-Source Ideographs,在其数据文件中记录了新的表意文字,添加了 “ExtH” 作为新状态,改进了现有 CJK 统一表意文字块的状态标识符,并添加了第 2.5 节。
Unicode IDNA 兼容性处理,澄清了 ToASCII 中空标签的边缘情况,并添加了有关新的 IDNA 派生属性数据文件的文档。
Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和 Web(URL、HTML、XML、CSS、JSON 等)。Unicode 标准、其相关标准和数据构成了 CLDR 和 ICU 版本的基础。更多详情请查看发行公告。

疯狂的脸、盖头、恐龙、比特币符号、脸上凸起眉毛、爆炸头、小精灵、精灵、僵尸、人在蒸汽房、攀岩者、脑子、橙色心、围巾、手套、斑马、长颈鹿、刺猬、馅饼、罐头食品等
Unicode 6 发布
Unicode 7.0 发布
Unicode 8.0 发布
Unicode 14 标准发布
Unicode 于2021年9月宣布了 14.0 版本的标准,其中包括核心规范、附件和数据文件。此版本新增 838 个字符,共计达 144697 个字符。新增内容还包括 5 个新脚本,目前共计 159 个脚本,最后还增加了 37 个新的 emoji 表情符号。
Unicode 官方中文名称为统一码,是计算机科学领域的业界标准。它整理、编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字。
14.0 版本中的新脚本和字符增加了对波斯尼亚、印度、印度尼西亚、伊朗、爪哇、马来西亚、蒙古、缅甸、巴基斯坦和菲律宾的现代语言组以及非洲和北美的其他语言的支持,包括:
阿拉伯文字,包括用于古兰经的敬语和字符,以及用于书写非洲、巴尔干、南亚和东南亚语言的字符
历史上的维特库其 (Vithkuqi) 字母,曾经用来书写阿尔巴尼亚语,当前正对其进行现代复兴
坦撒 (Tangsa) 字母:用于书写坦撒语,在印度和缅甸使用
托托 (Toto) 字母:用于编写印度东北部托托语的字母
为扩展 IPA 添加了许多拉丁文脚本
此版本新增加了 37 个表情符号字符,包括几个用于情感和手势的新表情符号(笑脸、手势、动物和自然、食物和饮料、交通和活动)。同时更新了五个重要的 Unicode 附件:
换行算法、文本分割、标识符和模式语法、Han 数据库 (Unihan)、U-Source 象形文字
更新了三个重要的 Unicode 规范:
Unicode Collation Algorithm — 对 Unicode 文本进行排序
Unicode 安全机制 ——减少 Unicode 欺骗
Unicode IDNA Compatibility Processing — 非 ASCII URL 的兼容处理
Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和 Web(URL、HTML、XML、CSS、JSON 等)。Unicode 标准、其相关标准和数据构成了 CLDR 和 ICU 版本的基础。更多详情查看发布公告。
Unicode 15.0.0 草案已公布,新增 4488 个字符
Unicode 15.0.0 版本草案已于2022年2月下旬公布,该版本的 Unicode 字符数据库、代码表和附件预计在 9 月正式发布。而且由于新内容添加所需的大量编辑工作,15.0 版的核心规范PDF也仍待发布。因此关于 Unicode 15.0 能介绍的东西不多,目前放出来的内容包括:
增加了 4488 个字符共有 149185个字符,新增的内容包括 2 个新脚本总共 161 个脚本和 20 个新的表情符号Emoji字符。其中 4192 个新字符位于 CJK中日韩统一表意文字扩展 H 分类中,其他详细分类请参阅增量代码图表。几个重要的 Unicode 规范已针对版本 15.0 进行了更新,以下四个 Unicode 技术标准的版本与 Unicode 标准同步:
Unicode Collation Algorithm — 对 Unicode 文本进行排序
Unicode 安全机制——减少 Unicode 文本欺骗
Unicode IDNA Compatibility Processing — 非 ASCII URL 的兼容处理
Unicode Emoji — 与表情符号相关的数据和行为
Unicode 15.0 版通过对 Unihan 数据库进行重大更正和改进更新的源列表、正则表达式以及更新的字段,增强了对 CJK中日韩 统一表意文字的支持,包括对普通话、粤语、唐代汉语、日语、中日语、韩语和越南语的读音和校对支持,还有简体中文和繁体中文更好的切换。有关 Unihan/CJK 支持的更多信息,请参阅 UAX #38,Unicode Han 数据库 (Unihan)。
Unicode 标准第 15 版现已于2022年9月中旬正式推出,包括核心规范、附件和数据文件。这个版本增加了 4489 个字符,使总数达到 149186 个字符。这些新增内容包括两个新脚本,总共 161 个脚本。此外,该版本还有 20 个新的表情符号字符和 4193 个 CJK(中文、日文和韩文)表意文字。新脚本和字符增加了对现代语言组的支持,包括:
1.Nag Mundari,一种用于书写 Mundari 的现代文字,Mundari 是一种在印度使用的语言。
2.一个卡纳达语字符,用于在印度书写 Konkani、Awadhi 和 Havyaka Kannada 。
3.卡克托维克数字,由阿拉斯加卡克托维克的伊努皮亚克人设计,用于因纽特语和尤皮克语的计数系统
新增的 20 个新的表情符号(emoji),包括 鹅、长笛、折扇、姜、豌豆、粉色爱心、驴、水母等等。

有关新 emoji 字符的完整列表,请参阅 Unicode 15.0 的表情符号 。Unicode 15.0 版本的其他符号和添加包括:
巴哈伊信仰成员使用的九颗白星
天文学家和占星家使用的八种天体符号
29 个额外的埃及象形文字格式控件,使埃及学家能够更好地表示文本
对语言和学术工作的支持包括:
Kawi,一种在东南亚发现的历史文字,用于书写古爪哇语和其他语言
阿拉伯语脚本的三个附加字符以支持土耳其使用的古兰经标记
在手写和印刷文件中发现三个 Khojki 字符
十个梵文字符,用于表示铭文和手稿中的吉祥标志
马拉雅拉姆语音译中使用的六个拉丁字母
音标中使用的 63 个西里尔修饰字母
重要的图表字体更新包括:
埃及象形文字的一组更新字形,以及标准化的变化序列以支持文本中的旋转字形
改进了统一加拿大土著音节的字形,为运营商和其他语言提供更好的支持
一种新的 Wancho 字体,具有改进和简化的形状
对 CJK (中日韩)块的更新添加:
新的 CJK 统一表意文字扩展 H 块中的 4192 个表意文字
CJK 统一表意文字扩展 C 块中的一个表意文字
以下六个 Unicode 标准附件和技术标准在 15.0 版进行了更新(Unicode 属性和规范决定了文本在计算机和手机上的行为):
Unicode 双向算法,修改了 UAX9-C2 中的注释,强调使用更高级别的协议来减轻潜在的源代码欺骗攻击。
Unicode 标识符和模式语法,为默认标识符的配置文件提供了更多指导,阐明了标识符中默认可忽略代码点的使用,并讨论了 Pattern_White_Space 和编程语言中的双向排序问题之间的关系。
Unicode Han 数据库,添加了 kAlternateTotalStrokes 属性。将 kCihaiT 属性的类别更改为字典索引,扩展 kKangXi 属性,并添加第 3.0、3.10 和 4.5 节。
Unicode 安全机制,将零宽度连接符 (ZWJ) 和零宽度非连接符 (ZWNJ) 字符从 Identifier_Status=Allowed 更改为 Identifier_Status=Restricted;因此,默认情况下,通用安全配置文件不再允许它们。
U-Source Ideographs,在其数据文件中记录了新的表意文字,添加了 “ExtH” 作为新状态,改进了现有 CJK 统一表意文字块的状态标识符,并添加了第 2.5 节。
Unicode IDNA 兼容性处理,澄清了 ToASCII 中空标签的边缘情况,并添加了有关新的 IDNA 派生属性数据文件的文档。
Unicode 标准是全球所有现代软件和通信的基础,包括操作系统、浏览器、笔记本电脑和智能手机,以及互联网和 Web(URL、HTML、XML、CSS、JSON 等)。Unicode 标准、其相关标准和数据构成了 CLDR 和 ICU 版本的基础。更多详情请查看发行公告。