system.unicode
system.unicode 表是一个虚拟表,用于提供关于 Unicode 字符及其属性的信息(https://unicode-org.github.io/icu/userguide/strings/properties.html)。该表是动态生成的。
Columns
注意
ICU 文档中 Unicode 码点的属性名称会被转换为 snake_case。
code_point(String) — 码点的 UTF-8 表示。code_point_value(Int32) — 码点的数值。notation(String) — 码点的 Unicode 表示形式。- Binary Properties (UInt8) - 码点的二值属性。
alphabetic,ascii_hex_digit,case_ignorable...
- Enumerated Properties (Int32) - 码点的枚举属性。
bidi_class,bidi_paired_bracket_type,block...
- String Properties (String) - 码点的字符串属性(ASCII 字符串、Unicode 字符串或码点)
case_folding,decomposition_mapping,name...
注意
映射规则有一些特殊之处,详见 ICU 文档。例如,simple_uppercase_mapping 和 uppercase_mapping 并不完全相同。但未实现任何与语言相关的映射(例如在土耳其语中,i 的大写是 "İ" (U+0130))。
numeric_value(Float64) - 码点的数值。script_extensions(Array(LowCardinality(String))) - 码点的书写系统扩展(script extensions)。identifier_type(Array(LowCardinality(String))) - 码点的标识符类型。general_category_mask(Int32) - 码点的一般类别掩码。
示例