system.unicode
system.unicode テーブルは、Unicode 文字およびそのプロパティに関する情報を提供する仮想テーブルです(https://unicode-org.github.io/icu/userguide/strings/properties.html を参照)。このテーブルは要求時に動的に生成されます。
Columns
注記
ICU ドキュメントにおける Unicode コードポイントのプロパティ名は、スネークケースに変換されています。
code_point(String) — コードポイントの UTF-8 表現。code_point_value(Int32) — コードポイントの数値表現。notation(String) — コードポイントの Unicode 表記。- Binary Properties (UInt8) - コードポイントのバイナリプロパティ。
alphabetic,ascii_hex_digit,case_ignorable...
- Enumerated Properties (Int32) - コードポイントの列挙プロパティ。
bidi_class,bidi_paired_bracket_type,block...
- String Properties (String) - コードポイントの文字列プロパティ(ASCII 文字列または Unicode 文字列、あるいはコードポイント)
case_folding,decomposition_mapping,name...
注記
Mapping には多少特殊な点があるため、ICU のドキュメントを参照してください。たとえば、simple_uppercase_mapping と uppercase_mapping は完全に同一ではありません。また、言語固有の mapping は実装されていません(例:トルコ語では i の大文字は "İ" (U+0130) です)。
numeric_value(Float64) - コードポイントの数値表現。script_extensions(Array(LowCardinality(String))) - コードポイントの script extensions。identifier_type(Array(LowCardinality(String))) - コードポイントの identifier type。general_category_mask(Int32) - コードポイントの general category mask。
Example