メインコンテンツへスキップ
メインコンテンツへスキップ

埋め込みディクショナリを扱う関数

注記

以下の関数が動作するためには、サーバー設定で、すべての埋め込みディクショナリを取得するためのパスとアドレスを指定しておく必要があります。ディクショナリは、これらの関数のいずれかが最初に呼び出された時点で読み込まれます。参照リストを読み込めない場合は、例外がスローされます。

そのため、このセクションで示す例は、事前に設定を行わない限り、ClickHouse Fiddle やクイックリリース環境および本番デプロイメント環境のデフォルト設定では、例外をスローします。

参照リストの作成方法については、「Dictionaries」セクションを参照してください。

複数のジオベース

ClickHouse は、複数の代替ジオベース(地域階層)を同時に扱うことをサポートしており、特定の地域がどの国に属するかについてのさまざまな見方に対応できます。

'clickhouse-server' の設定では、地域階層を記述したファイルを指定します。

<path_to_regions_hierarchy_file>/opt/geo/regions_hierarchy.txt</path_to_regions_hierarchy_file>

このファイルに加えて、拡張子の前に _ という文字と任意のサフィックスが付いた、同じディレクトリ内のファイルも検索されます。 たとえば、存在する場合は /opt/geo/regions_hierarchy_ua.txt というファイルも検出されます。ここで ua は辞書キーと呼ばれます。サフィックスのない辞書の場合、キーは空文字列です。

すべての辞書は実行時に再読み込みされます(builtin_dictionaries_reload_interval 設定パラメータで定義された一定秒数ごと、またはデフォルトでは 1 時間に 1 回)。ただし、利用可能な辞書の一覧は、サーバー起動時に一度だけ定義されます。

地域を扱うためのすべての関数は、末尾にオプションの引数として辞書キーを取ります。これはジオベースと呼ばれます。

例:

regionToCountry(RegionID) – デフォルト辞書を使用します: /opt/geo/regions_hierarchy.txt
regionToCountry(RegionID, '') – デフォルト辞書を使用します: /opt/geo/regions_hierarchy.txt
regionToCountry(RegionID, 'ua') – 'ua'キー用の辞書を使用します: /opt/geo/regions_hierarchy_ua.txt

regionToName

リージョン ID と geobase を受け取り、対応する言語のリージョン名を表す文字列を返します。指定された ID のリージョンが存在しない場合は、空文字列を返します。

構文

regionToName(id\[, lang\])

パラメータ

  • id — geobase におけるリージョン ID。 UInt32
  • geobase — 辞書のキー。Multiple Geobases を参照。 String。省略可能。

戻り値

  • geobase で指定された対応する言語でのリージョン名。 String
  • それ以外の場合は空文字列。

クエリ:

SELECT regionToName(number::UInt32,'en') FROM numbers(0,5);

結果:

┌─regionToName(CAST(number, 'UInt32'), 'en')─┐
│                                            │
│ World                                      │
│ USA                                        │
│ Colorado                                   │
│ Boulder County                             │
└────────────────────────────────────────────┘

regionToCity

ジオベースからリージョン ID を受け取ります。このリージョンが都市、または都市の一部である場合は、対応する都市のリージョン ID を返します。それ以外の場合は 0 を返します。

構文

regionToCity(id [, geobase])

パラメータ

返される値

  • 対応する都市が存在する場合は、そのリージョン ID。UInt32
  • 存在しない場合は 0。

クエリ:

SELECT regionToName(number::UInt32, 'en'), regionToCity(number::UInt32) AS id, regionToName(id, 'en') FROM numbers(13);

結果:

┌─regionToName(CAST(number, 'UInt32'), 'en')─┬─id─┬─regionToName(regionToCity(CAST(number, 'UInt32')), 'en')─┐
│                                            │  0 │                                                          │
│ World                                      │  0 │                                                          │
│ USA                                        │  0 │                                                          │
│ Colorado                                   │  0 │                                                          │
│ Boulder County                             │  0 │                                                          │
│ Boulder                                    │  5 │ Boulder                                                  │
│ China                                      │  0 │                                                          │
│ Sichuan                                    │  0 │                                                          │
│ Chengdu                                    │  8 │ Chengdu                                                  │
│ America                                    │  0 │                                                          │
│ North America                              │  0 │                                                          │
│ Eurasia                                    │  0 │                                                          │
│ Asia                                       │  0 │                                                          │
└────────────────────────────────────────────┴────┴──────────────────────────────────────────────────────────┘

regionToArea

地域をエリア(geobase におけるタイプ 5)に変換します。それ以外の点では、この関数は 'regionToCity' と同様です。

構文

regionToArea(id [, geobase])

パラメーター

返される値

  • 対応する地域が存在する場合、そのリージョン ID。UInt32
  • 存在しない場合は 0。

クエリ:

SELECT DISTINCT regionToName(regionToArea(toUInt32(number), 'ua'))
FROM system.numbers
LIMIT 15

結果:

┌─regionToName(regionToArea(toUInt32(number), \'ua\'))─┐
│                                                      │
│ モスクワおよびモスクワ州                             │
│ サンクトペテルブルクおよびレニングラード州           │
│ ベルゴロド州                                         │
│ イヴァノヴォ州                                       │
│ カルーガ州                                           │
│ コストロマ州                                         │
│ クルスク州                                           │
│ リペツク州                                           │
│ オリョール州                                         │
│ リャザン州                                           │
│ スモレンスク州                                       │
│ タンボフ州                                           │
│ トヴェリ州                                           │
│ トゥーラ州                                           │
└──────────────────────────────────────────────────────┘

regionToDistrict

リージョンを、geobase におけるタイプ 4 の連邦管区に変換します。その他の点では、この関数の動作は 'regionToCity' と同じです。

構文

regionToDistrict(id [, geobase])

パラメータ

戻り値

  • 該当する都市が存在する場合、そのリージョン ID。 UInt32
  • 存在しない場合は 0。

クエリ:

SELECT DISTINCT regionToName(regionToDistrict(toUInt32(number), 'ua'))
FROM system.numbers
LIMIT 15

結果:

┌─regionToName(regionToDistrict(toUInt32(number), \'ua\'))─┐
│                                                          │
│ 中央連邦管区                                 │
│ 北西連邦管区                               │
│ 南部連邦管区                                   │
│ 北カフカース連邦管区                          │
│ 沿ヴォルガ連邦管区                                │
│ ウラル連邦管区                                    │
│ シベリア連邦管区                                │
│ 極東連邦管区                                │
│ スコットランド                                                 │
│ フェロー諸島                                            │
│ フランデレン地域圏                                           │
│ ブリュッセル首都圏地域圏                                  │
│ ワロン地域圏                                                 │
│ ボスニア・ヘルツェゴビナ連邦                     │
└──────────────────────────────────────────────────────────┘

regionToCountry

地域を国(geobase のタイプ 3)に変換します。それ以外の点では、この関数は regionToCity と同じです。

構文

regionToCountry(id [, geobase])

パラメーター

  • id — ジオベース内のリージョン ID。UInt32
  • geobase — 辞書のキー。Multiple Geobases を参照。String。省略可能。

戻り値

  • 該当する国のリージョン ID(存在する場合)。UInt32
  • 該当しない場合は 0。

クエリ:

SELECT regionToName(number::UInt32, 'en'), regionToCountry(number::UInt32) AS id, regionToName(id, 'en') FROM numbers(13);

結果:

┌─regionToName(CAST(number, 'UInt32'), 'en')─┬─id─┬─regionToName(regionToCountry(CAST(number, 'UInt32')), 'en')─┐
│                                            │  0 │                                                             │
│ 世界                                      │  0 │                                                             │
│ アメリカ合衆国                                        │  2 │ アメリカ合衆国                                                         │
│ コロラド州                                   │  2 │ アメリカ合衆国                                                         │
│ ボルダー郡                             │  2 │ アメリカ合衆国                                                         │
│ ボルダー                                    │  2 │ アメリカ合衆国                                                         │
│ 中国                                      │  6 │ 中国                                                       │
│ 四川省                                    │  6 │ 中国                                                       │
│ 成都市                                    │  6 │ 中国                                                       │
│ アメリカ大陸                                    │  0 │                                                             │
│ 北アメリカ                              │  0 │                                                             │
│ ユーラシア大陸                                    │  0 │                                                             │
│ アジア                                       │  0 │                                                             │
└────────────────────────────────────────────┴────┴─────────────────────────────────────────────────────────────┘

regionToContinent

地域を大陸(geobase におけるタイプ1)に変換します。それ以外の点では、この関数は regionToCity と同じです。

構文

regionToContinent(id [, geobase])

パラメータ

戻り値

  • 対応する大陸のリージョン ID が存在する場合、その値。UInt32
  • 存在しない場合は 0。

クエリ:

SELECT regionToName(number::UInt32, 'en'), regionToContinent(number::UInt32) AS id, regionToName(id, 'en') FROM numbers(13);

結果:

┌─regionToName(CAST(number, 'UInt32'), 'en')─┬─id─┬─regionToName(regionToContinent(CAST(number, 'UInt32')), 'en')─┐
│                                            │  0 │                                                               │
│ 世界                                      │  0 │                                                               │
│ USA                                        │ 10 │ 北米                                                 │
│ Colorado                                   │ 10 │ 北米                                                 │
│ Boulder County                             │ 10 │ 北米                                                 │
│ Boulder                                    │ 10 │ 北米                                                 │
│ China                                      │ 12 │ アジア                                                          │
│ Sichuan                                    │ 12 │ アジア                                                          │
│ Chengdu                                    │ 12 │ アジア                                                          │
│ アメリカ大陸                                    │  9 │ アメリカ大陸                                                       │
│ 北米                              │ 10 │ 北米                                                 │
│ ユーラシア                                    │ 11 │ ユーラシア                                                       │
│ アジア                                       │ 12 │ アジア                                                          │
└────────────────────────────────────────────┴────┴───────────────────────────────────────────────────────────────┘

regionToTopContinent

地域に対応する階層内の最上位の大陸を返します。

構文

regionToTopContinent(id[, geobase])

パラメータ

戻り値

  • 最上位の大陸の識別子(リージョン階層を親方向にたどっていったときに到達する大陸)。UInt32
  • 存在しない場合は 0。

クエリ:

SELECT regionToName(number::UInt32, 'en'), regionToTopContinent(number::UInt32) AS id, regionToName(id, 'en') FROM numbers(13);

結果:

┌─regionToName(CAST(number, 'UInt32'), 'en')─┬─id─┬─regionToName(regionToTopContinent(CAST(number, 'UInt32')), 'en')─┐
│                                            │  0 │                                                                  │
│ 世界                                      │  0 │                                                                  │
│ アメリカ合衆国                                        │  9 │ アメリカ大陸                                                          │
│ コロラド州                                   │  9 │ アメリカ大陸                                                          │
│ ボルダー郡                             │  9 │ アメリカ大陸                                                          │
│ ボルダー                                    │  9 │ アメリカ大陸                                                          │
│ 中国                                      │ 11 │ ユーラシア大陸                                                          │
│ 四川省                                    │ 11 │ ユーラシア大陸                                                          │
│ 成都                                    │ 11 │ ユーラシア大陸                                                          │
│ アメリカ大陸                                    │  9 │ アメリカ大陸                                                          │
│ North アメリカ大陸                              │  9 │ アメリカ大陸                                                          │
│ ユーラシア大陸                                    │ 11 │ ユーラシア大陸                                                          │
│ アジア                                       │ 11 │ ユーラシア大陸                                                          │
└────────────────────────────────────────────┴────┴──────────────────────────────────────────────────────────────────┘

regionToPopulation

指定した地域の人口を取得します。人口は geobase 対応のファイルに記録できます。セクション "Dictionaries" を参照してください。地域に対して人口が記録されていない場合は 0 を返します。geobase では、子地域には人口が記録されていても、親地域には記録されていない場合があります。

構文

regionToPopulation(id[, geobase])

パラメータ

戻り値

  • リージョンの人口。UInt32
  • 該当するものがない場合は 0。

クエリ:

SELECT regionToName(number::UInt32, 'en'), regionToPopulation(number::UInt32) AS id, regionToName(id, 'en') FROM numbers(13);

結果:

┌─regionToName(CAST(number, 'UInt32'), 'en')─┬─population─┐
│                                            │          0 │
│ World                                      │ 4294967295 │
│ USA                                        │  330000000 │
│ Colorado                                   │    5700000 │
│ Boulder County                             │     330000 │
│ Boulder                                    │     100000 │
│ China                                      │ 1500000000 │
│ Sichuan                                    │   83000000 │
│ Chengdu                                    │   20000000 │
│ America                                    │ 1000000000 │
│ North America                              │  600000000 │
│ Eurasia                                    │ 4294967295 │
│ Asia                                       │ 4294967295 │
└────────────────────────────────────────────┴────────────┘

regionIn

lhs のリージョンが rhs のリージョンに属しているかどうかをチェックします。属している場合は 1、属していない場合は 0 の UInt8 型の値を返します。

構文

regionIn(lhs, rhs\[, geobase\])

パラメーター

  • lhs — geobase における Lhs リージョン ID。UInt32
  • rhs — geobase における Rhs リージョン ID。UInt32
  • geobase — 辞書キー。Multiple Geobases を参照。String。省略可。

返される値

  • 1 — 属する場合。UInt8
  • 0 — 属さない場合。

実装の詳細

この関係は反射律を満たします。任意のリージョンは自分自身にも属します。

クエリ:

SELECT regionToName(n1.number::UInt32, 'en') || (regionIn(n1.number::UInt32, n2.number::UInt32) ? ' is in ' : ' is not in ') || regionToName(n2.number::UInt32, 'en') FROM numbers(1,2) AS n1 CROSS JOIN numbers(1,5) AS n2;

結果:

World は World に含まれます
World は USA に含まれません
World は Colorado に含まれません
World は Boulder County に含まれません
World は Boulder に含まれません
USA は World に含まれます
USA は USA に含まれます
USA は Colorado に含まれません
USA は Boulder County に含まれません
USA は Boulder に含まれません    

regionHierarchy

UInt32 型の数値(geobase のリージョン ID)を受け取ります。指定したリージョンと、その親リージョンをチェーンに沿ってすべて含むリージョン ID の配列を返します。

構文

regionHierarchy(id\[, geobase\])

パラメーター

返される値

  • 渡されたリージョンおよび、その親チェーン上にあるすべての親リージョンの ID から成る配列。Array(UInt32)。

クエリ:

SELECT regionHierarchy(number::UInt32) AS arr, arrayMap(id -> regionToName(id, 'en'), arr) FROM numbers(5);

結果:

┌─arr────────────┬─arrayMap(lambda(tuple(id), regionToName(id, 'en')), regionHierarchy(CAST(number, 'UInt32')))─┐
│ []             │ []                                                                                           │
│ [1]            │ ['World']                                                                                    │
│ [2,10,9,1]     │ ['USA','North America','America','World']                                                    │
│ [3,2,10,9,1]   │ ['Colorado','USA','North America','America','World']                                         │
│ [4,3,2,10,9,1] │ ['Boulder County','Colorado','USA','North America','America','World']                        │
└────────────────┴──────────────────────────────────────────────────────────────────────────────────────────────┘