メインコンテンツへスキップ
メインコンテンツへスキップ

URL を操作する関数

概要

注記

このセクションで言及されている関数は、最大のパフォーマンスを発揮するように最適化されており、ほとんどの場合 RFC-3986 標準には準拠していません。 RFC-3986 を実装している関数は、関数名に RFC が付加されており、一般に処理が遅くなります。

ユーザー情報文字列や @ 記号を含まない公開登録ドメインを扱う場合は、通常は RFC なしの関数バリアントを使用できます。 以下の表は、URL 内のどの記号が RFC 版および非 RFC 版によってパース可能()または不可能()かを示しています。

Symbolnon-RFCRFC
' '
\t
<
>
%✔*
{
}
\
^
~✔*
[
]
;✔*
=✔*
&✔*

* が付いている記号は RFC 3986 におけるサブデリミタであり、@ 記号に続くユーザー情報で使用することが許可されています。

URL 関数には次の 2 種類があります。

  • URL の一部を抽出する関数。該当部分が URL に存在しない場合は、空文字列が返されます。
  • URL の一部を削除する関数。削除対象となる部分が URL に存在しない場合、URL は変更されません。
注記

以下の関数は、system.functions システムテーブルから生成されています。

cutFragment

導入バージョン: v1.1

URL から、番号記号 (#) を含むフラグメント識別子を削除します。

構文

cutFragment(url)

引数

戻り値

フラグメント識別子を取り除いた URL を返します。String

使用例

SELECT cutFragment('http://example.com/path?query=value#fragment123');
┌─cutFragment('http://example.com/path?query=value#fragment123')─┐
│ http://example.com/path?query=value                            │
└────────────────────────────────────────────────────────────────┘

cutQueryString

導入バージョン: v1.1

URL からクエリ文字列(先頭の「?」を含む)を削除します。

構文

cutQueryString(url)

引数

戻り値

クエリ文字列を削除したURLを返します。String

使用例

SELECT cutQueryString('http://example.com/path?query=value&param=123#fragment');
┌─cutQueryString('http://example.com/path?query=value&param=123#fragment')─┐
│ http://example.com/path#fragment                                         │
└──────────────────────────────────────────────────────────────────────────┘

cutQueryStringAndFragment

導入バージョン: v1.1

URL からクエリ文字列とフラグメント識別子(「?」と「#」を含む)を削除します。

構文

cutQueryStringAndFragment(url)

引数

戻り値

クエリ文字列およびフラグメント識別子を取り除いた URL を返します。String

使用例

SELECT cutQueryStringAndFragment('http://example.com/path?query=value&param=123#fragment');
┌─cutQueryStringAndFragment('http://example.com/path?query=value&param=123#fragment')─┐
│ http://example.com/path                                                             │
└─────────────────────────────────────────────────────────────────────────────────────┘

cutToFirstSignificantSubdomain

導入: v1.1

トップレベルドメイン側から見て、最初の重要なサブドメイン までのサブドメインを含むドメイン部分を返します。

構文

cutToFirstSignificantSubdomain(url)

引数

  • url — 処理する URL またはドメイン文字列。String

戻り値

可能な場合は、最初の主要なサブドメインまでを含むドメインの上位サブドメイン部分を返し、そうでない場合は空文字列を返します。String

使用例

SELECT
    cutToFirstSignificantSubdomain('https://news.clickhouse.com.tr/'),
    cutToFirstSignificantSubdomain('www.tr'),
    cutToFirstSignificantSubdomain('tr');
┌─cutToFirstSignificantSubdomain('https://news.clickhouse.com.tr/')─┬─cutToFirstSignificantSubdomain('www.tr')─┬─cutToFirstSignificantSubdomain('tr')─┐
│ clickhouse.com.tr                                                 │ tr                                       │                                      │
└───────────────────────────────────────────────────────────────────┴──────────────────────────────────────────┴──────────────────────────────────────┘

cutToFirstSignificantSubdomainCustom

導入バージョン: v21.1

トップレベルドメイン配下のサブドメインを含め、最初の重要なサブドメインまでのドメイン部分を返します。カスタムの TLD リスト 名を受け取ります。最新の TLD リストが必要な場合や、独自のリストを使用する場合に便利です。

設定例

<!-- <top_level_domains_path>/var/lib/clickhouse/top_level_domains/</top_level_domains_path> -->
<top_level_domains_lists>
    <!-- https://publicsuffix.org/list/public_suffix_list.dat -->
    <public_suffix_list>public_suffix_list.dat</public_suffix_list>
    <!-- 注記: パスは top_level_domains_path 配下にあります -->
</top_level_domains_lists>

構文

cutToFirstSignificantSubdomainCustom(url, tld_list_name)

引数

  • url — 処理対象の URL またはドメイン文字列。String
  • tld_list_name — ClickHouse で設定されたカスタム TLD リストの名前。const String

戻り値

最初の意味のあるサブドメインまでを含む、トップレベルドメイン配下のドメイン部分を返します。String

非標準的なドメイン向けにカスタム TLD リストを使用する

SELECT cutToFirstSignificantSubdomainCustom('bar.foo.there-is-no-such-domain', 'public_suffix_list')
foo.there-is-no-such-domain

cutToFirstSignificantSubdomainCustomRFC

導入バージョン: v22.10

トップレベルドメインを含めて、最初の有意なサブドメインまでのドメイン部分を返します。 カスタムの TLD リスト名を受け取ります。 この関数は、新しい TLD リストが必要な場合や、カスタムリストを使用している場合に有用です。 cutToFirstSignificantSubdomainCustom と似ていますが、RFC 3986 に準拠しています。

設定例

<!-- <top_level_domains_path>/var/lib/clickhouse/top_level_domains/</top_level_domains_path> -->
<top_level_domains_lists>
    <!-- https://publicsuffix.org/list/public_suffix_list.dat -->
    <public_suffix_list>public_suffix_list.dat</public_suffix_list>
    <!-- 注: パスは top_level_domains_path 配下です -->
</top_level_domains_lists>

構文

cutToFirstSignificantSubdomainCustomRFC(url, tld_list_name)

引数

  • url — RFC 3986 に従って処理する URL またはドメイン文字列。
  • tld_list_name — ClickHouse で設定されたカスタム TLD リストの名前。

戻り値

トップレベルドメインから最初の有意なサブドメインまでを含むドメイン部分を返します。String

使用例

SELECT cutToFirstSignificantSubdomainCustomRFC('www.foo', 'public_suffix_list');
┌─cutToFirstSignificantSubdomainCustomRFC('www.foo', 'public_suffix_list')─────┐
│ www.foo                                                                      │
└──────────────────────────────────────────────────────────────────────────────┘

cutToFirstSignificantSubdomainCustomWithWWW

導入バージョン: v21.1

トップレベルのサブドメインを含めて、最初の重要なサブドメインまでのドメイン部分を、www を削除せずに返します。カスタム TLD リストの名前を受け取ります。最新の TLD リストを使いたい場合や、独自のリストを使用している場合に便利です。

構成例

<!-- <top_level_domains_path>/var/lib/clickhouse/top_level_domains/</top_level_domains_path> -->
<top_level_domains_lists>
    <!-- https://publicsuffix.org/list/public_suffix_list.dat -->
    <public_suffix_list>public_suffix_list.dat</public_suffix_list>
    <!-- 注意:パスは top_level_domains_path 配下にあります -->
</top_level_domains_lists>
    

**構文**

```sql
cutToFirstSignificantSubdomainCustomWithWWW(url, tld_list_name)

引数

  • url — 処理対象の URL またはドメイン文字列。
  • tld_list_name — ClickHouse で設定されたカスタム TLD リストの名前。

戻り値

www を取り除かずに、最初の重要なサブドメインまでのトップレベルサブドメインを含むドメインの一部。String

使用例

SELECT cutToFirstSignificantSubdomainCustomWithWWW('www.foo', 'public_suffix_list');
┌─cutToFirstSignificantSubdomainCustomWithWWW('www.foo', 'public_suffix_list')─┐
│ www.foo                                                                      │
└──────────────────────────────────────────────────────────────────────────────┘

cutToFirstSignificantSubdomainCustomWithWWWRFC

導入バージョン: v22.10

www を削除せずに、ドメインのうち最初の有意なサブドメインまでの上位サブドメインを含む部分を返します。 カスタム TLD リスト名を指定できます。 最新の TLD リストが必要な場合や、独自のリストを使用している場合に有用です。 cutToFirstSignificantSubdomainCustomWithWWW と似ていますが、RFC 3986 に準拠しています。

設定例

<!-- <top_level_domains_path>/var/lib/clickhouse/top_level_domains/</top_level_domains_path> -->
<top_level_domains_lists>
    <!-- https://publicsuffix.org/list/public_suffix_list.dat -->
    <public_suffix_list>public_suffix_list.dat</public_suffix_list>
    <!-- 注: パスは top_level_domains_path 配下です -->
</top_level_domains_lists>
    

**構文**

```sql
cutToFirstSignificantSubdomainCustomWithWWWRFC(url, tld_list_name)

引数

  • url — RFC 3986 に従って処理する URL またはドメイン文字列。
  • tld_list_name — ClickHouse で設定されたカスタム TLD リストの名前。

戻り値

www を取り除かずに、最初の意味のあるサブドメインまでの最上位レベルのサブドメインを含むドメイン部分を返します。String

カスタム TLD リストを使用し、www を保持した RFC 3986 に基づくパース

SELECT cutToFirstSignificantSubdomainCustomWithWWWRFC('https://www.subdomain.example.custom', 'public_suffix_list')
www.example.custom

cutToFirstSignificantSubdomainRFC

導入バージョン: v22.10

ドメインのうち、トップレベルドメイン側から 「最初の重要なサブドメイン」 までを含む部分を返します。cutToFirstSignificantSubdomain と同様ですが、RFC 3986 に準拠します。

構文

cutToFirstSignificantSubdomainRFC(url)

引数

  • url — RFC 3986 に従って処理する URL またはドメイン文字列。String

戻り値

可能であれば、最初の意味のあるサブドメインまでを含むトップレベルドメイン配下のドメイン部分を返し、それ以外の場合は空文字列を返します。String

使用例

SELECT
    cutToFirstSignificantSubdomain('http://user:[email protected]:8080'),
    cutToFirstSignificantSubdomainRFC('http://user:[email protected]:8080');
┌─cutToFirstSignificantSubdomain('http://user:[email protected]:8080')─┬─cutToFirstSignificantSubdomainRFC('http://user:[email protected]:8080')─┐
│                                                                         │ example.com                                                                │
└─────────────────────────────────────────────────────────────────────────┴────────────────────────────────────────────────────────────────────────────┘

cutToFirstSignificantSubdomainWithWWW

導入バージョン: v20.12

トップレベルのサブドメインを、「最初の重要なサブドメイン」まで含めたドメイン部分を返しますが、'www.' は取り除きません。

cutToFirstSignificantSubdomain と似ていますが、存在する場合は 'www.' のプレフィックスを保持します。

構文

cutToFirstSignificantSubdomainWithWWW(url)

引数

  • url — 処理対象の URL またはドメイン文字列。String

戻り値

可能であれば、www を含め、最初の重要なサブドメインまでの上位サブドメインを含むドメイン部分を返します。そうでない場合は空文字列を返します。String

使用例

SELECT
    cutToFirstSignificantSubdomainWithWWW('https://news.clickhouse.com.tr/'),
    cutToFirstSignificantSubdomainWithWWW('www.tr'),
    cutToFirstSignificantSubdomainWithWWW('tr');
┌─cutToFirstSignificantSubdomainWithWWW('https://news.clickhouse.com.tr/')─┬─cutToFirstSignificantSubdomainWithWWW('www.tr')─┬─cutToFirstSignificantSubdomainWithWWW('tr')─┐
│ clickhouse.com.tr                                                        │ www.tr                                          │                                             │
└──────────────────────────────────────────────────────────────────────────┴─────────────────────────────────────────────────┴─────────────────────────────────────────────┘

cutToFirstSignificantSubdomainWithWWWRFC

導入バージョン: v22.10

トップレベルサブドメインを「最初の重要なサブドメイン」まで含むドメイン部分を、'www' を削除せずに返します。cutToFirstSignificantSubdomainWithWWW に似ていますが、RFC 3986 に準拠しています。

構文

cutToFirstSignificantSubdomainWithWWWRFC(url)

引数

  • url — RFC 3986 に従って処理される URL またはドメイン文字列。

戻り値

ドメインのうち、可能であれば最初の有意なサブドメインまで(「www」を含む)を含む部分を返し、それが不可能な場合は空文字列を返します。String

使用例

SELECT
    cutToFirstSignificantSubdomainWithWWW('http:%2F%[email protected]/economicheskiy'),
    cutToFirstSignificantSubdomainWithWWWRFC('http:%2F%[email protected]/economicheskiy');
┌─cutToFirstSignificantSubdomainWithWWW('http:%2F%[email protected]/economicheskiy')─┬─cutToFirstSignificantSubdomainWithWWWRFC('http:%2F%[email protected]/economicheskiy')─┐
│                                                                                       │ mail.ru                                                                                  │
└───────────────────────────────────────────────────────────────────────────────────────┴──────────────────────────────────────────────────────────────────────────────────────────┘

cutURLParameter

導入バージョン: v1.1

URL に name パラメーターが存在する場合、それを削除します。 この関数はパラメーター名内の文字のエンコードやデコードを行いません。そのため、Client IDClient%20ID は別個のパラメーター名として扱われます。

構文

cutURLParameter(url, name)

引数

戻り値

name という URL パラメータが削除された URL。String

使用例

SELECT
    cutURLParameter('http://bigmir.net/?a=b&c=d&e=f#g', 'a') AS url_without_a,
    cutURLParameter('http://bigmir.net/?a=b&c=d&e=f#g', ['c', 'e']) AS url_without_c_and_e;
┌─url_without_a────────────────┬─url_without_c_and_e──────┐
│ http://bigmir.net/?c=d&e=f#g │ http://bigmir.net/?a=b#g │
└──────────────────────────────┴──────────────────────────┘

cutWWW

導入バージョン: v1.1

URL のドメインの先頭に www. がある場合、それを削除します。

構文

cutWWW(url)

引数

戻り値

ドメイン名から先頭の www. を取り除いた URL を返します。String

使用例

SELECT cutWWW('http://www.example.com/path?query=value#fragment');
┌─cutWWW('http://www.example.com/path?query=value#fragment')─┐
│ http://example.com/path?query=value#fragment               │
└────────────────────────────────────────────────────────────┘

decodeURLComponent

導入バージョン: v1.1

URL エンコードされた文字列を入力として受け取り、元の読みやすい形式にデコードします。

構文

decodeURLComponent(url)

引数

戻り値

デコードされたURLを返します。String

使用例

SELECT decodeURLComponent('http://127.0.0.1:8123/?query=SELECT%201%3B') AS DecodedURL;
┌─デコード後のURL─────────────────────────┐
│ http://127.0.0.1:8123/?query=SELECT 1; │
└────────────────────────────────────────┘

decodeURLFormComponent

v1.1 で導入

フォームエンコードの規則(RFC-1866)に従って URL エンコードされた文字列をデコードします。+ 記号は空白に変換され、パーセントエンコードされた文字がデコードされます。

構文

decodeURLFormComponent(url)

引数

戻り値

URL をデコードした結果を返します。String

使用例

SELECT decodeURLFormComponent('http://127.0.0.1:8123/?query=SELECT%201+2%2B3') AS DecodedURL;
┌─DecodedURL────────────────────────────────┐
│ http://127.0.0.1:8123/?query=SELECT 1 2+3 │
└───────────────────────────────────────────┘

domain

導入バージョン: v1.1

URL からホスト名を抽出します。

URL はプロトコルの有無にかかわらず指定できます。

構文

domain(url)

引数

戻り値

入力文字列が URL として解釈できる場合はホスト名を返し、それ以外の場合は空文字列を返します。String

使用例

SELECT domain('svn+ssh://some.svn-hosting.com:80/repo/trunk');
┌─domain('svn+ssh://some.svn-hosting.com:80/repo/trunk')─┐
│ some.svn-hosting.com                                   │
└────────────────────────────────────────────────────────┘

domainRFC

導入: v22.10

URL からホスト名を抽出します。 domain と同様ですが、RFC 3986 に準拠しています。

構文

domainRFC(url)

引数

戻り値

入力文字列を URL として解釈できる場合はホスト名を返し、それ以外の場合は空文字列を返します。String

使用例

SELECT
    domain('http://user:[email protected]:8080/path?query=value#fragment'),
    domainRFC('http://user:[email protected]:8080/path?query=value#fragment');
┌─domain('http://user:[email protected]:8080/path?query=value#fragment')─┬─domainRFC('http://user:[email protected]:8080/path?query=value#fragment')─┐
│                                                                           │ example.com                                                                  │
└───────────────────────────────────────────────────────────────────────────┴──────────────────────────────────────────────────────────────────────────────┘

domainWithoutWWW

導入バージョン: v1.1

URL のドメイン名を返します。先頭に www. が付いている場合は、それを取り除きます。

構文

domainWithoutWWW(url)

引数

戻り値

入力文字列が URL として解析可能な場合はドメイン名(先頭の www. を除く)を返し、それ以外の場合は空文字列を返します。String

使用例

SELECT domainWithoutWWW('http://[email protected]:80/');
┌─domainWithoutWWW('http://[email protected]:80/')─┐
│ example.com                                         │
└─────────────────────────────────────────────────────┘

domainWithoutWWWRFC

導入: v1.1

先頭に www. が付いている場合、それを取り除いたドメインを返します。domainWithoutWWW と似ていますが、RFC 3986 に準拠しています。

構文

domainWithoutWWWRFC(url)

引数

戻り値

入力文字列が URL としてパースできる場合はドメイン名(先頭の www. を除く)を返し、それ以外の場合は空の文字列を返します。String

使用例

SELECT
    domainWithoutWWW('http://user:[email protected]:8080/path?query=value#fragment'),
    domainWithoutWWWRFC('http://user:[email protected]:8080/path?query=value#fragment');
┌─domainWithoutWWW('http://user:[email protected]:8080/path?query=value#fragment')─┬─domainWithoutWWWRFC('http://user:[email protected]:8080/path?query=value#fragment')─┐
│                                                                                         │ example.com                                                                                │
└─────────────────────────────────────────────────────────────────────────────────────────┴────────────────────────────────────────────────────────────────────────────────────────────┘

encodeURLComponent

導入: v22.3

通常の文字列を受け取り、特殊文字を対応するパーセントエンコード表現に置き換えた URL エンコード(パーセントエンコード)形式に変換します。

構文

encodeURLComponent(url)

引数

戻り値

エンコードされた URL を返します。String

使用例

SELECT encodeURLComponent('http://127.0.0.1:8123/?query=SELECT 1;') AS EncodedURL;
┌─EncodedURL───────────────────────────────────────────────┐
│ http%3A%2F%2F127.0.0.1%3A8123%2F%3Fquery%3DSELECT%201%3B │
└──────────────────────────────────────────────────────────┘

encodeURLFormComponent

導入バージョン: v22.3

フォームエンコードの規則(RFC-1866)に従って文字列をエンコードします。スペースは+記号に変換され、特殊文字はパーセントエンコードされます。

構文

encodeURLFormComponent(url)

引数

戻り値

エンコードされた URL を返します。String

使用例

SELECT encodeURLFormComponent('http://127.0.0.1:8123/?query=SELECT 1 2+3') AS EncodedURL;
┌─EncodedURL────────────────────────────────────────────────┐
│ http%3A%2F%2F127.0.0.1%3A8123%2F%3Fquery%3DSELECT+1+2%2B3 │
└───────────────────────────────────────────────────────────┘

extractURLParameter

導入バージョン: v1.1

URL に name パラメータが存在する場合はその値を返し、存在しない場合は空文字列を返します。 この名前のパラメータが複数ある場合、最初に出現したものを返します。 関数は、url 引数で指定された URL 内のパラメータが、name 引数と同じ方法でエンコードされていることを前提とします。

構文

extractURLParameter(url, name)

引数

戻り値

指定した名前の URL パラメータの値を返します。String

使用例

SELECT extractURLParameter('http://example.com/?param1=value1&param2=value2', 'param1');
┌─extractURLPa⋯, 'param1')─┐
│ value1                   │
└──────────────────────────┘

extractURLParameterNames

導入バージョン: v1.1

URL パラメータ名に対応する文字列の配列を返します。 値はデコードされません。

構文

extractURLParameterNames(url)

引数

戻り値

URL パラメータの名前に対応する文字列の配列を返します。Array(String)

使用例

SELECT extractURLParameterNames('http://example.com/?param1=value1&param2=value2');
┌─extractURLPa⋯m2=value2')─┐
│ ['param1','param2']      │
└──────────────────────────┘

extractURLParameters

導入: v1.1

URL パラメータに対応する name=value 形式の文字列の配列を返します。 値はデコードされません。

構文

extractURLParameters(url)

引数

戻り値

URL パラメーターに対応する name=value 形式の文字列の配列を返します。Array(String)

使用例

SELECT extractURLParameters('http://example.com/?param1=value1&param2=value2');
┌─extractURLParame⋯&param2=value2')─┐
│ ['param1=value1','param2=value2'] │
└───────────────────────────────────┘

firstSignificantSubdomain

導入バージョン: v

「最初の重要なサブドメイン」を返します。

最初の重要なサブドメインは、'com'、'net'、'org'、または 'co' のいずれかである場合は第二レベルドメインです。 それ以外の場合は、第三レベルドメインになります。

たとえば、firstSignificantSubdomain('https://news.clickhouse.com/') = 'clickhouse'、firstSignificantSubdomain ('https://news.clickhouse.com.tr/') = 'clickhouse' となります。

「重要ではない」第二レベルドメインの一覧やその他の実装の詳細は、将来変更される可能性があります。

構文

引数

  • なし

返り値

firstSignificantSubdomain

SELECT firstSignificantSubdomain('https://news.clickhouse.com/')

firstSignificantSubdomainRFC

導入バージョン: v

RFC 1034 に従って「先頭の有意なサブドメイン」を返します。

構文

引数

  • なし。

戻り値

fragment

導入バージョン:v1.1

先頭のハッシュ記号を除いたフラグメント識別子を返します。

構文

フラグメント(url)

引数

戻り値

先頭のハッシュ記号を除いたフラグメント識別子を返します。String

使用例

SELECT fragment('https://clickhouse.com/docs/getting-started/quick-start/cloud#1-create-a-clickhouse-service');
┌─fragment('http⋯ouse-service')─┐
│ 1-create-a-clickhouse-service │
└───────────────────────────────┘

netloc

導入バージョン: v20.5

URL からネットワークロケーション(username:password@host:port の部分)を抽出します。

構文

netloc(url)

引数

戻り値

指定された URL から username:password@host:port を返します。String

使用例

SELECT netloc('http://[email protected]:80/');
┌─netloc('http⋯e.com:80/')─┐
│ [email protected]:80  │
└──────────────────────────┘

path

導入バージョン: v1.1

URL からクエリ文字列を除いたパス部分を返します。

構文

パス(url)

引数

戻り値

クエリ文字列を除いた URL のパス部分を返します。String

使用例

SELECT path('https://clickhouse.com/docs/sql-reference/functions/url-functions/?query=value');
┌─path('https://clickhouse.com/en/sql-reference/functions/url-functions/?query=value')─┐
│ /docs/sql-reference/functions/url-functions/                                         │
└──────────────────────────────────────────────────────────────────────────────────────┘

pathFull

導入: v1.1

path と同様ですが、URL のクエリ文字列とフラグメント部分も含めます。

構文

pathFull(url)

引数

戻り値

クエリ文字列およびフラグメントを含む URL のパスを返します。String

使用例

SELECT pathFull('https://clickhouse.com/docs/sql-reference/functions/url-functions/?query=value#section');
┌─pathFull('https://clickhouse.com⋯unctions/?query=value#section')─┐
│ /docs/sql-reference/functions/url-functions/?query=value#section │
└──────────────────────────────────────────────────────────────────┘

port

導入: v20.5

URL のポート番号を返します。URL にポート番号が含まれていない場合、または URL を解析できない場合は default_port を返します。

構文

port(url[, default_port])

引数

  • url — URL。String
  • default_port — 省略可能。返されるデフォルトのポート番号。既定値は 0UInt16

返り値

URL のポート番号を返します。URL にポートが含まれていない場合、または検証エラーが発生した場合は、デフォルトのポート番号を返します。UInt16

使用例

SELECT port('https://clickhouse.com:8443/docs'), port('https://clickhouse.com/docs', 443);
┌─port('https://clickhouse.com:8443/docs')─┬─port('https://clickhouse.com/docs', 443)─┐
│                                     8443 │                                      443 │
└──────────────────────────────────────────┴──────────────────────────────────────────┘

portRFC

導入バージョン: v22.10

URL からポート番号を返し、URL にポートが含まれていない場合や解析できない場合は default_port を返します。 port と同様ですが、RFC 3986 に準拠しています。

構文

portRFC(url[, default_port])

引数

  • url — URL。String
  • default_port — 省略可能。返されるデフォルトのポート番号。既定値は 0UInt16

返される値

URL にポートが含まれていない場合、または検証エラーが発生した場合にはデフォルトのポートを、それ以外の場合には URL のポートを返します。UInt16

使用例

SELECT port('http://user:[email protected]:8080/'), portRFC('http://user:[email protected]:8080/');
┌─port('http:/⋯com:8080/')─┬─portRFC('htt⋯com:8080/')─┐
│                        0 │                     8080 │
└──────────────────────────┴──────────────────────────┘

protocol

導入バージョン: v1.1

URL からプロトコルを抽出します。

返される値の典型例: http、https、ftp、mailto、tel、magnet。

構文

protocol(url)

引数

戻り値

URLのプロトコルを返します。判別できない場合は空文字列を返します。String

使用例

SELECT protocol('https://clickhouse.com/');
┌─protocol('https://clickhouse.com/')─┐
│ https                               │
└─────────────────────────────────────┘

queryString

導入バージョン: v1.1

URL のクエリ文字列から、先頭の疑問符 (?) と #、および # 以降のすべてを取り除いた文字列を返します。

構文

queryString(url)

引数

戻り値

先頭の疑問符とフラグメントを除いたURLのクエリ文字列を返します。String

使用例

SELECT queryString('https://clickhouse.com/docs?query=value&param=123#section');
┌─queryString(⋯3#section')─┐
│ query=value&param=123    │
└──────────────────────────┘

queryStringAndFragment

導入バージョン: v1.1

URL のクエリ文字列とフラグメント識別子を返します。

構文

queryStringAndFragment(url)

引数

戻り値

URL のクエリ文字列およびフラグメント識別子を返します。String

使用例

SELECT queryStringAndFragment('https://clickhouse.com/docs?query=value&param=123#section');
┌─queryStringAnd⋯=123#section')─┐
│ query=value&param=123#section │
└───────────────────────────────┘

topLevelDomain

導入バージョン:v1.1

URL からトップレベルドメインを抽出します。

注記

URL はプロトコルの有無にかかわらず指定できます。 例えば:

svn+ssh://some.svn-hosting.com:80/repo/trunk
some.svn-hosting.com:80/repo/trunk
https://clickhouse.com/time/

構文

topLevelDomain(url)

引数

戻り値

入力文字列が URL としてパース可能な場合はドメイン名を返します。そうでない場合は空文字列を返します。String

使用例

SELECT topLevelDomain('svn+ssh://www.some.svn-hosting.com:80/repo/trunk');
┌─topLevelDomain('svn+ssh://www.some.svn-hosting.com:80/repo/trunk')─┐
│ com                                                                │
└────────────────────────────────────────────────────────────────────┘

topLevelDomainRFC

導入バージョン: v22.10

URLからトップレベルドメインを抽出します。 topLevelDomain と類似していますが、RFC 3986 に準拠しています。

構文

topLevelDomainRFC(url)

引数

戻り値

入力文字列が URL として解析できる場合はそのドメイン名、それ以外の場合は空文字列。String

使用例

SELECT topLevelDomain('http://foo:foo%[email protected]'), topLevelDomainRFC('http://foo:foo%[email protected]');
┌─topLevelDomain('http://foo:foo%[email protected]')─┬─topLevelDomainRFC('http://foo:foo%[email protected]')─┐
│                                                │ com                                               │
└────────────────────────────────────────────────┴───────────────────────────────────────────────────┘