注記
このセクションで言及されている関数は、最大のパフォーマンスを発揮するように最適化されており、ほとんどの場合 RFC-3986 標準には準拠していません。
RFC-3986 を実装している関数は、関数名に RFC が付加されており、一般に処理が遅くなります。
ユーザー情報文字列や @ 記号を含まない公開登録ドメインを扱う場合は、通常は RFC なしの関数バリアントを使用できます。
以下の表は、URL 内のどの記号が RFC 版および非 RFC 版によってパース可能(✔)または不可能(✗)かを示しています。
| Symbol | non-RFC | RFC | |
|---|
| ' ' | ✗ | ✗ | |
| \t | ✗ | ✗ | |
| < | ✗ | ✗ | |
| > | ✗ | ✗ | |
| % | ✗ | ✔* | |
| { | ✗ | ✗ | |
| } | ✗ | ✗ | |
| | ✗ | ✗ |
| \ | ✗ | ✗ | |
| ^ | ✗ | ✗ | |
| ~ | ✗ | ✔* | |
| [ | ✗ | ✗ | |
| ] | ✗ | ✔ | |
| ; | ✗ | ✔* | |
| = | ✗ | ✔* | |
| & | ✗ | ✔* | |
* が付いている記号は RFC 3986 におけるサブデリミタであり、@ 記号に続くユーザー情報で使用することが許可されています。
URL 関数には次の 2 種類があります。
- URL の一部を抽出する関数。該当部分が URL に存在しない場合は、空文字列が返されます。
- URL の一部を削除する関数。削除対象となる部分が URL に存在しない場合、URL は変更されません。
注記
以下の関数は、system.functions システムテーブルから生成されています。
cutFragment
導入バージョン: v1.1
URL から、番号記号 (#) を含むフラグメント識別子を削除します。
構文
引数
戻り値
フラグメント識別子を取り除いた URL を返します。String
例
使用例
SELECT cutFragment('http://example.com/path?query=value#fragment123');
┌─cutFragment('http://example.com/path?query=value#fragment123')─┐
│ http://example.com/path?query=value │
└────────────────────────────────────────────────────────────────┘
cutQueryString
導入バージョン: v1.1
URL からクエリ文字列(先頭の「?」を含む)を削除します。
構文
引数
戻り値
クエリ文字列を削除したURLを返します。String
例
使用例
SELECT cutQueryString('http://example.com/path?query=value¶m=123#fragment');
┌─cutQueryString('http://example.com/path?query=value¶m=123#fragment')─┐
│ http://example.com/path#fragment │
└──────────────────────────────────────────────────────────────────────────┘
cutQueryStringAndFragment
導入バージョン: v1.1
URL からクエリ文字列とフラグメント識別子(「?」と「#」を含む)を削除します。
構文
cutQueryStringAndFragment(url)
引数
戻り値
クエリ文字列およびフラグメント識別子を取り除いた URL を返します。String
例
使用例
SELECT cutQueryStringAndFragment('http://example.com/path?query=value¶m=123#fragment');
┌─cutQueryStringAndFragment('http://example.com/path?query=value¶m=123#fragment')─┐
│ http://example.com/path │
└─────────────────────────────────────────────────────────────────────────────────────┘
cutToFirstSignificantSubdomain
導入: v1.1
トップレベルドメイン側から見て、最初の重要なサブドメイン までのサブドメインを含むドメイン部分を返します。
構文
cutToFirstSignificantSubdomain(url)
引数
url — 処理する URL またはドメイン文字列。String
戻り値
可能な場合は、最初の主要なサブドメインまでを含むドメインの上位サブドメイン部分を返し、そうでない場合は空文字列を返します。String
例
使用例
SELECT
cutToFirstSignificantSubdomain('https://news.clickhouse.com.tr/'),
cutToFirstSignificantSubdomain('www.tr'),
cutToFirstSignificantSubdomain('tr');
┌─cutToFirstSignificantSubdomain('https://news.clickhouse.com.tr/')─┬─cutToFirstSignificantSubdomain('www.tr')─┬─cutToFirstSignificantSubdomain('tr')─┐
│ clickhouse.com.tr │ tr │ │
└───────────────────────────────────────────────────────────────────┴──────────────────────────────────────────┴──────────────────────────────────────┘
cutToFirstSignificantSubdomainCustom
導入バージョン: v21.1
トップレベルドメイン配下のサブドメインを含め、最初の重要なサブドメインまでのドメイン部分を返します。カスタムの TLD リスト 名を受け取ります。最新の TLD リストが必要な場合や、独自のリストを使用する場合に便利です。
設定例
<!-- <top_level_domains_path>/var/lib/clickhouse/top_level_domains/</top_level_domains_path> -->
<top_level_domains_lists>
<!-- https://publicsuffix.org/list/public_suffix_list.dat -->
<public_suffix_list>public_suffix_list.dat</public_suffix_list>
<!-- 注記: パスは top_level_domains_path 配下にあります -->
</top_level_domains_lists>
構文
cutToFirstSignificantSubdomainCustom(url, tld_list_name)
引数
url — 処理対象の URL またはドメイン文字列。String
tld_list_name — ClickHouse で設定されたカスタム TLD リストの名前。const String
戻り値
最初の意味のあるサブドメインまでを含む、トップレベルドメイン配下のドメイン部分を返します。String
例
非標準的なドメイン向けにカスタム TLD リストを使用する
SELECT cutToFirstSignificantSubdomainCustom('bar.foo.there-is-no-such-domain', 'public_suffix_list')
foo.there-is-no-such-domain
cutToFirstSignificantSubdomainCustomRFC
導入バージョン: v22.10
トップレベルドメインを含めて、最初の有意なサブドメインまでのドメイン部分を返します。
カスタムの TLD リスト名を受け取ります。
この関数は、新しい TLD リストが必要な場合や、カスタムリストを使用している場合に有用です。
cutToFirstSignificantSubdomainCustom と似ていますが、RFC 3986 に準拠しています。
設定例
<!-- <top_level_domains_path>/var/lib/clickhouse/top_level_domains/</top_level_domains_path> -->
<top_level_domains_lists>
<!-- https://publicsuffix.org/list/public_suffix_list.dat -->
<public_suffix_list>public_suffix_list.dat</public_suffix_list>
<!-- 注: パスは top_level_domains_path 配下です -->
</top_level_domains_lists>
構文
cutToFirstSignificantSubdomainCustomRFC(url, tld_list_name)
引数
url — RFC 3986 に従って処理する URL またはドメイン文字列。
tld_list_name — ClickHouse で設定されたカスタム TLD リストの名前。
戻り値
トップレベルドメインから最初の有意なサブドメインまでを含むドメイン部分を返します。String
例
使用例
SELECT cutToFirstSignificantSubdomainCustomRFC('www.foo', 'public_suffix_list');
┌─cutToFirstSignificantSubdomainCustomRFC('www.foo', 'public_suffix_list')─────┐
│ www.foo │
└──────────────────────────────────────────────────────────────────────────────┘
cutToFirstSignificantSubdomainCustomWithWWW
導入バージョン: v21.1
トップレベルのサブドメインを含めて、最初の重要なサブドメインまでのドメイン部分を、www を削除せずに返します。カスタム TLD リストの名前を受け取ります。最新の TLD リストを使いたい場合や、独自のリストを使用している場合に便利です。
構成例
<!-- <top_level_domains_path>/var/lib/clickhouse/top_level_domains/</top_level_domains_path> -->
<top_level_domains_lists>
<!-- https://publicsuffix.org/list/public_suffix_list.dat -->
<public_suffix_list>public_suffix_list.dat</public_suffix_list>
<!-- 注意:パスは top_level_domains_path 配下にあります -->
</top_level_domains_lists>
**構文**
```sql
cutToFirstSignificantSubdomainCustomWithWWW(url, tld_list_name)
引数
url — 処理対象の URL またはドメイン文字列。
tld_list_name — ClickHouse で設定されたカスタム TLD リストの名前。
戻り値
www を取り除かずに、最初の重要なサブドメインまでのトップレベルサブドメインを含むドメインの一部。String
例
使用例
SELECT cutToFirstSignificantSubdomainCustomWithWWW('www.foo', 'public_suffix_list');
┌─cutToFirstSignificantSubdomainCustomWithWWW('www.foo', 'public_suffix_list')─┐
│ www.foo │
└──────────────────────────────────────────────────────────────────────────────┘
cutToFirstSignificantSubdomainCustomWithWWWRFC
導入バージョン: v22.10
www を削除せずに、ドメインのうち最初の有意なサブドメインまでの上位サブドメインを含む部分を返します。
カスタム TLD リスト名を指定できます。
最新の TLD リストが必要な場合や、独自のリストを使用している場合に有用です。
cutToFirstSignificantSubdomainCustomWithWWW と似ていますが、RFC 3986 に準拠しています。
設定例
<!-- <top_level_domains_path>/var/lib/clickhouse/top_level_domains/</top_level_domains_path> -->
<top_level_domains_lists>
<!-- https://publicsuffix.org/list/public_suffix_list.dat -->
<public_suffix_list>public_suffix_list.dat</public_suffix_list>
<!-- 注: パスは top_level_domains_path 配下です -->
</top_level_domains_lists>
**構文**
```sql
cutToFirstSignificantSubdomainCustomWithWWWRFC(url, tld_list_name)
引数
url — RFC 3986 に従って処理する URL またはドメイン文字列。
tld_list_name — ClickHouse で設定されたカスタム TLD リストの名前。
戻り値
www を取り除かずに、最初の意味のあるサブドメインまでの最上位レベルのサブドメインを含むドメイン部分を返します。String
例
カスタム TLD リストを使用し、www を保持した RFC 3986 に基づくパース
SELECT cutToFirstSignificantSubdomainCustomWithWWWRFC('https://www.subdomain.example.custom', 'public_suffix_list')
cutToFirstSignificantSubdomainRFC
導入バージョン: v22.10
ドメインのうち、トップレベルドメイン側から 「最初の重要なサブドメイン」 までを含む部分を返します。cutToFirstSignificantSubdomain と同様ですが、RFC 3986 に準拠します。
構文
cutToFirstSignificantSubdomainRFC(url)
引数
url — RFC 3986 に従って処理する URL またはドメイン文字列。String
戻り値
可能であれば、最初の意味のあるサブドメインまでを含むトップレベルドメイン配下のドメイン部分を返し、それ以外の場合は空文字列を返します。String
例
使用例
┌─cutToFirstSignificantSubdomain('http://user:[email protected]:8080')─┬─cutToFirstSignificantSubdomainRFC('http://user:[email protected]:8080')─┐
│ │ example.com │
└─────────────────────────────────────────────────────────────────────────┴────────────────────────────────────────────────────────────────────────────┘
cutToFirstSignificantSubdomainWithWWW
導入バージョン: v20.12
トップレベルのサブドメインを、「最初の重要なサブドメイン」まで含めたドメイン部分を返しますが、'www.' は取り除きません。
cutToFirstSignificantSubdomain と似ていますが、存在する場合は 'www.' のプレフィックスを保持します。
構文
cutToFirstSignificantSubdomainWithWWW(url)
引数
url — 処理対象の URL またはドメイン文字列。String
戻り値
可能であれば、www を含め、最初の重要なサブドメインまでの上位サブドメインを含むドメイン部分を返します。そうでない場合は空文字列を返します。String
例
使用例
SELECT
cutToFirstSignificantSubdomainWithWWW('https://news.clickhouse.com.tr/'),
cutToFirstSignificantSubdomainWithWWW('www.tr'),
cutToFirstSignificantSubdomainWithWWW('tr');
┌─cutToFirstSignificantSubdomainWithWWW('https://news.clickhouse.com.tr/')─┬─cutToFirstSignificantSubdomainWithWWW('www.tr')─┬─cutToFirstSignificantSubdomainWithWWW('tr')─┐
│ clickhouse.com.tr │ www.tr │ │
└──────────────────────────────────────────────────────────────────────────┴─────────────────────────────────────────────────┴─────────────────────────────────────────────┘
cutToFirstSignificantSubdomainWithWWWRFC
導入バージョン: v22.10
トップレベルサブドメインを「最初の重要なサブドメイン」まで含むドメイン部分を、'www' を削除せずに返します。cutToFirstSignificantSubdomainWithWWW に似ていますが、RFC 3986 に準拠しています。
構文
cutToFirstSignificantSubdomainWithWWWRFC(url)
引数
url — RFC 3986 に従って処理される URL またはドメイン文字列。
戻り値
ドメインのうち、可能であれば最初の有意なサブドメインまで(「www」を含む)を含む部分を返し、それが不可能な場合は空文字列を返します。String
例
使用例
SELECT
cutToFirstSignificantSubdomainWithWWW('http:%2F%[email protected]/economicheskiy'),
cutToFirstSignificantSubdomainWithWWWRFC('http:%2F%[email protected]/economicheskiy');
┌─cutToFirstSignificantSubdomainWithWWW('http:%2F%[email protected]/economicheskiy')─┬─cutToFirstSignificantSubdomainWithWWWRFC('http:%2F%[email protected]/economicheskiy')─┐
│ │ mail.ru │
└───────────────────────────────────────────────────────────────────────────────────────┴──────────────────────────────────────────────────────────────────────────────────────────┘
cutURLParameter
導入バージョン: v1.1
URL に name パラメーターが存在する場合、それを削除します。
この関数はパラメーター名内の文字のエンコードやデコードを行いません。そのため、Client ID と Client%20ID は別個のパラメーター名として扱われます。
構文
cutURLParameter(url, name)
引数
戻り値
name という URL パラメータが削除された URL。String
例
使用例
SELECT
cutURLParameter('http://bigmir.net/?a=b&c=d&e=f#g', 'a') AS url_without_a,
cutURLParameter('http://bigmir.net/?a=b&c=d&e=f#g', ['c', 'e']) AS url_without_c_and_e;
┌─url_without_a────────────────┬─url_without_c_and_e──────┐
│ http://bigmir.net/?c=d&e=f#g │ http://bigmir.net/?a=b#g │
└──────────────────────────────┴──────────────────────────┘
cutWWW
導入バージョン: v1.1
URL のドメインの先頭に www. がある場合、それを削除します。
構文
引数
戻り値
ドメイン名から先頭の www. を取り除いた URL を返します。String
例
使用例
SELECT cutWWW('http://www.example.com/path?query=value#fragment');
┌─cutWWW('http://www.example.com/path?query=value#fragment')─┐
│ http://example.com/path?query=value#fragment │
└────────────────────────────────────────────────────────────┘
decodeURLComponent
導入バージョン: v1.1
URL エンコードされた文字列を入力として受け取り、元の読みやすい形式にデコードします。
構文
引数
戻り値
デコードされたURLを返します。String
例
使用例
SELECT decodeURLComponent('http://127.0.0.1:8123/?query=SELECT%201%3B') AS DecodedURL;
┌─デコード後のURL─────────────────────────┐
│ http://127.0.0.1:8123/?query=SELECT 1; │
└────────────────────────────────────────┘
v1.1 で導入
フォームエンコードの規則(RFC-1866)に従って URL エンコードされた文字列をデコードします。+ 記号は空白に変換され、パーセントエンコードされた文字がデコードされます。
構文
decodeURLFormComponent(url)
引数
戻り値
URL をデコードした結果を返します。String
例
使用例
SELECT decodeURLFormComponent('http://127.0.0.1:8123/?query=SELECT%201+2%2B3') AS DecodedURL;
┌─DecodedURL────────────────────────────────┐
│ http://127.0.0.1:8123/?query=SELECT 1 2+3 │
└───────────────────────────────────────────┘
domain
導入バージョン: v1.1
URL からホスト名を抽出します。
URL はプロトコルの有無にかかわらず指定できます。
構文
引数
戻り値
入力文字列が URL として解釈できる場合はホスト名を返し、それ以外の場合は空文字列を返します。String
例
使用例
SELECT domain('svn+ssh://some.svn-hosting.com:80/repo/trunk');
┌─domain('svn+ssh://some.svn-hosting.com:80/repo/trunk')─┐
│ some.svn-hosting.com │
└────────────────────────────────────────────────────────┘
domainRFC
導入: v22.10
URL からホスト名を抽出します。
domain と同様ですが、RFC 3986 に準拠しています。
構文
引数
戻り値
入力文字列を URL として解釈できる場合はホスト名を返し、それ以外の場合は空文字列を返します。String
例
使用例
┌─domain('http://user:[email protected]:8080/path?query=value#fragment')─┬─domainRFC('http://user:[email protected]:8080/path?query=value#fragment')─┐
│ │ example.com │
└───────────────────────────────────────────────────────────────────────────┴──────────────────────────────────────────────────────────────────────────────┘
domainWithoutWWW
導入バージョン: v1.1
URL のドメイン名を返します。先頭に www. が付いている場合は、それを取り除きます。
構文
引数
戻り値
入力文字列が URL として解析可能な場合はドメイン名(先頭の www. を除く)を返し、それ以外の場合は空文字列を返します。String
例
使用例
┌─domainWithoutWWW('http://[email protected]:80/')─┐
│ example.com │
└─────────────────────────────────────────────────────┘
domainWithoutWWWRFC
導入: v1.1
先頭に www. が付いている場合、それを取り除いたドメインを返します。domainWithoutWWW と似ていますが、RFC 3986 に準拠しています。
構文
引数
戻り値
入力文字列が URL としてパースできる場合はドメイン名(先頭の www. を除く)を返し、それ以外の場合は空の文字列を返します。String
例
使用例
SELECT
domainWithoutWWW('http://user:[email protected]:8080/path?query=value#fragment'),
domainWithoutWWWRFC('http://user:[email protected]:8080/path?query=value#fragment');
┌─domainWithoutWWW('http://user:[email protected]:8080/path?query=value#fragment')─┬─domainWithoutWWWRFC('http://user:[email protected]:8080/path?query=value#fragment')─┐
│ │ example.com │
└─────────────────────────────────────────────────────────────────────────────────────────┴────────────────────────────────────────────────────────────────────────────────────────────┘
encodeURLComponent
導入: v22.3
通常の文字列を受け取り、特殊文字を対応するパーセントエンコード表現に置き換えた URL エンコード(パーセントエンコード)形式に変換します。
構文
引数
戻り値
エンコードされた URL を返します。String
例
使用例
SELECT encodeURLComponent('http://127.0.0.1:8123/?query=SELECT 1;') AS EncodedURL;
┌─EncodedURL───────────────────────────────────────────────┐
│ http%3A%2F%2F127.0.0.1%3A8123%2F%3Fquery%3DSELECT%201%3B │
└──────────────────────────────────────────────────────────┘
導入バージョン: v22.3
フォームエンコードの規則(RFC-1866)に従って文字列をエンコードします。スペースは+記号に変換され、特殊文字はパーセントエンコードされます。
構文
encodeURLFormComponent(url)
引数
戻り値
エンコードされた URL を返します。String
例
使用例
SELECT encodeURLFormComponent('http://127.0.0.1:8123/?query=SELECT 1 2+3') AS EncodedURL;
┌─EncodedURL────────────────────────────────────────────────┐
│ http%3A%2F%2F127.0.0.1%3A8123%2F%3Fquery%3DSELECT+1+2%2B3 │
└───────────────────────────────────────────────────────────┘
導入バージョン: v1.1
URL に name パラメータが存在する場合はその値を返し、存在しない場合は空文字列を返します。
この名前のパラメータが複数ある場合、最初に出現したものを返します。
関数は、url 引数で指定された URL 内のパラメータが、name 引数と同じ方法でエンコードされていることを前提とします。
構文
extractURLParameter(url, name)
引数
戻り値
指定した名前の URL パラメータの値を返します。String
例
使用例
SELECT extractURLParameter('http://example.com/?param1=value1¶m2=value2', 'param1');
┌─extractURLPa⋯, 'param1')─┐
│ value1 │
└──────────────────────────┘
導入バージョン: v1.1
URL パラメータ名に対応する文字列の配列を返します。
値はデコードされません。
構文
extractURLParameterNames(url)
引数
戻り値
URL パラメータの名前に対応する文字列の配列を返します。Array(String)
例
使用例
SELECT extractURLParameterNames('http://example.com/?param1=value1¶m2=value2');
┌─extractURLPa⋯m2=value2')─┐
│ ['param1','param2'] │
└──────────────────────────┘
導入: v1.1
URL パラメータに対応する name=value 形式の文字列の配列を返します。
値はデコードされません。
構文
extractURLParameters(url)
引数
戻り値
URL パラメーターに対応する name=value 形式の文字列の配列を返します。Array(String)
例
使用例
SELECT extractURLParameters('http://example.com/?param1=value1¶m2=value2');
┌─extractURLParame⋯¶m2=value2')─┐
│ ['param1=value1','param2=value2'] │
└───────────────────────────────────┘
firstSignificantSubdomain
導入バージョン: v
「最初の重要なサブドメイン」を返します。
最初の重要なサブドメインは、'com'、'net'、'org'、または 'co' のいずれかである場合は第二レベルドメインです。
それ以外の場合は、第三レベルドメインになります。
たとえば、firstSignificantSubdomain('https://news.clickhouse.com/') = 'clickhouse'、firstSignificantSubdomain ('https://news.clickhouse.com.tr/') = 'clickhouse' となります。
「重要ではない」第二レベルドメインの一覧やその他の実装の詳細は、将来変更される可能性があります。
構文
引数
返り値
例
firstSignificantSubdomain
SELECT firstSignificantSubdomain('https://news.clickhouse.com/')
firstSignificantSubdomainRFC
導入バージョン: v
RFC 1034 に従って「先頭の有意なサブドメイン」を返します。
構文
引数
戻り値
例
fragment
導入バージョン:v1.1
先頭のハッシュ記号を除いたフラグメント識別子を返します。
構文
引数
戻り値
先頭のハッシュ記号を除いたフラグメント識別子を返します。String
例
使用例
SELECT fragment('https://clickhouse.com/docs/getting-started/quick-start/cloud#1-create-a-clickhouse-service');
┌─fragment('http⋯ouse-service')─┐
│ 1-create-a-clickhouse-service │
└───────────────────────────────┘
netloc
導入バージョン: v20.5
URL からネットワークロケーション(username:password@host:port の部分)を抽出します。
構文
引数
戻り値
指定された URL から username:password@host:port を返します。String
例
使用例
path
導入バージョン: v1.1
URL からクエリ文字列を除いたパス部分を返します。
構文
引数
戻り値
クエリ文字列を除いた URL のパス部分を返します。String
例
使用例
SELECT path('https://clickhouse.com/docs/sql-reference/functions/url-functions/?query=value');
┌─path('https://clickhouse.com/en/sql-reference/functions/url-functions/?query=value')─┐
│ /docs/sql-reference/functions/url-functions/ │
└──────────────────────────────────────────────────────────────────────────────────────┘
pathFull
導入: v1.1
path と同様ですが、URL のクエリ文字列とフラグメント部分も含めます。
構文
引数
戻り値
クエリ文字列およびフラグメントを含む URL のパスを返します。String
例
使用例
SELECT pathFull('https://clickhouse.com/docs/sql-reference/functions/url-functions/?query=value#section');
┌─pathFull('https://clickhouse.com⋯unctions/?query=value#section')─┐
│ /docs/sql-reference/functions/url-functions/?query=value#section │
└──────────────────────────────────────────────────────────────────┘
port
導入: v20.5
URL のポート番号を返します。URL にポート番号が含まれていない場合、または URL を解析できない場合は default_port を返します。
構文
port(url[, default_port])
引数
url — URL。String
default_port — 省略可能。返されるデフォルトのポート番号。既定値は 0。UInt16
返り値
URL のポート番号を返します。URL にポートが含まれていない場合、または検証エラーが発生した場合は、デフォルトのポート番号を返します。UInt16
例
使用例
SELECT port('https://clickhouse.com:8443/docs'), port('https://clickhouse.com/docs', 443);
┌─port('https://clickhouse.com:8443/docs')─┬─port('https://clickhouse.com/docs', 443)─┐
│ 8443 │ 443 │
└──────────────────────────────────────────┴──────────────────────────────────────────┘
portRFC
導入バージョン: v22.10
URL からポート番号を返し、URL にポートが含まれていない場合や解析できない場合は default_port を返します。
port と同様ですが、RFC 3986 に準拠しています。
構文
portRFC(url[, default_port])
引数
url — URL。String
default_port — 省略可能。返されるデフォルトのポート番号。既定値は 0。UInt16
返される値
URL にポートが含まれていない場合、または検証エラーが発生した場合にはデフォルトのポートを、それ以外の場合には URL のポートを返します。UInt16
例
使用例
┌─port('http:/⋯com:8080/')─┬─portRFC('htt⋯com:8080/')─┐
│ 0 │ 8080 │
└──────────────────────────┴──────────────────────────┘
protocol
導入バージョン: v1.1
URL からプロトコルを抽出します。
返される値の典型例: http、https、ftp、mailto、tel、magnet。
構文
引数
戻り値
URLのプロトコルを返します。判別できない場合は空文字列を返します。String
例
使用例
SELECT protocol('https://clickhouse.com/');
┌─protocol('https://clickhouse.com/')─┐
│ https │
└─────────────────────────────────────┘
queryString
導入バージョン: v1.1
URL のクエリ文字列から、先頭の疑問符 (?) と #、および # 以降のすべてを取り除いた文字列を返します。
構文
引数
戻り値
先頭の疑問符とフラグメントを除いたURLのクエリ文字列を返します。String
例
使用例
SELECT queryString('https://clickhouse.com/docs?query=value¶m=123#section');
┌─queryString(⋯3#section')─┐
│ query=value¶m=123 │
└──────────────────────────┘
queryStringAndFragment
導入バージョン: v1.1
URL のクエリ文字列とフラグメント識別子を返します。
構文
queryStringAndFragment(url)
引数
戻り値
URL のクエリ文字列およびフラグメント識別子を返します。String
例
使用例
SELECT queryStringAndFragment('https://clickhouse.com/docs?query=value¶m=123#section');
┌─queryStringAnd⋯=123#section')─┐
│ query=value¶m=123#section │
└───────────────────────────────┘
topLevelDomain
導入バージョン:v1.1
URL からトップレベルドメインを抽出します。
注記
URL はプロトコルの有無にかかわらず指定できます。
例えば:
svn+ssh://some.svn-hosting.com:80/repo/trunk
some.svn-hosting.com:80/repo/trunk
https://clickhouse.com/time/
構文
引数
戻り値
入力文字列が URL としてパース可能な場合はドメイン名を返します。そうでない場合は空文字列を返します。String
例
使用例
SELECT topLevelDomain('svn+ssh://www.some.svn-hosting.com:80/repo/trunk');
┌─topLevelDomain('svn+ssh://www.some.svn-hosting.com:80/repo/trunk')─┐
│ com │
└────────────────────────────────────────────────────────────────────┘
topLevelDomainRFC
導入バージョン: v22.10
URLからトップレベルドメインを抽出します。
topLevelDomain と類似していますが、RFC 3986 に準拠しています。
構文
引数
戻り値
入力文字列が URL として解析できる場合はそのドメイン名、それ以外の場合は空文字列。String
例
使用例
┌─topLevelDomain('http://foo:foo%[email protected]')─┬─topLevelDomainRFC('http://foo:foo%[email protected]')─┐
│ │ com │
└────────────────────────────────────────────────┴───────────────────────────────────────────────────┘