MySQL 8.0 リファレンスマニュアル


MySQL 8.0 リファレンスマニュアル  /  文字セット、照合順序、Unicode

第 10 章 文字セット、照合順序、Unicode

目次

10.1 一般の文字セットおよび照合順序
10.2 MySQL での文字セットと照合順序
10.2.1 文字セットレパートリー
10.2.2 メタデータ用の UTF-8
10.3 文字セットと照合順序の指定
10.3.1 照合の命名規則
10.3.2 サーバー文字セットおよび照合順序
10.3.3 データベース文字セットおよび照合順序
10.3.4 テーブル文字セットおよび照合順序
10.3.5 カラム文字セットおよび照合順序
10.3.6 文字列リテラルの文字セットおよび照合順序
10.3.7 各国語文字セット
10.3.8 文字セットイントロデューサ
10.3.9 文字セットと照合順序の割り当ての例
10.3.10 ほかの DBMS との互換性
10.4 接続文字セットおよび照合順序
10.5 アプリケーションの文字セットおよび照合順序の構成
10.6 エラーメッセージ文字セット
10.7 カラム文字セットの変換
10.8 照合順序の問題
10.8.1 SQL ステートメントでの COLLATE の使用
10.8.2 COLLATE 句の優先順位
10.8.3 文字セットと照合順序の互換性
10.8.4 式での照合の強制性
10.8.5 バイナリ照合順序と_bin 照合順序
10.8.6 照合順序の効果の例
10.8.7 INFORMATION_SCHEMA 検索での照合の使用
10.9 Unicode のサポート
10.9.1 utf8mb4 文字セット (4 バイトの UTF-8 Unicode エンコーディング)
10.9.2 utf8mb3 文字セット (3 バイトの UTF-8 Unicode エンコーディング)
10.9.3 utf8 文字セット (utf8mb3 のエイリアス)
10.9.4 ucs2 文字セット (UCS-2 Unicode エンコーディング)
10.9.5 utf16 文字セット (UTF-16 Unicode エンコーディング)
10.9.6 utf16le 文字セット (UTF-16LE Unicode エンコーディング)
10.9.7 utf32 文字セット (UTF-32 Unicode エンコーディング)
10.9.8 3 バイト Unicode 文字セットと 4 バイト Unicode 文字セット間の変換
10.10 サポートされる文字セットおよび照合順序
10.10.1 Unicode 文字セット
10.10.2 西ヨーロッパの文字セット
10.10.3 中央ヨーロッパの文字セット
10.10.4 南ヨーロッパおよび中東の文字セット
10.10.5 バルト語の文字セット
10.10.6 キリル文字の文字セット
10.10.7 アジアの文字セット
10.10.8 バイナリ文字セット
10.11 文字セットの制約
10.12 エラーメッセージ言語の設定
10.13 文字セットの追加
10.13.1 文字定義配列
10.13.2 複雑な文字セットの文字列照合のサポート
10.13.3 複雑な文字セットのマルチバイト文字のサポート
10.14 文字セットへの照合順序の追加
10.14.1 照合順序の実装タイプ
10.14.2 照合順序 ID の選択
10.14.3 8 ビットの文字セットへの単純な照合順序の追加
10.14.4 Unicode 文字セットへの UCA 照合順序の追加
10.15 文字セットの構成
10.16 MySQL Server のロケールサポート

MySQL では、さまざまな文字セットを使用してデータを格納し、さまざまな照合順序に従って比較を実行できます。 デフォルトの MySQL サーバー文字セットおよび照合順序は utf8mb4 および utf8mb4_0900_ai_ci ですが、サーバー、データベース、テーブル、カラムおよび文字列リテラルレベルで文字セットを指定できます。

この章では次のトピックについて説明します。

  • 文字セットと照合順序とは。

  • 文字セットの割り当てに対する複数レベルのデフォルトシステム。

  • 文字セットと照合順序を指定するための構文。

  • 影響を受ける関数と演算。

  • Unicode のサポート。

  • 使用可能な文字セットと照合順序 (ノート付き)。

  • エラーメッセージの言語の選択。

  • 曜日と月の名前に使用するロケールの選択。

文字セットの問題は、データストレージだけではなく、クライアントプログラムと MySQL Server との通信にも影響を与えます。 デフォルトと異なる文字セットを使用してクライアントプログラムとサーバー間の通信を行う場合、どの文字セットを使用するのかを示す必要があります。 たとえば、utf8 Unicode 文字セットを使用するには、サーバー接続後に次のステートメントを発行してください。

SET NAMES 'utf8';

アプリケーションで使用する文字セットの構成と、クライアント/サーバー間の通信に関する文字セット関連の問題の詳細は、セクション10.5「アプリケーションの文字セットおよび照合順序の構成」およびセクション10.4「接続文字セットおよび照合順序」を参照してください。


関連キーワード:  文字, セット, 照合, 順序, サポート, utf, サーバー, バイト, 追加, 構成