日本語照合順序での漢数字〇 (0x815A) の取り扱いについて

Article
12/11/2014

皆さん、こんにちは。 SQL Server/Microsoft Azure SQL Database サポートチームです。

今回は、日本語照合順序での漢数字〇の特殊な取り扱いについて紹介します。

[漢数字〇特殊な取り扱い]

漢数字〇の文字コードは以下のものになります。

	SJIS	UTF-16
漢数字〇	0x815A	0x3007

SQL Server で日本語照合順序を使用している場合、一部の日本語照合順序 (Japanese、Japanese_90、Japanese_Unicode) では、ソートの重み付けを持つ文字として漢数字〇が登録されていないため、漢数字〇を含む文字列で LIKE 検索した場合に、意図しない検索結果が返る場合があります。

具体的に LIKE 検索を実行し、動作を見てみましょう。

SELECT CASE WHEN '12' LIKE '1〇2' THEN'TRUE'ELSE 'FALSE' END AS 'Check'// クエリ結果 //Check---------------------------------TRUE

上記のクエリでは、文字列 ”12” を、”1〇2” で LIKE 検索を実施し、LIKE 検索で指定した文字で検索ができた場合に “TRUE” を返すクエリになります。

クエリ結果を見ると、検索対象文字 “12” には、漢数字〇は含まれていませんが、LIKE 検索でヒットされます。

なお、漢数字〇を含む文字列で LIKE 検索を実施したい場合には、明示的に バイナリの照合順序 及び SQL Server 2008 以降であれば、Japanese_XJIS_100、Japanese_Bushu_Kakusu_100 を COLLATE 句 で指定することにより、実現することが可能です。

SELECT CASE WHEN '12' LIKE '1〇2' COLLATE Japanese_BINTHEN'TRUE'ELSE 'FALSE' END AS 'Check'// クエリ結果 //Check---------------------------------FALSE

※ 本Blogの内容は、2014年12月現在の内容となっております

日本語照合順序での漢数字 〇 (0x815A) の取り扱いについて

Additional resources

日本語照合順序での漢数字〇 (0x815A) の取り扱いについて