Open Letter to the Proposal for a Korean Script Root Zone LGR

“한국 문자 루트 존 라벨 생성 규칙의 제안”에 대한 공개 서한

Authors: Jaemin Chung, Seonghoon Kang, Shinjo Park

글쓴이: 정재민, 강성훈, 박신조

This is an open letter to the Proposal for a Korean Script Root Zone LGR, published as https://www.icann.org/en/system/files/files/proposal-korean-lgr-25jan18-en.pdf, made in public on 2018-01-25.

이 문서는 https://www.icann.org/en/system/files/files/proposal-korean-lgr-25jan18-en.pdf로 2018년 1월 25일 공개된 “한국 문자 루트 존 라벨 생성 규칙의 제안”에 대한 공개 서한입니다.

We are deeply concerned about the recent proposal for allowing both Hangul and Hanja in the Korean script (as opposed to Hangul only) in internationalized domain names (henceforth the Proposal). We believe the support will give negligible benefits to the Korean community while increasing the potential to confuse. It will also make similar-looking names open for exploit, and introduce new accessibility issues. We believe that the Proposal should be withdrawn.

우리는 국제화 도메인 이름에서 (한글 전용이 아닌) 한글·한자 혼용을 가능하게 하려는 최근의 제안(이하 “제안”)에 대해 깊이 우려하고 있습니다. 우리는 이 제안이 한국어 사용자에게 거의 이득을 주지 않으면서 혼동의 가능성을 높일 것이라 믿습니다. 또한 이 제안은 비슷하게 생긴 이름들을 허용함으로써 공격의 가능성을 열어놓고, 새로운 접근성 문제를 야기할 것입니다. 우리는 이 제안을 철회해야 한다고 생각합니다.

Exaggerated Hanja Usage in Korea

한국에서의 한자 사용이 과장되어 있음

The Proposal claims that Hanja usage is significant in Korea to warrant its support in IDNs. This is greatly misleading and we consider the evidence listed in the appendices of the Proposal to be intentionally chosen to exaggerate its usage. In this section, we will review them and show why they are not representative of what IDNs will encode.

제안은 한국에서 한자가 충분히 널리 쓰여 국제화 도메인에서 지원이 필요하다고 주장합니다. 이는 사실을 매우 호도하는 것이며, 우리는 제안의 부록에 나열된 증거들이 한자 사용을 과장하려고 의도적으로 선택되었다 봅니다. 이 장에서 우리는 이들 증거를 살펴 보고 왜 이들이 국제화 도메인에 들어갈 이름들을 대표할 수 없는지를 보일 것입니다.

Coexistence, Not Substitute

대체가 아닌 공존

Today, Korean is written in Hangul. Hanja are sometimes provided in parentheses next to Korean words, but only when the word in Hangul alone may be misunderstood due to its multiple meanings or when further clarification of a specific meaning is necessary. In rare cases, words are written in Hanja and the particles and suffixes associated with the words are left in Hangul.

오늘날 한국어는 한글로 적힙니다. 한자는 종종 한국어 낱말 옆에 괄호를 쳐서 쓰이는데, 이는 한글로만 낱말을 쓰면 여러 뜻이 있어서 오해의 소지가 있을 때나 특정한 뜻을 분명하게 하는 용도로 한정됩니다. 더 드물게는 낱말은 한자로 적히고 그 뒤에 붙는 토씨와 접미사는 한글로 적히기도 합니다.

(Emphases ours)

(강조는 원문에 없음)

It is true that Hanja still enjoys the continuous usage as a supplementary script in the modern Korean language. But its usage has been greatly reduced to clarify homophones in Hangul and independent usages are much rarer, even mentioned in the Proposal itself. Unless IDNs allow annotation strings inside a label, the mere coexistence as a supplementary script is not a good fit for IDNs.

한자가 현대 한국어에서 보조 문자로서 지속적으로 쓰이고 있다는 점은 사실입니다. 그러나 그 쓰임은 한글로 표기할 때 동음이의어인 경우로 한정되며, 제안에서도 언급했듯 독립적으로 쓰이는 경우는 훨씬 드뭅니다. 국제화 도메인이 라벨 안에 주석 문자열을 담을 수 있는 게 아닌 이상, 한자가 단순히 보조 문자로 공존하고 있다는 점이 그걸 국제화 도메인에 넣어야 한다는 뜻이 되진 않습니다.

Registered Trademarks That Do Not Warrant Current Use

현재 쓰임을 반영하지 않는 등록 상표들

The Proposal shows multiple mixed-script trademarks seemingly registered in recent decades. This is misleading, as their origins could be traced back to several decades ago when the proprietor of trademarks actively used Hanja-based ones. While they are no longer actively used, the trademark renewal can be explained as a defensive measure against expiration or misuse for older trademarks that are irrelevant to current usage.

제안에서는 지난 십수년간 등록된 것처럼 보이는 한글·한자 혼용 등록 상표들을 여럿 보여 주고 있습니다. 이는 실제와 다르며, 이 상표들의 원전은 상표권자가 한자로 된 상표를 써 왔던 수십년 전까지 거슬러 올라갑니다. 더 이상 쓰이지 않음에도 불구하고 상표를 갱신하는 것은 상표 소멸을 막거나 옛 상표의 오용을 막기 위한 것으로 해석될 수 있으며 현재 사용과는 무관합니다.

For example,

예를 들어,

In most recognizable cases like Samsung and Hyundai, it is not hard to see that these companies no longer use Hanja trademarks in Korean publicly. One can argue that Hanja trademarks are used in Chinese and Japanese markets; we will later iterate that supporting Korean Hanja only is not sufficient for Chinese and Japanese speakers.

가장 눈에 띄는 삼성과 현대 같은 사례의 경우, 이들 회사가 한국에서 공개적으로 한자 상표를 쓰지 않는다는 점은 어렵지 않게 확인할 수 있습니다. 한자 상표가 중국과 일본 시장에서는 여전히 쓰인다고 주장할 수 있는데, 뒤에서 한국 한자만 지원하는 걸로는 중국어와 일본어 사용자에게 충분하지 않다는 점을 설명할 것입니다.

Decorative Nature of Hanja

꾸밈으로서의 한자

It is not as prominent in signboards (due to the selective nature of examples), but many mixed-script trademarks are common in that the only portion written in Hanja is 주식회사 (株式會社, lit. corporation). This is not a coincidence. Being a script taught in school but rarely written, Hanja has acquired a supplementary role to decorate some words. We have chosen the word “decoration” for this purpose because its usage is limited to common words, like 남 (男, lit. male), 대 (大, lit. big; often short for university [대학교]), 가 (家, lit. home). If they were meant to be emphases, any word of importance would be written in Hanja.

간판에서는 (예를 선별해 냈기 때문에) 잘 드러나지 않는 점이지만, 많은 한글·한자 혼용 상표는 한자로 쓰인 부분이 주식회사(株式會社)뿐이라는 공통점이 있습니다. 이는 우연이 아닙니다. 한자는 학교에서 배우기는 하지만 실제로 쓰는 일은 거의 없기 때문에, 한자에 몇몇 낱말을 꾸미는 보조적인 역할이 생겼습니다. 우리가 이를 “꾸민다”라고 표현한 것은 이러한 현상이 이를테면 남(男), 대(大; 종종 “대학교”의 준말일 때도 있음), 가(家) 같은 흔한 낱말에만 나타나기 때문입니다. 이들이 강조의 목적으로 쓰였다면, 중요한 아무 낱말이나 한자로 쓰였을 것입니다.

We believe that such decorations are not to be written but to be only read, and an IDN label is not a place to reproduce decorations.

우리는 이러한 꾸밈이 적히는 용도가 아니라 읽히는 용도로 제한되어 있다고 생각하며, 국제화 도메인 라벨이 꾸밈을 재현해야 하는 장소는 아니라고 봅니다.

Other Bad Examples

다른 나쁜 예들

Remaining examples comprise corporate registers and law books, both highly atypical as examples of a mixed-script IDN. The authors of the Proposal seem to have failed to find more convincing evidence of Hanja. We sympathize with the authors as it will be quite difficult.

남아 있는 예로는 회사 등기나 법학 서적이 있는데, 모두 한글·한자 혼용 국제화 도메인의 예로서는 매우 일반적이지 않습니다. 제안의 글쓴이들은 더 그럴듯한 한자의 증거를 찾아내지 못한 모양입니다. 꽤 찾기 어려울 거라는 점에서 글쓴이들에게 동정심이 갑니다.

In reality, Hanja usage is so low that neither Android nor iOS provides Hanja input methods in Korean by default. Please note that this is not just an oversight; smartphone penetration in Korea has reached 90% of the total population and remains extremely high across all ages, as observed in Gallup Korea’s 2017 survey1 for example. If Hanja cannot be readily typed what’s the point in allowing Hanja IDN labels?

현실에서는 안드로이드도 iOS도 한국어에서 한자 입력기를 기본으로 제공하지 않을 정도로 한자 사용은 매우 낮습니다. 이것이 단순한 실수가 아니라는 점을 주목하십시오. 갤럽 코리아의 2017년 설문 조사1 등에서 볼 수 있듯 한국에서 스마트폰 사용률은 전 인구의 90%를 넘었으며 전 연령층에서 높은 수치를 보이고 있습니다. 만약 한자를 쉬이 입력할 수 없다면 한자 국제화 도메인 라벨을 허용하는 게 무슨 소용일까요?

1 http://www.gallup.co.kr/gallupdb/reportContent.asp?seqNo=813 2017-02-15, Retrieved 2018-02-12.

1 http://www.gallup.co.kr/gallupdb/reportContent.asp?seqNo=813 2017-02-15, 2018-02-12에 확인함.

Hanja Will Be Used in Parallel with Hangul in Primary School Textbooks?

한자가 초등학교 교과서에서 한글과 병기될 거라고?

Appendix H.6.2 cites an article from The Hankyoreh2 mentioning that Hanja will be included in primary school textbooks, starting from 2019. However, later article from the same newspaper3 dated 9th January 2018 states that the inclusion of Hanja in primary school textbooks will not be implemented. Given that the Proposal was published on 25th January 2018, two weeks after the announcement, the validity of the entire section of the appendix needs to be questioned.

부록 H.6.2에서는 한자가 2019년부터 초등학교 교과서에 들어갈 거라는 한겨레 기사2를 인용하고 있습니다. 그러나 같은 신문사에서 2018년 1월 9일에 펴낸 후속 기사3에 따르면 초등학교 교과서에 한자가 들어가지 않을 것이라 합니다. 제안이 이 발표로부터 2주 후인 2018년 1월 25일에 공개되었다는 걸 생각하면, 부록에서 해당 장 전체의 타당성을 재고해야 할 것입니다.

2 http://www.hani.co.kr/arti/society/schooling/776746.html 2016-12-30, Retrieved 2018-02-12.

2 http://www.hani.co.kr/arti/society/schooling/776746.html 2016-12-30, 2018-02-12에 확인함.

3 http://www.hani.co.kr/arti/society/schooling/827055.html 2018-01-10, Retrieved 2018-02-12.

3 http://www.hani.co.kr/arti/society/schooling/827055.html 2018-01-10, 2018-02-12에 확인함.

Potential Ambiguities

모호함의 가능성

One may still recognize even the slightest use of Hanja and argue for its support in IDNs. We believe that, however, in addition to low usage, mixed-script IDNs will be actively harmful to the overall Korean community, due to confusion not only within Hanja, but also between Hangul and Hanja.

이에도 불구하고 한자를 어쨌든 조금이라도 쓴다는 이유로 국제화 도메인에 한자를 넣어야 한다는 주장을 할 수도 있습니다. 그러나 우리는 낮은 사용과 더불어, 한글·한자 혼용 국제화 도메인은 한자들끼리의 혼동뿐만 아니라 한글 및 한자 사이의 혼동 때문에 한국어 사용자 전체에게 적극적으로 해를 끼칠 것이라고 생각합니다.

Hangul-Hanja Confusion

한글과 한자 사이에서의 혼동

The Proposal lists five variant groups of similar-looking Hangul and Hanja, only two of them in the repertoire. This is a massive underestimation and we believe that there can be tens or even hundreds of them; it is so well known that it got a name Yaminjeongeum (야민정음) on Korean Internet, a pun using the name of the supposed origin and the original name of Hangul, Hunminjeongeum. Namuwiki, a community-driven encyclopedic wiki, has a great list4 of them.

제안은 비슷하게 생긴 한글과 한자의 이체자 그룹 5개를 나열하고 있으며 그중 두 개만이 허용되는 문자에 해당합니다. 이는 엄청난 과소평가이며 우리는 이러한 그룹이 수십 개에서 수백 개가 존재할 수 있다고 생각합니다. 이런 현상이 얼마나 잘 알려져 있는지, 한국 인터넷에서는 이 현상이 유명해진 장소의 이름과 한글의 원 이름인 훈민정음을 따서 야민정음이라고 부르고 있을 정도입니다. 집단 편집 가능한 백과사전적 위키인 나무위키에서 거대한 목록4을 볼 수 있습니다.

4 https://namu.wiki/w/%EC%95%BC%EB%AF%BC%EC%A0%95%EC%9D%8C?rev=1559#s-2.7 야민정음 (r1559 판) – 나무위키 (Yaminjeongeum (revision 1559) – Namuwiki). 2018-02-12, Retrieved 2018-02-12.

4 https://namu.wiki/w/%EC%95%BC%EB%AF%BC%EC%A0%95%EC%9D%8C?rev=1559#s-2.7 야민정음 (r1559 판) – 나무위키. 2018-02-12, 2018-02-12에 확인함.

Below is the non-exhaustive list of Hanja characters included in MSR-2 which have the similar visual appearance with Hangul characters (either jamo or syllable), which are not included in the Proposal’s section 6.2:

아래는 MSR-2에 포함된 한자 중 한글 자모나 음절과 시각적으로 비슷하게 생겼음에도 불구하고 제안 6.2장에 포함되지 않은 문자들의 불완전한 목록입니다:

Even with a simple search on the Internet, we can easily find look-alike characters which are not listed in the Proposal. Given the fact that this list is non-exhaustive containing less than 1% of characters included in MSR-2, we are afraid that there are much more pairs unknown to us.

인터넷에서 잠깐 찾아보아도 제안에 나열되어 있지 않은 비슷하게 생긴 문자들을 쉽게 찾을 수 있습니다. 이 목록이 MSR-2에 포함된 문자들의 1% 이하를 포함하는 불완전한 목록임을 감안하면, 우리가 아직 알지 못하는 수많은 다른 문자 쌍이 있을까 걱정됩니다.

Same-Script Confusion

같은 문자 체계 안에서의 혼동

Chinese characters are generally noted for their visual complexity, which suggests higher potential of same-script confusion.

한자는 일반적으로 그 시각적 복잡도로 유명하며, 이 때문에 같은 문자 체계 안에서의 혼동이 발생할 가능성이 더 높습니다.

The complexity of Hanja can also contribute to phishing attacks. Let’s take an example of 검찰청 (檢察廳, Prosecutors’ Office). The Hangul spelling 검찰청 is used daily, while some news headlines use the initial character’s Hanja equivalent 檢 as a symbol. However, all three characters in its Hanja spelling have quite large numbers of strokes, making them hard to distinguish especially in low-resolution and/or small display. If Prosecutors’ Office wants to register its Hanja-only IDN, it would be 檢察廳.한국. Assume that an attacker manages to register 檢祭廳.한국, which shares the first and third characters while only the second one is different (察 (U+5BDF) vs. 祭 (U+796D)). Unlike Chinese and Japanese speakers who use Hanzi or Kanji every day, a substantially high number of Korean speakers will believe 檢祭廳.한국 is also the correct IDN since the full Hanja spelling is not used on a daily basis.

한자의 복잡도는 피싱 공격에도 도움을 줍니다. 검찰청(檢察廳)의 예를 들어 봅시다. 한글 “검찰청”은 일상적으로 쓰이며, 몇몇 뉴스 제목에서는 첫 글자의 한자 檢을 기호로서 씁니다. 하지만 대응되는 세 한자 모두 획수가 아주 많아서 특히 저해상도나 작은 화면에서는 구분하기 어렵습니다. 검찰청이 한자 전용 국제화 도메인을 등록한다 하면 檢察廳.한국일 것입니다. 공격자가 檢祭廳.한국이라는, 첫 글자와 세 번째 글자가 같고 두 번째 글자가 察(U+5BDF)과 祭(U+796D)로 다른 도메인을 등록하는 데 성공했다고 가정합시다. 한자를 매일 사용하는 중국어나 일본어 사용자와는 달리, 한자 표기는 일상적으로 쓰이지 않기 때문에 상당히 많은 한국어 사용자가 檢祭廳.한국 또한 올바른 국제화 도메인이라고 믿을 것입니다.

Another example is 청구서 (請求書, invoice). The Hanja spelling 請求書 is not used daily, and unlike the example of 검찰청, none of the Hanja characters are used as a symbol. Suppose that legitimate companies could use their name with 請求書 suffixed as a Hanja IDN for their electronic invoice system. If an attacker wants to phish as an electronic invoice system, they can buy the Hanja IDN 請求晝. This IDN shares the first and second characters with the legitimate one, while only the third one is different (書 (U+66F8) vs. 晝 (U+665D)). Unlike the Prosecutors’ Office example, even a partial Hanja spelling is not used daily, therefore making users more vulnerable to same-script confusion.

다른 예로 청구서(請求書)가 있습니다. 한자 표기 請求書는 평소에 쓰이지 않으며, 검찰청의 예와는 다르게 어느 문자도 기호로 쓰이지 않습니다. 적법한 업체가 업체명 뒤에 請求書를 붙여 만든 한자 국제화 도메인을 전자 청구서 시스템용으로 쓰고 있다고 합시다. 이제 공격자가 이 전자 청구서 시스템을 피싱하려 請求晝라는 한자 국제화 도메인을 살 수 있습니다. 이 국제화 도메인은 진짜 도메인과 첫 글자와 두 번째 글자가 같고, 세 번째 글자가 書(U+66F8)와 晝(U+665D)로 다릅니다. 이 경우 검찰청과는 다르게 한자 표기가 아예 일부마저도 일상에서 쓰이지도 않기 때문에, 사용자들이 같은 문자 체계 안에서의 혼동에 더 많이 노출되게 됩니다.

In fact, Korea already paid a lot of social resources to counter domain-name-based phishing even without IDNs. Prosecutors’ Office5 and invoices6, listed as examples here, can easily become real victims of domain-name-based phishing. An extra countermeasure will have to be added to defend against Hanja-based phishing.

실제로 한국에서는 국제화 도메인이 아니더라도 도메인 이름에 기반한 피싱을 막기 위해 많은 사회 자원을 투자하고 있습니다. 여기에서 예로 쓰인 검찰청5과 청구서6는 쉽게 도메인 이름에 기반한 피싱의 진짜 피해자가 될 수 있습니다. 한자 기반 피싱을 막으려면 추가적인 대응책이 더 필요할 것입니다.

5 http://www.ilyoseoul.co.kr/news/articleView.html?idxno=211304 – The article mentions that the phisher gave a fake website of Prosecutors’ Office. 2017-11-14, Retrieved 2018-02-07.

5 http://www.ilyoseoul.co.kr/news/articleView.html?idxno=211304 – 이 기사는 가짜 검찰청 사이트를 사용한 피싱을 언급하고 있습니다. 2017-11-14, 2018-02-07에 확인함.

6 http://blog.alyac.co.kr/1353 – Figure 2 in the article shows an example of a phishing email with Apple’s invoice, which redirects to a fake website containing “Apple” in their domain name. 2017-09-28, Retrieved 2018-02-07.

6 http://blog.alyac.co.kr/1353 – 도메인 이름에 "애플"이 들어간 가짜 웹사이트로 이동하는 애플 청구서 피싱 메일이 그림 2에 있습니다. 2017-09-28, 2018-02-07에 확인함.

Although chances of same-script confusion also exist in Chinese and Japanese IDNs, due to the low daily usage of Hanja in Korean, it will create much more confusion when Hanja is introduced into Korean IDNs.

중국어 및 일본어 국제화 도메인에서도 같은 문자 체계 안에서의 혼동 가능성이 존재하지만, 한국어에서 한자가 일상적으로 잘 쓰이지 않기 때문에, 한자가 한국어 국제화 도메인에 들어가면 훨씬 더 많은 혼동을 유발할 것입니다.

Multiple Representations of Mixed-Script IDNs

한글·한자 혼용 국제화 도메인의 여러 가능한 표현

When a name consists of multiple Korean words, there can be multiple combinations of Hangul and Hanja for that name. Let’s take an example of 대전도시공사 (Daejeon City Corporation, doing city infrastructure management like German Stadtwerk plus real estate development). This name is comprised of three individual words: 대전 (大田, city of Daejeon), 도시 (都市, city), and 공사 (公社, state-owned enterprise). In Hangul-Hanja mixed-script IDNs, these three words can be written in either Hangul or Hanja. All of these domain names are possible: 大田都市公社.한국, 大田도시공사.한국, 대전都市公社.한국, and so on. Unless all possible domain names are taken by the legitimate owner, someone else can register any possible domain names that are not taken and pretend that they are the real corporation. To avoid such a problem, owners of multi-word domain names need to register all possible combinations of Hangul-Hanja mixed-script IDNs, or only register the one that is likely to be most commonly used and hope for the best. The difficulty of choosing one from all possible combinations can be a detriment to safety and discourage the usage of Korean IDNs altogether.

이름이 여러 한국어 낱말로 이루어져 있을 경우 그 이름에서 한글과 한자의 조합은 여러 가지가 가능합니다. 대전도시공사(독일의 슈타트베르크와 비슷한 도시 기반 관리에 더불어 부동산 개발을 진행하는 시영 기업)의 예를 들어 봅시다. 이 이름은 대전(大田), 도시(都市), 공사(公社)의 세 독립된 낱말로 이루어져 있습니다. 한글·한자 혼용 국제화 도메인에서 이 세 낱말은 각각 한글이나 한자로 쓸 수 있습니다. 따라서 大田都市公社.한국, 大田도시공사.한국, 대전都市公社.한국 등의 도메인 이름이 모두 가능합니다. 적법한 주체가 가능한 모든 도메인을 등록하지 않으면 다른 사람이 가능하지만 등록되지 않은 도메인 이름을 등록하고 원래 공사를 사칭할 수 있습니다. 이런 문제를 막으려면, 여러 낱말로 이루어진 도메인 이름을 가진 곳에서는 모든 가능한 한글·한자 혼용 국제화 도메인을 등록하거나, 아니면 흔히 쓰일 법한 것만 등록한 뒤 문제가 발생하지 않길 비는 수밖에 없습니다. 가능한 모든 조합 중 적절한 이름을 고르기 어렵다는 점은 안전을 위협할 수 있으며 한국어 국제화 도메인 전체의 사용을 꺼리게 만들 것입니다.

Other Problems

다른 문제들

We have found other problems in the Proposal, which further weaken the validity of the entire proposal.

우리는 제안에서 다른 문제들을 발견했으며, 이들은 전체 제안의 타당성을 더욱 약화시킵니다.

Incompleteness of Repertoire

허용되는 문자 집합의 불완전함

The K portion of IICore comprises 4744 (not 4743) characters, which consists of KS X 1001 (without 14 characters) and additional 138 characters. According to Dr. Ken Lunde7, an expert on CJKV information processing, the details of how these 138 particular characters were selected are unknown. He also says that there is no document or report explaining how the K portion of IICore was prepared, and the people who compiled the K portion of IICore either passed away or are no longer participating in the Korean National Body. It is questionable why the Proposal should include IICore characters.

IICore의 한국 측 문자는 (4743개가 아닌) 4744개의 문자로, 여기에는 KS X 1001의 한자 중 14개가 빠져 있고 다른 한자가 138개 추가되어 있습니다. 한중일월 정보 처리의 전문가인 Ken Lunde에 따르면7 이들 138개의 문자가 어떻게 선택되었는지가 알려져 있지 않습니다. 그는 또한 IICore에서 한국 측 문자가 어떻게 준비되었는지 남아 있는 문서나 보고서가 없으며, 해당 문자 목록을 만든 사람들이 세상을 떠났거나 한국 대표에 더 이상 참여하지 않는다고 말합니다. 제안이 IICore 문자를 왜 포함해야 하는지 의문을 가질 수밖에 없습니다.

7 https://blogs.adobe.com/CCJKType/2018/02/exploring-iicore-part-1.html 2018-02-05, Retrieved 2018-02-07.

7 https://blogs.adobe.com/CCJKType/2018/02/exploring-iicore-part-1.html 2018-02-05, 2018-02-07에 확인함.

Accessibility Issues

접근성 문제

We believe that IDNs in general need to be platform-neutral. To this end, Korean IDNs are not meant to be used only on Microsoft Windows computers with the KS X 5003 Korean keyboard. Appendix H.5 in the Proposal shows how to enter Hanja with the Korean IME on Microsoft Windows. According to StatCounter8, there are about 15% of users who are not using Microsoft Windows as their PC operating system. Even though widely used input method applications in macOS and Linux support Hanja input, the Proposal fails to show PC operating systems other than Microsoft Windows. We believe that the Proposal should have included Hanja input methods for all these three major PC operating systems for the sake of completeness.

우리는 국제화 도메인이 플랫폼에 일반적으로 독립적일 필요가 있다고 믿습니다. 이에 비추어 볼 때 한국어 국제화 도메인은 마이크로소프트 윈도우에서 KS X 5003 한국어 자판으로만 쓰일 것을 고려하고 만들어진 것이 아닙니다. 제안의 부록 H.5장에서는 마이크로소프트 윈도우에서 한국어 입력기로 한자를 어떻게 입력하는지 보이고 있습니다. StatCounter에 따르면8 PC 운영 체제로 마이크로소프트 윈도우를 쓰지 않는 사람이 15% 정도 있습니다. 널리 쓰이는 macOS 및 리눅스 입력기에서도 한자 입력을 지원하지만, 제안에는 마이크로소프트 윈도우가 아닌 다른 PC 운영 체제를 보이지 못하고 있습니다. 우리는 제안의 완전성을 위해 모든 세 주요 PC 운영 체제의 한자 입력법이 포함되었어야 한다고 생각합니다.

8 http://gs.statcounter.com/os-market-share/desktop 2018-01, Retrieved 2018-02-07.

8 http://gs.statcounter.com/os-market-share/desktop 2018-01, 2018-02-07에 확인함.

Although the Korean Standard KS X 5003 includes dedicated keys for Hanja conversion and Hangul/Alphabet toggle, not all keyboards sold in Korea are equipped with those keys, especially for laptops where they are shared with the right Ctrl and Alt keys respectively. Similarly, Apple keyboards sold in Korea do not have them at all9.

한국 표준 KS X 5003이 한자 변환과 한글·영문자 전환을 위해 별도의 글쇠를 가지고 있긴 하지만, 한국에서 팔리는 모든 자판에 이들 글쇠가 포함된 것은 아니며, 특히 노트북에서는 이들 글쇠가 각각 오른쪽 컨트롤과 알트 글쇠와 겹치는 경우가 흔합니다. 비슷하게 한국에서 팔리는 애플 자판에는 이들 글쇠가 아예 들어 있지 않습니다9.

9 https://support.apple.com/en-us/HT201794 2017-06-06, Retrieved 2018-02-07.

9 https://support.apple.com/en-us/HT201794 2017-06-06, 2018-02-07에 확인함.

Moreover, web browsers are not only installed on PCs today. But the Proposal also fails to address Hanja input on non-PC environments. There are other media devices with web browsers such as smartphones, set-top boxes, smart TVs and game consoles. They are more resource-constrained than a PC, and Hanja input requires a big dictionary like Chinese and Japanese input methods. Designers usually leave only Hangul input functionality in Korean locale to avoid the overhead introduced by Hanja data. While Hanja input requires candidate selection – which could be time-consuming without efficient candidate navigation interface – Hangul input methods can directly translate QWERTY or ten-key keyboard keystrokes to final precomposed characters, making Hangul input more efficient than Hanja input in an environment without the traditional PC keyboard. For those reasons, it is impractical to implement Hanja input in addition to Hangul input on every such device. Given increased penetration of Internet-enabled devices without Hanja input, chances of utilizing Hanja IDNs on such devices will be very low. Presenting Hanja input only on Microsoft Windows PC is not a proof that Hanja input is universally available for all Korean speakers.

게다가 오늘날 웹 브라우저는 PC에만 설치되어 있는 게 아님에도 제안은 PC가 아닌 환경에서의 한자 입력을 감안하지 못했습니다. 스마트폰, 셋톱 박스, 스마트 텔레비전 및 게임 콘솔같이 웹 브라우저가 포함된 다른 장비들이 있습니다. 이들은 PC보다 자원이 더 제한되어 있으며, 한자 입력은 중국어나 일본어 입력과 같이 큰 사전을 필요로 합니다. 보통 설계자들은 한국어 로캘에서는 한자 데이터의 오버헤드를 피하기 위해 한글 입력 기능만을 남기곤 합니다. 한자 입력은 효율적인 후보 조회 인터페이스 없이는 시간이 많이 드는 후보 선택을 요구하지만, 한글 입력기는 쿼티 자판이나 10키 자판의 글쇠 입력을 바로 최종적으로 합쳐진 글자로 변환할 수 있으므로 전통적인 PC 글자판이 없는 환경에서는 한자 입력보다 훨씬 효율적입니다. 이러한 이유로 모든 장비에 한글 입력에 더해 한자 입력을 갖추는 건 현실적이지 못합니다. 인터넷은 사용할 수 있지만 한자를 입력할 수 없는 장비가 늘어나는 것을 감안할 때 이러한 장비들에서 한자 국제화 도메인을 활용할 가능성은 매우 낮습니다. 마이크로소프트 윈도우 PC에서의 한자 입력만을 보여 주는 건 모든 한국어 사용자가 보편적으로 한자 입력을 할 수 있다는 증명이 되지 못합니다.

Domain names are also used in spoken language. Alphabet-only and Hangul-only domain names have no or minor difficulties in spoken language. In contrast to both types of domains, dictating Hanja in a spoken conversation is hard. People may use different approaches to describe Hanja, such as

도메인 이름은 입말에서도 쓰입니다. 입말에서 알파벳 전용이나 한글 전용 도메인 이름은 기껏해야 사소한 문제밖에 없습니다. 반면 입말 대화에서 한자를 받아 적기는 어렵습니다. 사람들은 한자를 나타내려 다음과 같은 방법을 쓸 수 있습니다:

But all of them are inefficient and inconvenient in a spoken conversation. Besides, even if we ignore the fact that these are inefficient and inconvenient, they cannot always work (note that the examples below are all from KS X 1001).

하지만 입말 대화에서는 이들 모두 비효율적이고 불편합니다. 비효율적이고 불편하다는 점을 제치고라도 이들 방법은 항상 동작하는 게 아닙니다(참고로 아래 한자는 모두 KS X 1001에서 가져왔습니다):

Also, when a listener has no background knowledge on Hanja, or the domain name consists of an uncommon or ambiguous Hanja character, it will be much more difficult to reconstruct a Hanja IDN from a spoken conversation.

또한 청자가 한자에 대한 배경 지식이 없거나, 도메인 이름이 흔치 않거나 모호한 한자로 이루어져 있을 경우, 입말 대화에서 한자 국제화 도메인을 재구성하는 건 훨씬 어려울 것입니다.

To make things even worse, Hanja IDNs will greatly inconvenience visually impaired users, as they need to be read aloud by a screen reader or presented in braille. Korean screen readers can read aloud Hanja inside plain text or in a Hanja candidate window of an input method application by only its reading or its meaning + reading, depending on the user preference10. If a Hanja IDN is read aloud just by its reading by a screen reader, it is not possible to distinguish whether the given IDN is using Hangul or Hanja without changing user preference. Even when both meaning and reading are read aloud by a screen reader, the ambiguity issue mentioned in the previous section still applies.

게다가 한자 국제화 도메인은 시각 장애가 있어 스크린 리더로 도메인을 읽어야 하거나 점자 표현이 필요한 사용자들을 크게 불편하게 할 것입니다. 한국어 스크린 리더는 평문에 들어 있거나 입력기의 한자 후보 창에 있는 한자를 사용자 설정에 따라 그 음이나 음·훈으로만 읽어 줍니다10. 만약 스크린 리더가 한자 국제화 도메인을 그 음으로만 읽어 준다면 설정 변경 없이는 해당 국제화 도메인이 한글을 쓰는지 한자를 쓰는지 구분할 수 없습니다. 설령 스크린 리더가 음·훈을 함께 읽어 준다 해도 앞서 설명한 모호함이 여전히 남습니다.

10 https://www.freelists.org/post/nvda-korean/NVDA-1 NVDA용 한자 데이터 1차로 완성했습니다. (Finished an initial work on Hanja data for NVDA) – the email mentions that the NVDA data file contains multiple formats of read-aloud Hanja in Korean text. 2012-09-08, Retrieved 2018-02-07.

10 https://www.freelists.org/post/nvda-korean/NVDA-1 NVDA용 한자 데이터 1차로 완성했습니다. – 메일에 따르면 이 NVDA 데이터 파일에는 한국어 텍스트에서 한자를 읽는 여러 방법이 포함되어 있습니다. 2012-09-08, 2018-02-07에 확인함.

While there are two unofficial incompatible Hanja orthographies for Korean braille11 (there is no “official” supervision of denoting Korean Hanja in braille according to the 2017 Korean braille orthography12), the report states that the demand for Hanja braille among visually impaired Koreans is low. As a reflection of this low demand, a Korean braille terminal named 한소네 (Hansone) developed by Selvas Healthcare only supports Hangul and Latin alphabet input without Hanja input capability13. Unlike Chinese and Japanese, Hangul-only IDNs require no processing of Hanja – which is inevitable in mixed-script or Hanja-only IDNs – on screen readers and braille displays. This Hanja processing problem can be avoided by not introducing Hanja into IDNs in the first place.

한국어 점자를 위한 두 종류의 서로 호환되지 않는 비공식 한자 점자가 존재하긴 하지만11(2017 한국 점자 규정12에는 한자를 어떻게 표현할지에 대한 “공식” 지침이 없습니다), 보고서에서는 한국 시각 장애인들 사이에서 한자 점자의 수요가 낮다고 언급하고 있습니다. 이러한 낮은 수요 때문에, 셀바스헬스케어가 개발한 한소네라는 한국어 점자 단말기는 한글과 영문자 입력만 지원하고 한자 입력을 지원하지 않습니다13. 중국어와 일본어와는 달리, 스크린 리더나 점자 디스플레이에서 한글 전용 국제화 도메인은 한자 전용이나 혼용 국제화 도메인에서는 피할 수 없는 한자 처리가 필요하지 않습니다. 이러한 한자 처리 문제는 애초에 국제화 도메인에 한자를 추가하지 않는다면 피할 수 있습니다.

11 http://www.korean.go.kr/common/download.do?file_path=bookData&c_file_name=e5ab7da6-8b09-4f2f-9d6d-595d8e9ea1e6_0.pdf&o_file_name=%ED%8A%B9%EC%88%98%EC%96%B8%EC%96%B4-01-10.pdf&downGubun=bookDataView&book_seq=312 한자점자 규정 제정에 관한 기초연구 (A preliminary research on Korean Hanja braille orthography). 2012-12, Retrieved 2018-02-07.

11 http://www.korean.go.kr/common/download.do?file_path=bookData&c_file_name=e5ab7da6-8b09-4f2f-9d6d-595d8e9ea1e6_0.pdf&o_file_name=%ED%8A%B9%EC%88%98%EC%96%B8%EC%96%B4-01-10.pdf&downGubun=bookDataView&book_seq=312 한자점자 규정 제정에 관한 기초연구. 2012-12, 2018-02-07에 확인함.

12 http://www.korean.go.kr/common/download.do?file_path=etcData&c_file_name=5b0b6d52-0375-4fc8-98f0-912b26c0ee47_1.pdf&o_file_name=2017%20%ED%95%9C%EA%B5%AD%20%EC%A0%90%EC%9E%90%20%EA%B7%9C%EC%A0%95.pdf 2017 Korean braille orthography. Retrieved 2018-02-07.

12 http://www.korean.go.kr/common/download.do?file_path=etcData&c_file_name=5b0b6d52-0375-4fc8-98f0-912b26c0ee47_1.pdf&o_file_name=2017%20%ED%95%9C%EA%B5%AD%20%EC%A0%90%EC%9E%90%20%EA%B7%9C%EC%A0%95.pdf 2017 한국 점자 규정. 2018-02-07에 확인함.

13 http://www.himsintl.co.kr/download/hasone5_manual_170628.docx 한소네 5 사용자 설명서 (Hansone 5 user manual). Retrieved 2018-02-07.

13 http://www.himsintl.co.kr/download/hasone5_manual_170628.docx 한소네 5 사용자 설명서. 2018-02-07에 확인함.

Information Exchange with Chinese and Japanese Speakers?

중국어와 일본어 사용자와의 정보 교환?

One possible argument for allowing Hanja in Korean IDNs is information exchange with Chinese and Japanese speakers. In fact, Hangul-Hanja mixed-script IDNs and IDNs with Korean Hanja will likely cause confusion to Chinese and Japanese speakers rather than helping them due to lexical and regional differences.

한국어 국제화 도메인에 한자를 허용하려는 가능한 이유로는 중국어와 일본어 사용자와의 정보 교환이 있을 수 있습니다. 실제로는 한글·한자 혼용 국제화 도메인이나 한자 전용 국제화 도메인은 낱말 및 지역적 차이 때문에 중국어와 일본어 사용자에게 도움을 주기보다는 혼란을 가져다 줄 것입니다.

Let’s take the city of Seoul as an example. Owing to its etymology, Seoul cannot be written in Korean Hanja. Due to this fact, Seoul has exonyms 汉城 (Simplified Chinese Hanzi) and ソウル (Japanese Katakana). Given the Chinese exonym caused confusion within Korean speakers, the city proposed 首尔 as a transliteration of the Korean pronunciation into Simplified Chinese in 2005. When encoding a domain name of Seoul City Hall, one hypothetical mixed-script IDN could be 서울市廳.한국. This actually causes confusion to Chinese and Japanese speakers: 1) they can neither understand nor enter Hangul ‘서울’, ‘한국’; 2) Chinese and Japanese use different words for “city hall” – 市政府 and 市役所 respectively.

서울시를 예로 들어 봅시다. 어원 때문에 서울은 한국식 한자로 쓸 수 없습니다. 그래서 서울은 汉城(간체자 중국어 한자) 및 ソウル(일본어 가타카나)와 같은 타칭 지명(exonym)이 있습니다. 한국어 사용자들 사이에서 이런 타칭 지명이 혼란을 가져다 줬기 때문에 시에서는 2005년에 한국어 발음의 간체자 중국어 음차로서 首尔을 제안했습니다. 서울시청의 도메인을 인코딩하고자 할 경우 가능한 한글·한자 혼용 국제화 도메인은 서울市廳.한국이 될 수 있는데, 이는 중국어와 일본어 사용자에게 혼란을 가져다 줍니다. 1) 이들은 한글 ‘서울’이나 ‘한국’을 이해할 수도 입력할 수도 없으며, 2) 중국어와 일본어에서 “시청”에 대응되는 낱말은 각각 市政府와 市役所이기 때문입니다.

If you still don’t grasp lexical differences, let’s take a look at this Chinese word: 足球. If 足球 or its Korean reading (족구) is presented to Korean speakers, they would have no idea that this means “soccer,” as 족구 (足球) in Korean is a domestic sport distinct from soccer (“soccer” in Korean is 축구 (蹴球)). You cannot blindly assume that anything written in Chinese characters will be understood with the same meaning regardless of languages. It is not always true.

아직 낱말 수준에서의 차이를 이해할 수 없다면 足球라는 중국어 낱말을 살펴 봅시다. 足球나 그 한국어 발음(족구)을 한국어 사용자에게 보여줘도 이게 “축구”를 뜻한다는 사실을 알 수 없을 것인데, 한국어에서 족구(足球)는 축구와 다른 한국 고유의 스포츠이기 때문입니다(한국어에서 “축구”는 축구(蹴球)입니다). 한자로 적혀 있다고 언어와 무관하게 똑같은 뜻으로 이해될 거라고 무조건 가정할 수 없습니다.

If Korean speakers want to target Chinese and Japanese speakers, they need to register IDNs in Chinese (首尔市政府 and 足球) and Japanese (ソウル市役所 and サッカー), not the ones in Korean written in (Hangul and) Hanja (서울市廳 and 蹴球).

한국어 사용자가 중국어와 일본어 사용자를 대상으로 하려 한다면, (한글과) 한자로 적힌 한국어 국제화 도메인(서울市廳 및 蹴球)이 아니라 중국어(首尔市政府 및 足球)와 일본어(ソウル市役所 및 サッカー) 국제화 도메인을 등록해야 합니다.

Chinese and Japanese speakers input non-Korean variants of Chinese characters. Even though Chinese characters are called CJK “Unified” Ideographs in Unicode and ISO/IEC 10646, there are lots of characters separately encoded due to the Source Separation Rule. The same abstract shape is sometimes unified and sometimes separately encoded. Let’s take a look at these examples: 友情.한국 and 靑年.한국 (these are commonly used words). Chinese and Japanese speakers will have no problems with inputting 友情, but will face a problem when inputting 靑年. Why? This is because ⿰忄靑 and ⿰忄青 are unified (情 U+60C5) but 靑 and 青 are separately encoded (靑 U+9751 vs. 青 U+9752) due to the Source Separation Rule (靑 is used in Korean, and 青 is used in Chinese and Japanese; this also applies to 情). There are lots of examples like these (e.g., 僧 unified, 增/増 separated; 愉 unified, 兪/俞 separated; 慨 unified, 槪/概 separated; 朗 unified, 郞/郎 separated; etc.). Ordinary users are not aware of the Source Separation Rule and don’t know which ones are unified and which ones are separated.

중국어와 일본어 사용자는 한국식이 아닌 한자를 입력합니다. 유니코드와 ISO/IEC 10646에서 한자를 CJK “통합” 한자라고 지칭하고 있긴 하지만, 출처 분리 규칙(Source Separation Rule) 때문에 별도로 할당된 문자들도 많이 있습니다. 똑같은 추상적 모양이 어디서는 통합되어 있고 어디서는 따로 할당되어 있습니다. 友情.한국과 靑年.한국의 예를 살펴 봅시다(이들은 흔히 쓰이는 낱말입니다). 중국어와 일본어 사용자는 友情은 어렵지 않게 입력할 수 있겠지만 靑年은 입력하기 어려울 것입니다. 왜냐고요? ⿰忄靑과 ⿰忄青은 통합되어 있지만(情 U+60C5) 출처 분리 규칙 때문에 靑과 青은 별도로 할당(靑 U+9751 및 青 U+9752)되어 있기 때문입니다(한국어에서는 靑을 쓰고 중국어와 일본어에서는 青을 쓰며, 이는 情에도 동일하게 적용됩니다). 이러한 예는 수도 없이 있습니다(僧 통합, 增/増 분리; 愉 통합, 兪/俞 분리; 慨 통합, 槪/概 분리; 朗 통합, 郞/郎 분리; 등). 보통 사용자는 출처 분리 규칙에 대해 모르며, 어떤 문자가 통합되어 있고 어떤 문자가 따로 할당되어 있는지도 모릅니다.

We believe that Korean Hanja domain alone is not helping information exchange with Chinese and Japanese speakers.

우리는 한국식 한자만으로는 중국어와 일본어 사용자와의 정보 교환에 도움이 되지 않는다고 믿습니다.

Conclusion

결론

We believe that the Proposal has to be withdrawn, given the technical and practical flaws. Although Hanja is used as a supplementary script in the Korean language, its usage does not simply fit into what IDNs need to encode. The Proposal misrepresents the usage of Hanja and why it should be coded into Korean IDNs. It also underestimates possible confusion between Hangul and Hanja and within Hanja, especially for Korean speakers. Mere addition of Hanja in Korean IDNs will introduce new accessibility issues, especially for visually impaired users. We believe that the benefit of using Hanja in Korean IDNs is much lower than the harm caused by it.

우리는 기술적 결함과 현실적 결함을 생각할 때 제안을 철회해야 한다고 생각합니다. 한자가 한국어에서 보조 문자로 쓰이긴 하지만 한자의 사용은 국제화 도메인에 들어가야 하는 문자에는 전혀 맞지 않습니다. 제안은 한자 사용과 왜 한자가 한국어 국제화 도메인에 들어가야 하는지를 잘못 제시하고 있습니다. 또한 제안은 특히 한국어 사용자가 겪을 수 있는 한글·한자와 한자 안에서의 가능한 혼동을 과소평가하고 있습니다. 한국어 국제화 도메인에 한자를 넣는 것만으로는 특히 시각 장애인들에게 새로운 접근성 문제를 일으킬 것입니다. 우리는 한국어 국제화 도메인에 한자를 써서 얻는 이득이 그로 인한 해보다 훨씬 낮다고 믿습니다.