簡單說,不同國家的漢字寫法不同。故利用這一區,進行不同寫法的交換。
請參考附圖 (圖一) 例如:細明體 U+9F9C 與 U+F907 不同。
(圖二) SimSun 則在 U+9F9C 安排 與 細明體 U+F907 相同的造型。
所以,當使用者選擇不同國家的字型,本字的造型 (如 U+9F9C),會有所不同。(細明體、SimSun 不同)
而其對應的與相容表意區段 (如 U+F907),細明體與SimSun 也會不同 (不過 SimSun 沒有造 U+F907)
同時,華康、文鼎 (圖四) 各有支援 Unicode, GB18030 等不同規格的字型。
如果選用了 Unicode 3.0 則會是符合我們正體漢字的書寫習慣的編碼。
如果選用了 GB18030 則很有可能是造成 po 文者,所面對的困擾。
(輸入法也會參一腳)
讓我們看一下 Unicode U+F907 的定義:有兩種造型。(圖三)
所以字型公司,會根據產品銷售的地點,去選用符合該地法規的造型。
(也就是支援不同的編碼。其時 圖四 的 Charset 除了 Unicode, Big-5 之外,都是國家標準,其每個字的造型都有定義。)
現在,Unicode 又支援了異體字,所以,未來字型會有更多不相容的問題產生!
因此,排版者,要懂字型支援的標準,才會知道作者是否用錯字型 (支援不同的標準)。以至於能夠解決問題。
這種問題,多半是用錯字型,然後再用很奇怪的輸入法,造成文字內碼的不相容,因為用到了「相容表意區段」!好矛盾啊!
Alrin Hsiao
管理員
缺字啦!最快的方式就是換個字碼比較完整的字型,例如思源宋。
通常會發生這種情況的就是打字的時候選字造成的,我的經驗是用倉詰輸入的人比較容易用到這些字,不想重打字最快的方式就是換字型。
思源宋體(英語:Source Han Serif,Google公司則稱Noto Serif CJK,「思源」一詞來自於成語「飲水思源」[3][4])是Adobe與Google所領導開發的開放原始碼字型家族,使用SIL開放原始碼字型授權在 GitHub 上釋出。
字形數量
65535
授權
SIL開源字型授權v1.1
====
But Ko
Unicode相容區大部分不是因為寫法不同,而是歷史上錯誤重複編碼的文字(例如Big5的兀字,還有韓國內碼是一個音一個碼,破音字都被重複編好幾個碼)orz
不過有些字型會故意用不同的寫法造相容區漢字,也是為了容易識別而已。
(也有一些字真的是因為寫法不同而放在相容區的。)
但是如此大量出現相容區漢字真的很奇怪。
理論上輸入法都不應該讓人打出相容漢字,實在不知道為什麼會這樣。我猜是有問題的OCR軟體……
簡正義
所以,買支援 異體字的字型,「才打得出」異體字。
(不知道現在的輸入法,支不支援異體字)
若開始有人用異體字的字型,排版人員,就會多出很多麻煩了!
剪貼自「InDesign上課了」社團
https://www.facebook.com/groups/117638948290623/posts/4273152582739218