/

字串的 codePointAt() 方法

字串的 codePointAt() 方法

探索 JavaScript 字串的 codePointAt() 方法。

這個方法在 ES2015 中被引入,用於處理無法用一個 16 位元 Unicode 單元表示的 Unicode 字元,而需要使用兩個。

使用 charCodeAt() 你需要取得第一個和第二個單元,然後結合它們。使用 codePointAt() 可以在一次呼叫中取得整個字元。

舉個例子,這個中文字「𠮷」由兩個 UTF-16(Unicode)部分組成:

1
2
"𠮷".charCodeAt(0).toString(16) //d842
"𠮷".charCodeAt(1).toString(16) //dfb7

如果你結合這兩個 Unicode 字元來建立一個新的字元:

1
"\ud842\udfb7" //"𠮷"

你可以使用 codePointAt() 得到相同的結果:

1
"𠮷".codePointAt(0) //20bb7

如果你結合這兩個 Unicode 字元來建立一個新的字元:

1
"\u{20bb7}" //"𠮷"

想要了解更多關於 Unicode 及如何處理 Unicode 的相關資訊,可以參考Unicode and UTF-8

tags: [“JavaScript”, “字串”, “Unicode”, “ES2015”]