字串的 codePointAt() 方法
探索 JavaScript 字串的 codePointAt() 方法。
這個方法在 ES2015 中被引入,用於處理無法用一個 16 位元 Unicode 單元表示的 Unicode 字元,而需要使用兩個。
使用 charCodeAt()
你需要取得第一個和第二個單元,然後結合它們。使用 codePointAt()
可以在一次呼叫中取得整個字元。
舉個例子,這個中文字「𠮷」由兩個 UTF-16(Unicode)部分組成:
1 | "𠮷".charCodeAt(0).toString(16) //d842 |
如果你結合這兩個 Unicode 字元來建立一個新的字元:
1 | "\ud842\udfb7" //"𠮷" |
你可以使用 codePointAt()
得到相同的結果:
1 | "𠮷".codePointAt(0) //20bb7 |
如果你結合這兩個 Unicode 字元來建立一個新的字元:
1 | "\u{20bb7}" //"𠮷" |
想要了解更多關於 Unicode 及如何處理 Unicode 的相關資訊,可以參考Unicode and UTF-8。
tags: [“JavaScript”, “字串”, “Unicode”, “ES2015”]