- java.lang.Object
-
- java.lang.Character
-
- 实现的所有接口
-
Serializable
,Comparable<Character>
public final class Characterextends Objectimplements Serializable, Comparable<Character>
Character
类在对象中包装基本类型char
的值。 类型为Character
的对象包含单个字段,其类型为char
。此外,该类提供了几种方法来确定字符的类别(小写字母,数字等)以及将字符从大写转换为小写,反之亦然。
字符信息基于Unicode标准10.0.0版。
类
Character
的方法和数据由UnicodeData文件中的信息定义,该文件是Unicode Consortium维护的Unicode字符数据库的一部分。 此文件指定各种属性,包括每个已定义的Unicode代码点或字符范围的名称和常规类别。该文件及其描述可从Unicode Consortium获得:
Unicode Character Representations
char
数据类型(因此Character
对象封装的值)基于原始Unicode规范,该规范将字符定义为固定宽度的16位实体。 此后,Unicode标准已更改为允许表示形式需要16位以上的字符。 合法代码点 s的范围现在是U + 0000到U + 10FFFF,称为Unicode标量值 。 (请参阅Unicode标准中U + n表示法的 definition. )The set of characters from U+0000 to U+FFFF有时被称为基本多语言平面(BMP) 。 代码点大于U + FFFF的Characters称为补充字符 s。 Java平台使用
char
数组和String
和StringBuffer
类中的UTF-16表示。 在此表示中,补充字符表示为一对char
值,第一个来自高代理范围(\ uD800- \ uDBFF),第二个来自低代理范围(\ uDC00- \ uDFFF)。因此,
char
值表示基本多语言平面(BMP)代码点,包括代理代码点或UTF-16编码的代码单元。int
值表示所有Unicode代码点,包括补充代码点。int
的较低(最低有效)21位用于表示Unicode代码点,而较高(最高有效)11位必须为零。 除非另有说明,否则关于补充字符和代理char
值的行为如下:- 仅接受
char
值的方法不支持增补字符。 它们将代理范围中的char
值视为未定义的字符。 例如,Character.isLetter('\uD840')
返回false
,即使此字符串中的任何低代理值后面的特定值也表示字母。 - 接受
int
值的方法支持所有Unicode字符,包括增补字符。 例如,Character.isLetter(0x2F81A)
返回true
因为代码点值表示一个字母(CJK表意文字)。
在Java SE API文档中, Unicode代码点用于U + 0000和U + 10FFFF之间的字符值, Unicode代码单元用于16位
char
值,这些值是UTF-16编码的代码单元。 有关Unicode术语的更多信息,请参阅Unicode Glossary 。- 从以下版本开始:
- 1.0
- 另请参见:
- Serialized Form
-
-
嵌套类汇总
嵌套类 变量和类型 类 描述 static class
Character.Subset
此类的实例表示Unicode字符集的特定子集。static class
Character.UnicodeBlock
一系列字符子集,表示Unicode规范中的字符块。static class
Character.UnicodeScript
一系列字符子集,表示 Unicode Standard Annex #24: Script Names中定义的字符脚本。
-
字段汇总
字段 变量和类型 字段 描述 static int
BYTES
用于表示无符号二进制形式的char
值的字节数。static byte
COMBINING_SPACING_MARK
Unicode规范中的常规类别“Mc”。static byte
CONNECTOR_PUNCTUATION
Unicode规范中的常规类别“Pc”。static byte
CONTROL
Unicode规范中的常规类别“Cc”。static byte
CURRENCY_SYMBOL
Unicode规范中的常规类别“Sc”。static byte
DASH_PUNCTUATION
Unicode规范中的常规类别“Pd”。static byte
DECIMAL_DIGIT_NUMBER
Unicode规范中的常规类别“Nd”。static byte
DIRECTIONALITY_ARABIC_NUMBER
Unicode规范中的弱双向字符类型“AN”。static byte
DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode规范中的弱双向字符类型“BN”。static byte
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode规范中的弱双向字符类型“CS”。static byte
DIRECTIONALITY_EUROPEAN_NUMBER
Unicode规范中的弱双向字符类型“EN”。static byte
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode规范中的弱双向字符类型“ES”。static byte
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode规范中的弱双向字符类型“ET”。static byte
DIRECTIONALITY_FIRST_STRONG_ISOLATE
Unicode规范中的弱双向字符类型“FSI”。static byte
DIRECTIONALITY_LEFT_TO_RIGHT
Unicode规范中的强双向字符类型“L”。static byte
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode规范中的强双向字符类型“LRE”。static byte
DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
Unicode规范中的弱双向字符类型“LRI”。static byte
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode规范中的强双向字符类型“LRO”。static byte
DIRECTIONALITY_NONSPACING_MARK
Unicode规范中的弱双向字符类型“NSM”。static byte
DIRECTIONALITY_OTHER_NEUTRALS
Unicode规范中的中性双向字符类型“ON”。static byte
DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode规范中的中性双向字符类型“B”。static byte
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode规范中的弱双向字符类型“PDF”。static byte
DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
Unicode规范中的弱双向字符类型“PDI”。static byte
DIRECTIONALITY_RIGHT_TO_LEFT
Unicode规范中的强双向字符类型“R”。static byte
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode规范中的强双向字符类型“AL”。static byte
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode规范中的强双向字符类型“RLE”。static byte
DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
Unicode规范中的弱双向字符类型“RLI”。static byte
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode规范中的强双向字符类型“RLO”。static byte
DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode规范中的中性双向字符类型“S”。static byte
DIRECTIONALITY_UNDEFINED
未定义的双向字符类型。static byte
DIRECTIONALITY_WHITESPACE
Unicode规范中的中性双向字符类型“WS”。static byte
ENCLOSING_MARK
Unicode规范中的常规类别“Me”。static byte
END_PUNCTUATION
Unicode规范中的常规类别“Pe”。static byte
FINAL_QUOTE_PUNCTUATION
Unicode规范中的常规类别“Pf”。static byte
FORMAT
Unicode规范中的常规类别“Cf”。static byte
INITIAL_QUOTE_PUNCTUATION
Unicode规范中的常规类别“Pi”。static byte
LETTER_NUMBER
Unicode规范中的常规类别“Nl”。static byte
LINE_SEPARATOR
Unicode规范中的常规类别“Zl”。static byte
LOWERCASE_LETTER
Unicode规范中的常规类别“Ll”。static byte
MATH_SYMBOL
Unicode规范中的常规类别“Sm”。static int
MAX_CODE_POINT
最大值为 Unicode code point ,常数U+10FFFF
。static char
MAX_HIGH_SURROGATE
UTF-16编码中的最大值 Unicode high-surrogate code unit ,常量'\uDBFF'
。static char
MAX_LOW_SURROGATE
UTF-16编码中 Unicode low-surrogate code unit的最大值,常量'\uDFFF'
。static int
MAX_RADIX
可用于转换为字符串和从字符串转换的最大基数。static char
MAX_SURROGATE
UTF-16编码中Unicode代理项代码单元的最大值,常量'\uDFFF'
。static char
MAX_VALUE
此字段的常量值是类型char
'\uFFFF'
。static int
MIN_CODE_POINT
最小值 Unicode code point ,常数U+0000
。static char
MIN_HIGH_SURROGATE
UTF-16编码中的最小值 Unicode high-surrogate code unit ,常量'\uD800'
。static char
MIN_LOW_SURROGATE
UTF-16编码中 Unicode low-surrogate code unit的最小值,常量'\uDC00'
。static int
MIN_RADIX
可用于转换为字符串和从字符串转换的最小基数。static int
MIN_SUPPLEMENTARY_CODE_POINT
最小值 Unicode supplementary code point ,常数U+10000
。static char
MIN_SURROGATE
UTF-16编码中Unicode代理项代码单元的最小值,常量'\uD800'
。static char
MIN_VALUE
此字段的常量值是类型char
'\u0000'
。static byte
MODIFIER_LETTER
Unicode规范中的常规类别“Lm”。static byte
MODIFIER_SYMBOL
Unicode规范中的常规类别“Sk”。static byte
NON_SPACING_MARK
Unicode规范中的常规类别“Mn”。static byte
OTHER_LETTER
Unicode规范中的常规类别“Lo”。static byte
OTHER_NUMBER
Unicode规范中的常规类别“否”。static byte
OTHER_PUNCTUATION
Unicode规范中的常规类别“Po”。static byte
OTHER_SYMBOL
Unicode规范中的常规类别“So”。static byte
PARAGRAPH_SEPARATOR
Unicode规范中的常规类别“Zp”。static byte
PRIVATE_USE
Unicode规范中的常规类别“Co”。static int
SIZE
用于表示无符号二进制形式的char
值的位数,常量16
。static byte
SPACE_SEPARATOR
Unicode规范中的常规类别“Zs”。static byte
START_PUNCTUATION
Unicode规范中的常规类别“Ps”。static byte
SURROGATE
Unicode规范中的常规类别“Cs”。static byte
TITLECASE_LETTER
Unicode规范中的常规类别“Lt”。static 类<Character>
TYPE
类
实例表示基本类型char
。static byte
UNASSIGNED
Unicode规范中的常规类别“Cn”。static byte
UPPERCASE_LETTER
Unicode规范中的常规类别“Lu”。
-
构造方法摘要
构造方法 构造器 描述 Character(char value)
已过时。使用此构造函数很少是合适的。
-
方法摘要
所有方法 静态方法 实例方法 具体的方法 弃用的方法 变量和类型 方法 描述 static int
charCount(int codePoint)
确定表示指定字符(Unicode代码点)所需的char
值的数量。char
charValue()
返回此Character
对象的值。static int
codePointAt(char[] a, int index)
返回char
数组的给定索引处的代码点。static int
codePointAt(char[] a, int index, int limit)
返回char
数组的给定索引处的代码点,其中只能使用index
小于limit
数组元素。static int
codePointAt(CharSequence seq, int index)
返回CharSequence
的给定索引处的代码点。static int
codePointBefore(char[] a, int index)
返回char
数组的给定索引之前的代码点。static int
codePointBefore(char[] a, int index, int start)
返回char
数组的给定索引之前的代码点,其中只能使用index
大于或等于start
数组元素。static int
codePointBefore(CharSequence seq, int index)
返回CharSequence
的给定索引之前的代码点。static int
codePointCount(char[] a, int offset, int count)
返回char
数组参数的子数组中的Unicode代码点数。static int
codePointCount(CharSequence seq, int beginIndex, int endIndex)
返回指定char序列的文本范围内的Unicode代码点数。static int
codePointOf(String name)
返回给定Unicode字符名称指定的Unicode字符的代码点值。static int
compare(char x, char y)
以数字方式比较两个char
值。int
compareTo(Character anotherCharacter)
以数字方式比较两个Character
对象。static int
digit(char ch, int radix)
返回指定基数中的字符ch
的数值。static int
digit(int codePoint, int radix)
返回指定基数中指定字符(Unicode代码点)的数值。boolean
equals(Object obj)
将此对象与指定的对象进行比较。static char
forDigit(int digit, int radix)
确定指定基数中特定数字的字符表示形式。static byte
getDirectionality(char ch)
返回给定字符的Unicode方向性属性。static byte
getDirectionality(int codePoint)
返回给定字符的Unicode方向性属性(Unicode代码点)。static String
getName(int codePoint)
返回指定字符codePoint
的Unicode名称,如果代码点为unassigned
,则返回null。static int
getNumericValue(char ch)
返回指定的Unicode字符表示的int
值。static int
getNumericValue(int codePoint)
返回指定字符(Unicode代码点)表示的int
值。static int
getType(char ch)
返回表示字符常规类别的值。static int
getType(int codePoint)
返回表示字符常规类别的值。int
hashCode()
返回此Character
的哈希码; 等于调用charValue()
的结果。static int
hashCode(char value)
返回char
值的哈希码; 与Character.hashCode()
兼容。static char
highSurrogate(int codePoint)
返回主导替代(一个 high surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。static boolean
isAlphabetic(int codePoint)
确定指定的字符(Unicode代码点)是否为字母。static boolean
isBmpCodePoint(int codePoint)
确定指定的字符(Unicode代码点)是否在 Basic Multilingual Plane (BMP)中 。static boolean
isDefined(char ch)
确定是否在Unicode中定义了字符。static boolean
isDefined(int codePoint)
确定是否在Unicode中定义了字符(Unicode代码点)。static boolean
isDigit(char ch)
确定指定的字符是否为数字。static boolean
isDigit(int codePoint)
确定指定的字符(Unicode代码点)是否为数字。static boolean
isHighSurrogate(char ch)
确定给定的char
值是否为 Unicode high-surrogate code unit (也称为 前导代理代码单元 )。static boolean
isIdentifierIgnorable(char ch)
确定指定的字符是否应被视为Java标识符或Unicode标识符中的可忽略字符。static boolean
isIdentifierIgnorable(int codePoint)
确定指定的字符(Unicode代码点)是否应被视为Java标识符或Unicode标识符中的可忽略字符。static boolean
isIdeographic(int codePoint)
确定指定的字符(Unicode代码点)是否为Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。static boolean
isISOControl(char ch)
确定指定的字符是否为ISO控制字符。static boolean
isISOControl(int codePoint)
确定引用的字符(Unicode代码点)是否为ISO控制字符。static boolean
isJavaIdentifierPart(char ch)
确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。static boolean
isJavaIdentifierPart(int codePoint)
确定字符(Unicode代码点)是否可能是Java标识符的一部分,而不是第一个字符。static boolean
isJavaIdentifierStart(char ch)
确定指定的字符是否允许作为Java标识符中的第一个字符。static boolean
isJavaIdentifierStart(int codePoint)
确定字符(Unicode代码点)是否允许作为Java标识符中的第一个字符。static boolean
isJavaLetter(char ch)
已过时。替换为isJavaIdentifierStart(char)。static boolean
isJavaLetterOrDigit(char ch)
已过时。替换为isJavaIdentifierPart(char)。static boolean
isLetter(char ch)
确定指定的字符是否为字母。static boolean
isLetter(int codePoint)
确定指定的字符(Unicode代码点)是否为字母。static boolean
isLetterOrDigit(char ch)
确定指定的字符是字母还是数字。static boolean
isLetterOrDigit(int codePoint)
确定指定的字符(Unicode代码点)是字母还是数字。static boolean
isLowerCase(char ch)
确定指定的字符是否为小写字符。static boolean
isLowerCase(int codePoint)
确定指定的字符(Unicode代码点)是否为小写字符。static boolean
isLowSurrogate(char ch)
确定给定的char
值是否为 Unicode low-surrogate code unit (也称为 trailing-surrogate代码单元 )。static boolean
isMirrored(char ch)
确定是否根据Unicode规范镜像该字符。static boolean
isMirrored(int codePoint)
确定是否根据Unicode规范镜像指定的字符(Unicode代码点)。static boolean
isSpace(char ch)
已过时。替换为isWhitespace(char)。static boolean
isSpaceChar(char ch)
确定指定的字符是否为Unicode空格字符。static boolean
isSpaceChar(int codePoint)
确定指定的字符(Unicode代码点)是否为Unicode空格字符。static boolean
isSupplementaryCodePoint(int codePoint)
确定指定的字符(Unicode代码点)是否在 supplementary character范围内。static boolean
isSurrogate(char ch)
确定给定的char
值是否为Unicode 代理代码单元 。static boolean
isSurrogatePair(char high, char low)
确定指定的char
值对是否为有效 Unicode surrogate pair 。static boolean
isTitleCase(char ch)
确定指定的字符是否为标题字符。static boolean
isTitleCase(int codePoint)
确定指定的字符(Unicode代码点)是否为标题字符。static boolean
isUnicodeIdentifierPart(char ch)
确定指定的字符是否可能是Unicode标识符的一部分,而不是第一个字符。static boolean
isUnicodeIdentifierPart(int codePoint)
确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。static boolean
isUnicodeIdentifierStart(char ch)
确定指定的字符是否允许作为Unicode标识符中的第一个字符。static boolean
isUnicodeIdentifierStart(int codePoint)
确定是否允许指定的字符(Unicode代码点)作为Unicode标识符中的第一个字符。static boolean
isUpperCase(char ch)
确定指定的字符是否为大写字符。static boolean
isUpperCase(int codePoint)
确定指定的字符(Unicode代码点)是否为大写字符。static boolean
isValidCodePoint(int codePoint)
确定指定的代码点是否有效 Unicode code point value 。static boolean
isWhitespace(char ch)
根据Java确定指定的字符是否为空格。static boolean
isWhitespace(int codePoint)
根据Java确定指定的字符(Unicode代码点)是否为空白。static char
lowSurrogate(int codePoint)
返回尾随替代(一个 low surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。static int
offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
返回给定的索引char
子阵是从给定的偏移index
由codePointOffset
代码点。static int
offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
返回给定char序列中的索引,该索引从给定的index
偏移codePointOffset
代码点。static char
reverseBytes(char ch)
返回通过反转指定的char
值中的字节顺序获得的值。static char[]
toChars(int codePoint)
将指定字符(Unicode代码点)转换为存储在char
数组中的UTF-16表示形式。static int
toChars(int codePoint, char[] dst, int dstIndex)
将指定字符(Unicode代码点)转换为其UTF-16表示形式。static int
toCodePoint(char high, char low)
将指定的代理项对转换为其补充代码点值。static char
toLowerCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为小写。static int
toLowerCase(int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写。String
toString()
返回表示此Character
值的String
对象。static String
toString(char c)
返回表示指定的char
的String
对象。static String
toString(int codePoint)
返回表示指定字符(Unicode代码点)的String
对象。static char
toTitleCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为标题。static int
toTitleCase(int codePoint)
使用UnicodeData文件中的案例映射信息将字符(Unicode代码点)参数转换为titlecase。static char
toUpperCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为大写。static int
toUpperCase(int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为大写。static Character
valueOf(char c)
返回表示指定的char
值的Character
实例。
-
-
-
字段详细信息
-
MIN_RADIX
public static final int MIN_RADIX
可用于转换为字符串和从字符串转换的最小基数。 该字段的常量值是基数转换方法中的基数参数允许的最小值,例如digit
方法,forDigit
方法和toString
类Integer
方法。
-
MAX_RADIX
public static final int MAX_RADIX
可用于转换为字符串和从字符串转换的最大基数。 该字段的常量值是基数转换方法中的基数参数允许的digit
,例如digit
方法,forDigit
方法和toString
类Integer
方法。
-
MIN_VALUE
public static final char MIN_VALUE
此字段的常量值是类型char
'\u0000'
。- 从以下版本开始:
- 1.0.2
- 另请参见:
- 常数字段值
-
MAX_VALUE
public static final char MAX_VALUE
此字段的常量值是类型char
'\uFFFF'
。- 从以下版本开始:
- 1.0.2
- 另请参见:
- 常数字段值
-
UNASSIGNED
public static final byte UNASSIGNED
Unicode规范中的常规类别“Cn”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
UPPERCASE_LETTER
public static final byte UPPERCASE_LETTER
Unicode规范中的常规类别“Lu”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
LOWERCASE_LETTER
public static final byte LOWERCASE_LETTER
Unicode规范中的常规类别“Ll”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
TITLECASE_LETTER
public static final byte TITLECASE_LETTER
Unicode规范中的常规类别“Lt”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
MODIFIER_LETTER
public static final byte MODIFIER_LETTER
Unicode规范中的常规类别“Lm”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
OTHER_LETTER
public static final byte OTHER_LETTER
Unicode规范中的常规类别“Lo”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
NON_SPACING_MARK
public static final byte NON_SPACING_MARK
Unicode规范中的常规类别“Mn”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
ENCLOSING_MARK
public static final byte ENCLOSING_MARK
Unicode规范中的常规类别“Me”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
COMBINING_SPACING_MARK
public static final byte COMBINING_SPACING_MARK
Unicode规范中的常规类别“Mc”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
DECIMAL_DIGIT_NUMBER
public static final byte DECIMAL_DIGIT_NUMBER
Unicode规范中的常规类别“Nd”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
LETTER_NUMBER
public static final byte LETTER_NUMBER
Unicode规范中的常规类别“Nl”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
OTHER_NUMBER
public static final byte OTHER_NUMBER
Unicode规范中的常规类别“否”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
SPACE_SEPARATOR
public static final byte SPACE_SEPARATOR
Unicode规范中的常规类别“Zs”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
LINE_SEPARATOR
public static final byte LINE_SEPARATOR
Unicode规范中的常规类别“Zl”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
PARAGRAPH_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
Unicode规范中的常规类别“Zp”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
CONTROL
public static final byte CONTROL
Unicode规范中的常规类别“Cc”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
FORMAT
public static final byte FORMAT
Unicode规范中的常规类别“Cf”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
PRIVATE_USE
public static final byte PRIVATE_USE
Unicode规范中的常规类别“Co”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
SURROGATE
public static final byte SURROGATE
Unicode规范中的常规类别“Cs”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
DASH_PUNCTUATION
public static final byte DASH_PUNCTUATION
Unicode规范中的常规类别“Pd”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
START_PUNCTUATION
public static final byte START_PUNCTUATION
Unicode规范中的常规类别“Ps”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
END_PUNCTUATION
public static final byte END_PUNCTUATION
Unicode规范中的常规类别“Pe”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
CONNECTOR_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
Unicode规范中的常规类别“Pc”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
OTHER_PUNCTUATION
public static final byte OTHER_PUNCTUATION
Unicode规范中的常规类别“Po”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
MATH_SYMBOL
public static final byte MATH_SYMBOL
Unicode规范中的常规类别“Sm”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
CURRENCY_SYMBOL
public static final byte CURRENCY_SYMBOL
Unicode规范中的常规类别“Sc”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
MODIFIER_SYMBOL
public static final byte MODIFIER_SYMBOL
Unicode规范中的常规类别“Sk”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
OTHER_SYMBOL
public static final byte OTHER_SYMBOL
Unicode规范中的常规类别“So”。- 从以下版本开始:
- 1.1
- 另请参见:
- 常数字段值
-
INITIAL_QUOTE_PUNCTUATION
public static final byte INITIAL_QUOTE_PUNCTUATION
Unicode规范中的常规类别“Pi”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
FINAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
Unicode规范中的常规类别“Pf”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_UNDEFINED
public static final byte DIRECTIONALITY_UNDEFINED
未定义的双向字符类型。 未定义的char
值在Unicode规范中具有未定义的方向性。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
Unicode规范中的强双向字符类型“L”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
Unicode规范中的强双向字符类型“R”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode规范中的强双向字符类型“AL”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
Unicode规范中的弱双向字符类型“EN”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode规范中的弱双向字符类型“ES”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode规范中的弱双向字符类型“ET”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_ARABIC_NUMBER
Unicode规范中的弱双向字符类型“AN”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode规范中的弱双向字符类型“CS”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_NONSPACING_MARK
Unicode规范中的弱双向字符类型“NSM”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode规范中的弱双向字符类型“BN”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode规范中的中性双向字符类型“B”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode规范中的中性双向字符类型“S”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_WHITESPACE
Unicode规范中的中性双向字符类型“WS”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
Unicode规范中的中性双向字符类型“ON”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode规范中的强双向字符类型“LRE”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode规范中的强双向字符类型“LRO”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode规范中的强双向字符类型“RLE”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode规范中的强双向字符类型“RLO”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode规范中的弱双向字符类型“PDF”。- 从以下版本开始:
- 1.4
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
Unicode规范中的弱双向字符类型“LRI”。- 从以下版本开始:
- 9
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
Unicode规范中的弱双向字符类型“RLI”。- 从以下版本开始:
- 9
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_FIRST_STRONG_ISOLATE
public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATE
Unicode规范中的弱双向字符类型“FSI”。- 从以下版本开始:
- 9
- 另请参见:
- 常数字段值
-
DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
Unicode规范中的弱双向字符类型“PDI”。- 从以下版本开始:
- 9
- 另请参见:
- 常数字段值
-
MIN_HIGH_SURROGATE
public static final char MIN_HIGH_SURROGATE
UTF-16编码中Unicode high-surrogate code unit的最小值,常量'\uD800'
。 高代理人也被称为领导代理人 。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MAX_HIGH_SURROGATE
public static final char MAX_HIGH_SURROGATE
UTF-16编码中的最大值为Unicode high-surrogate code unit ,常量为'\uDBFF'
。 高代理人也被称为领导代理人 。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MIN_LOW_SURROGATE
public static final char MIN_LOW_SURROGATE
UTF-16编码中Unicode low-surrogate code unit的最小值,常量'\uDC00'
。 低代理也被称为尾随代理 。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MAX_LOW_SURROGATE
public static final char MAX_LOW_SURROGATE
UTF-16编码中的最大值Unicode low-surrogate code unit ,常量'\uDFFF'
。 低代理也被称为尾随代理 。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MIN_SURROGATE
public static final char MIN_SURROGATE
UTF-16编码中Unicode代理项代码单元的最小值,常量'\uD800'
。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MAX_SURROGATE
public static final char MAX_SURROGATE
UTF-16编码中Unicode代理项代码单元的最大值,常量'\uDFFF'
。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MIN_SUPPLEMENTARY_CODE_POINT
public static final int MIN_SUPPLEMENTARY_CODE_POINT
最小值 Unicode supplementary code point ,常数U+10000
。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MIN_CODE_POINT
public static final int MIN_CODE_POINT
最小值 Unicode code point ,常数U+0000
。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
MAX_CODE_POINT
public static final int MAX_CODE_POINT
最大值 Unicode code point ,常数U+10FFFF
。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
SIZE
public static final int SIZE
用于表示无符号二进制形式的char
值的位数,常量16
。- 从以下版本开始:
- 1.5
- 另请参见:
- 常数字段值
-
BYTES
public static final int BYTES
用于表示无符号二进制形式的char
值的字节数。- 从以下版本开始:
- 1.8
- 另请参见:
- 常数字段值
-
-
构造方法详细信息
-
Character
@Deprecated(since="9")public Character(char value)
Deprecated.It is rarely appropriate to use this constructor. The static factoryvalueOf(char)
is generally a better choice, as it is likely to yield significantly better space and time performance.构造一个新分配的Character
对象,该对象表示指定的char
值。- 参数
-
value
- 要由Character
对象表示的值。
-
-
方法详细信息
-
valueOf
public static Character valueOf(char c)
返回表示指定的char
值的Character
实例。 如果不需要新的Character
实例,则通常应优先使用此方法,而不是构造函数Character(char)
,因为此方法可能通过缓存频繁请求的值来显着提高空间和时间性能。 此方法将始终缓存'\u0000'
至'\u007F'
范围内的值,并且可以缓存此范围之外的其他值。- 参数
-
c
- char值。 - 结果
-
Character
实例,代表c
。 - 从以下版本开始:
- 1.5
-
charValue
public char charValue()
返回此Character
对象的值。- 结果
- 此对象表示的原始值
char
。
-
hashCode
public int hashCode()
返回此Character
的哈希码; 等于调用charValue()
的结果。- 重写:
-
hashCode
类Object
- 结果
- 此
Character
的哈希码值 - 另请参见:
-
Object.equals(java.lang.Object)
,System.identityHashCode(java.lang.Object)
-
hashCode
public static int hashCode(char value)
返回char
值的哈希码; 与Character.hashCode()
兼容。- 参数
-
value
- 要为其返回哈希码的char
。 - 结果
-
char
值的哈希码值。 - 从以下版本开始:
- 1.8
-
equals
public boolean equals(Object obj)
将此对象与指定的对象进行比较。 当且仅当参数不是null
并且是Character
对象时,结果为true
,该对象表示与此对象相同的char
值。- 重写:
-
equals
在类Object
- 参数
-
obj
- 要与之比较的对象。 - 结果
-
true
如果对象相同; 否则为false
。 - 另请参见:
-
Object.hashCode()
,HashMap
-
toString
public String toString()
返回表示此Character
值的String
对象。 其结果是长度为1的串,其唯一分量是原始char
由该表示值Character
对象。
-
toString
public static String toString(char c)
返回表示指定的char
的String
对象。 结果是一个长度为1的字符串,仅由指定的char
。- API Note:
- 此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
toString(int)
方法。 - 参数
-
c
- 要转换的char
- 结果
- 指定的
char
的字符串表示char
- 从以下版本开始:
- 1.4
-
toString
public static String toString(int codePoint)
返回表示指定字符(Unicode代码点)的String
对象。 结果是一个长度为1或2的字符串,仅由指定的codePoint
。- 参数
-
codePoint
- 要转换的codePoint
- 结果
- 指定的
codePoint
的字符串表示codePoint
- 异常
-
IllegalArgumentException
- 如果指定的codePoint
不是 valid Unicode code point 。 - 从以下版本开始:
- 11
-
isValidCodePoint
public static boolean isValidCodePoint(int codePoint)
确定指定的代码点是否有效 Unicode code point value 。- 参数
-
codePoint
- 要测试的Unicode代码点 - 结果
-
true
如果指定的代码点值介于MIN_CODE_POINT
和MAX_CODE_POINT
之间; 否则为false
。 - 从以下版本开始:
- 1.5
-
isBmpCodePoint
public static boolean isBmpCodePoint(int codePoint)
确定指定的字符(Unicode代码点)是否在Basic Multilingual Plane (BMP)中 。 这些代码点可以使用单个char
表示。
-
isSupplementaryCodePoint
public static boolean isSupplementaryCodePoint(int codePoint)
确定指定的字符(Unicode代码点)是否在 supplementary character范围内。- 参数
-
codePoint
- 要测试的字符(Unicode代码点) - 结果
-
true
如果指定的代码点介于MIN_SUPPLEMENTARY_CODE_POINT
和MAX_CODE_POINT
之间; 否则为false
。 - 从以下版本开始:
- 1.5
-
isHighSurrogate
public static boolean isHighSurrogate(char ch)
确定给定的char
值是否为Unicode high-surrogate code unit (也称为前导代理代码单元 )。这些值本身不代表字符,但在UTF-16编码中用于表示supplementary characters 。
- 参数
-
ch
- 要测试的char
值。 - 结果
-
true
如果char
值介于MIN_HIGH_SURROGATE
和MAX_HIGH_SURROGATE
之间; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isLowSurrogate(char)
,Character.UnicodeBlock.of(int)
-
isLowSurrogate
public static boolean isLowSurrogate(char ch)
确定给定的char
值是否为Unicode low-surrogate code unit (也称为trailing-surrogate代码单元 )。这些值本身不代表字符,但在UTF-16编码中以supplementary characters的表示形式使用。
- 参数
-
ch
- 要测试的值char
。 - 结果
-
true
如果char
值介于MIN_LOW_SURROGATE
和MAX_LOW_SURROGATE
之间; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isHighSurrogate(char)
-
isSurrogate
public static boolean isSurrogate(char ch)
确定给定的char
值是否为Unicode 代理代码单元 。这些值本身不代表字符,但在UTF-16编码中用于表示supplementary characters 。
char值是代理代码单元,当且仅当它是low-surrogate code unit或high-surrogate code unit时 。
- 参数
-
ch
- 要测试的char
值。 - 结果
-
true
如果char
值介于MIN_SURROGATE
和MAX_SURROGATE
之间; 否则为false
。 - 从以下版本开始:
- 1.7
-
isSurrogatePair
public static boolean isSurrogatePair(char high, char low)
- 参数
-
high
- 要测试的高代理代码值 -
low
- 要测试的低代理代码值 - 结果
-
true
如果指定的高代理代理值和低代理代码值代表有效的代理对; 否则为false
。 - 从以下版本开始:
- 1.5
-
charCount
public static int charCount(int codePoint)
确定表示指定字符(Unicode代码点)所需的char
值的数量。 如果指定的字符等于或大于0x10000,则该方法返回2.否则,该方法返回1。此方法不会将指定的字符验证为有效的Unicode代码点。 如有必要,调用者必须使用
isValidCodePoint
验证字符值。- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
- 2如果角色是有效的补充角色; 否则为1。
- 从以下版本开始:
- 1.5
- 另请参见:
-
isSupplementaryCodePoint(int)
-
toCodePoint
public static int toCodePoint(char high, char low)
- 参数
-
high
- 高代理代码单元 -
low
- 低代理代码单元 - 结果
- 由指定的代理对组成的补充代码点。
- 从以下版本开始:
- 1.5
-
codePointAt
public static int codePointAt(CharSequence seq, int index)
返回CharSequence
的给定索引处的代码点。 如果char
给定索引处的值CharSequence
处于高代理项范围,下列指数小于所述长度CharSequence
,并且char
以下索引处的值是在低代理项范围内,则所述辅助返回与此代理项对相对应的代码点。 否则,返回给定索引处的char
值。- 参数
-
seq
- 一系列char
值(Unicode代码单元) -
index
- 要转换的char
值(Unicode代码单位)的seq
- 结果
- 给定索引处的Unicode代码点
- 异常
-
NullPointerException
- 如果seq
为空。 -
IndexOutOfBoundsException
- 如果值index
为负数或不小于seq.length()
。 - 从以下版本开始:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index)
返回char
数组的给定索引处的代码点。 如果char
数组中给定索引处的char
值处于高代理范围内,则以下索引小于char
数组的长度,并且以下索引处的char
值处于低代理范围内,则返回与该代理对相对应的补充代码点。 否则,返回给定索引处的char
值。- 参数
-
a
- 数组char
-
index
- 要转换的char
数组中char
值(Unicode代码单位)的char
- 结果
- 给定索引处的Unicode代码点
- 异常
-
NullPointerException
- 如果a
为空。 -
IndexOutOfBoundsException
- 如果值index
为负数或不小于char
数组的长度。 - 从以下版本开始:
- 1.5
-
codePointAt
public static int codePointAt(char[] a, int index, int limit)
返回char
数组的给定索引处的代码点,其中只能使用index
小于limit
数组元素。 如果char
数组中给定索引处的char
值处于高代理范围内,则以下索引小于limit
,并且以下索引处的char
值处于低代理范围,然后是补充代码点对应于此代理项对返回。 否则,返回给定索引处的char
值。- 参数
-
a
-char
数组 -
index
- 要转换的char
数组中char
值(Unicode代码单位)的char
-
limit
- 可在char
数组中使用的最后一个数组元素之后的索引 - 结果
- 给定索引处的Unicode代码点
- 异常
-
NullPointerException
- 如果a
为空。 -
IndexOutOfBoundsException
- 如果index
参数为负或不小于limit
参数,或者limit
参数为负或大于char
数组的长度。 - 从以下版本开始:
- 1.5
-
codePointBefore
public static int codePointBefore(CharSequence seq, int index)
返回CharSequence
的给定索引之前的代码点。 如果char
在值(index - 1)
在CharSequence
处于低代理项范围,(index - 2)
不为负,并且char
在值(index - 2)
在CharSequence
处于高代理项范围内,则对应于该代理对的增补代码点是回。 否则,返回char
值(index - 1)
。- 参数
-
seq
-CharSequence
实例 -
index
- 应返回的代码点后面的索引 - 结果
- 给定索引之前的Unicode代码点值。
- 异常
-
NullPointerException
- 如果seq
为空。 -
IndexOutOfBoundsException
- 如果index
参数小于1或大于seq.length()
。 - 从以下版本开始:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index)
返回char
数组的给定索引之前的代码点。 如果char
在值(index - 1)
中char
阵列是在低代理项范围,(index - 2)
不为负,并且char
在值(index - 2)
中char
阵列在高代理项范围内,则对应于该替代的增补代码点对返回。 否则,返回char
值(index - 1)
。- 参数
-
a
-char
数组 -
index
- 应返回的代码点后面的索引 - 结果
- 给定索引之前的Unicode代码点值。
- 异常
-
NullPointerException
- 如果a
为空。 -
IndexOutOfBoundsException
- 如果index
参数小于1或大于char
数组的长度 - 从以下版本开始:
- 1.5
-
codePointBefore
public static int codePointBefore(char[] a, int index, int start)
返回char
数组的给定索引之前的代码点,其中只能使用index
大于或等于start
数组元素。 如果char
在值(index - 1)
中char
阵列是在低代理项范围,(index - 2)
不小于start
,并且char
在值(index - 2)
中char
阵列在高代理项范围内,则对应于所述补充代码点这个替代对被退回。 否则,返回char
值(index - 1)
。- 参数
-
a
-char
数组 -
index
- 应返回的代码点后面的索引 -
start
-char
数组中第一个数组元素的char
- 结果
- 给定索引之前的Unicode代码点值。
- 异常
-
NullPointerException
- 如果a
为空。 -
IndexOutOfBoundsException
- 如果index
参数不大于start
参数或大于char
数组的长度,或者start
参数为负或不小于char
数组的长度。 - 从以下版本开始:
- 1.5
-
highSurrogate
public static char highSurrogate(int codePoint)
返回主导替代(一个high surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。 如果指定的字符不是supplementary character ,则返回未指定的char
。如果
isSupplementaryCodePoint(x)
是true
,则isHighSurrogate
(highSurrogate(x))
和toCodePoint
(highSurrogate(x),
lowSurrogate
(x)) == x
也总是true
。- 参数
-
codePoint
- 补充字符(Unicode代码点) - 结果
- 用于表示UTF-16编码中的字符的前导代理代码单元
- 从以下版本开始:
- 1.7
-
lowSurrogate
public static char lowSurrogate(int codePoint)
返回尾随替代(一个low surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。 如果指定的字符不是supplementary character ,则返回未指定的char
。如果
isSupplementaryCodePoint(x)
是true
,那么isLowSurrogate
(lowSurrogate(x))
和toCodePoint
(
highSurrogate
(x), lowSurrogate(x)) == x
也总是true
。- 参数
-
codePoint
- 补充字符(Unicode代码点) - 结果
- 尾随代理代码单元,用于表示UTF-16编码中的字符
- 从以下版本开始:
- 1.7
-
toChars
public static int toChars(int codePoint, char[] dst, int dstIndex)
将指定字符(Unicode代码点)转换为其UTF-16表示形式。 如果指定的代码点是BMP(基本多语言平面或平面0)值,则相同的值存储在dst[dstIndex]
,并返回1。 如果指定的代码点是补充字符,则其代理值存储在dst[dstIndex]
(high-surrogate)和dst[dstIndex+1]
(low-surrogate)中,并返回2。- 参数
-
codePoint
- 要转换的字符(Unicode代码点)。 -
dst
-的阵列char
,其中codePoint
的UTF-16值被存储。 -
dstIndex
- 存储转换值的dst
数组的起始索引。 - 结果
- 如果代码点是BMP代码点,则为1;如果代码点是补充代码点,则为2。
- 异常
-
IllegalArgumentException
- 如果指定的codePoint
不是有效的Unicode代码点。 -
NullPointerException
- 如果指定的dst
为空。 -
IndexOutOfBoundsException
- 如果dstIndex
为负数或不小于dst.length
,或者如果dst
在dstIndex
没有足够的数组元素来存储生成的char
值。 (如果dstIndex
等于dst.length-1
且指定的codePoint
是补充字符,则高代理值不会存储在dst[dstIndex]
。) - 从以下版本开始:
- 1.5
-
toChars
public static char[] toChars(int codePoint)
将指定字符(Unicode代码点)转换为存储在char
数组中的UTF-16表示形式。 如果指定的代码点是BMP(基本多语言平面或平面0)值,则生成的char
数组具有与codePoint
相同的值。 如果指定的代码点是补充代码点,则生成的char
数组具有相应的代理项对。- 参数
-
codePoint
- Unicode代码点 - 结果
- 具有
codePoint
的UTF-16表示的char
阵列。 - 异常
-
IllegalArgumentException
- 如果指定的codePoint
不是有效的Unicode代码点。 - 从以下版本开始:
- 1.5
-
codePointCount
public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
返回指定char序列的文本范围内的Unicode代码点数。 文本范围开始在指定的beginIndex
,并延伸到char
在索引endIndex - 1
。 因此,文本范围的长度(在char
s中)是endIndex-beginIndex
。 文本范围内的未配对代理计为每个代码点。- 参数
-
seq
- 字符序列 -
beginIndex
- 文本范围的第一个char
的索引。 -
endIndex
- 文本范围的最后char
之后的索引。 - 结果
- 指定文本范围内的Unicode代码点数
- 异常
-
NullPointerException
- 如果seq
为空。 -
IndexOutOfBoundsException
- 如果beginIndex
为负数,或者endIndex
大于给定序列的长度,或者beginIndex
大于endIndex
。 - 从以下版本开始:
- 1.5
-
codePointCount
public static int codePointCount(char[] a, int offset, int count)
返回char
数组参数的子数组中的Unicode代码点数。offset
参数是子阵列的第一个char
的索引,count
参数指定char
schar
阵列的长度。 子阵列中的未配对代理计为每个代码点。- 参数
-
a
-char
数组 -
offset
- 给定char
数组中第一个char
的索引 -
count
-char
阵列的长度 - 结果
- 指定子数组中的Unicode代码点数
- 异常
-
NullPointerException
- 如果a
为空。 -
IndexOutOfBoundsException
- 如果offset
或count
为负数,或者offset + count
大于给定数组的长度。 - 从以下版本开始:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
返回给定char序列中的索引,该索引从给定的index
偏移codePointOffset
代码点。index
和codePointOffset
给出的文本范围内的未配对代理计为每个代码点。- 参数
-
seq
- 字符序列 -
index
- 要偏移的索引 -
codePointOffset
- 代码点中的偏移量 - 结果
- char序列中的索引
- 异常
-
NullPointerException
- 如果seq
为空。 -
IndexOutOfBoundsException
- 如果index
为负数或大于char序列的长度,或者如果codePointOffset
为正且从index
开始的子index
少于codePointOffset
代码点,或者如果codePointOffset
为负且index
之前的子index
小于绝对值codePointOffset
代码点。 - 从以下版本开始:
- 1.5
-
offsetByCodePoints
public static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
返回给定的索引char
子阵是从给定的偏移index
由codePointOffset
代码点。start
和count
参数指定char
数组的子数组。 由index
和codePointOffset
给出的文本范围内的未配对代理计为每个代码点。- 参数
-
a
-char
数组 -
start
- 子阵列的第一个char
的索引 -
count
-char
阵列的长度 -
index
- 要偏移的索引 -
codePointOffset
- 代码点中的偏移量 - 结果
- 子阵列中的索引
- 异常
-
NullPointerException
- 如果a
为空。 -
IndexOutOfBoundsException
- 如果start
或count
为负数,或者如果start + count
大于给定数组的长度,或者index
小于start
或更大,那么start + count
,或者codePointOffset
为正且文本范围以index
并以start + count - 1
结尾有少于codePointOffset
代码点,或者如果codePointOffset
为负且文本范围开始start
,结束时用index - 1
具有比的绝对值较少codePointOffset
代码点。 - 从以下版本开始:
- 1.5
-
isLowerCase
public static boolean isLowerCase(char ch)
确定指定的字符是否为小写字符。如果
Character.getType(ch)
提供的常规类别类型为LOWERCASE_LETTER
,或者它具有Unicode标准定义的贡献属性Other_Lowercase,则该字符为小写。以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他Unicode字符也是小写的。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isLowerCase(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符是小写的; 否则为false
。 - 另请参见:
-
isLowerCase(char)
,isTitleCase(char)
,toLowerCase(char)
,getType(char)
-
isLowerCase
public static boolean isLowerCase(int codePoint)
确定指定的字符(Unicode代码点)是否为小写字符。如果字符的常规类别类型(由
getType(codePoint)
提供)为LOWERCASE_LETTER
,或者它具有Unicode标准定义的贡献属性Other_Lowercase,则该字符为小写。以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他Unicode字符也是小写的。
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符是小写的; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isLowerCase(int)
,isTitleCase(int)
,toLowerCase(int)
,getType(int)
-
isUpperCase
public static boolean isUpperCase(char ch)
确定指定的字符是否为大写字符。一个字符大写如果其一般类别类型,通过提供
Character.getType(ch)
,是UPPERCASE_LETTER
。 或者它具有Unicode标准定义的贡献属性Other_Uppercase。以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他Unicode字符也是大写的。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isUpperCase(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符是大写的; 否则为false
。 - 从以下版本开始:
- 1.0
- 另请参见:
-
isLowerCase(char)
,isTitleCase(char)
,toUpperCase(char)
,getType(char)
-
isUpperCase
public static boolean isUpperCase(int codePoint)
确定指定的字符(Unicode代码点)是否为大写字符。如果字符的一般类别类型(由
getType(codePoint)
提供)为UPPERCASE_LETTER
,或者它具有Unicode标准定义的贡献属性Other_Uppercase,则该字符为大写。以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他Unicode字符也是大写的。
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符是大写的; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isLowerCase(int)
,isTitleCase(int)
,toUpperCase(int)
,getType(int)
-
isTitleCase
public static boolean isTitleCase(char ch)
确定指定的字符是否为标题字符。字符是否为标题字符,如果它的一般类别类型,通过提供
Character.getType(ch)
,是TITLECASE_LETTER
。有些字符看起来像一对拉丁字母。 例如,有一个大写字母,看起来像“LJ”,并有一个相应的小写字母,看起来像“lj”。 第三种形式,看起来像“Lj”,是使用初始大写以小写形式呈现单词时使用的适当形式,如书名。
这些是此方法返回
true
一些Unicode字符:-
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
-
LATIN CAPITAL LETTER L WITH SMALL LETTER J
-
LATIN CAPITAL LETTER N WITH SMALL LETTER J
-
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
许多其他Unicode字符也是标题。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isTitleCase(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果角色是标题; 否则为false
。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isLowerCase(char)
,isUpperCase(char)
,toTitleCase(char)
,getType(char)
-
-
isTitleCase
public static boolean isTitleCase(int codePoint)
确定指定的字符(Unicode代码点)是否为标题字符。字符是否为标题字符,如果它的一般类别类型,通过提供
getType(codePoint)
,是TITLECASE_LETTER
。有些字符看起来像一对拉丁字母。 例如,有一个大写字母,看起来像“LJ”,并有一个相应的小写字母,看起来像“lj”。 第三种形式,看起来像“Lj”,是使用初始大写以小写形式呈现单词时使用的适当形式,如书名。
这些是此方法返回
true
一些Unicode字符:-
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
-
LATIN CAPITAL LETTER L WITH SMALL LETTER J
-
LATIN CAPITAL LETTER N WITH SMALL LETTER J
-
LATIN CAPITAL LETTER D WITH SMALL LETTER Z
许多其他Unicode字符也是标题。
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果角色是标题; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isLowerCase(int)
,isUpperCase(int)
,toTitleCase(int)
,getType(int)
-
-
isDigit
public static boolean isDigit(char ch)
确定指定的字符是否为数字。甲字符是数字,如果它的一般类别类型,通过提供
Character.getType(ch)
,是DECIMAL_DIGIT_NUMBER
。一些包含数字的Unicode字符范围:
-
'\u0030'
到'\u0039'
,ISO-LATIN-1位数('0'
到'9'
) -
'\u0660'
到'\u0669'
,阿拉伯语 - 印度数字 -
'\u06F0'
到'\u06F9'
,扩展的阿拉伯语 - 印度数字 -
'\u0966'
到'\u096F'
,梵文数字 -
'\uFF10'
至'\uFF19'
,'\uFF19'
数字
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isDigit(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符是数字; 否则为false
。 - 另请参见:
-
digit(char, int)
,forDigit(int, int)
,getType(char)
-
-
isDigit
public static boolean isDigit(int codePoint)
确定指定的字符(Unicode代码点)是否为数字。甲字符是数字,如果它的一般类别类型,通过提供
getType(codePoint)
,是DECIMAL_DIGIT_NUMBER
。一些包含数字的Unicode字符范围:
-
'\u0030'
到'\u0039'
,ISO-LATIN-1位数('0'
到'9'
) -
'\u0660'
到'\u0669'
,阿拉伯语 - 印度数字 -
'\u06F0'
到'\u06F9'
,扩展的阿拉伯语 - 印度数字 -
'\u0966'
到'\u096F'
,梵文数字 -
'\uFF10'
到'\uFF19'
,全角数字
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符是数字; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
forDigit(int, int)
,getType(int)
-
-
isDefined
public static boolean isDefined(char ch)
确定是否在Unicode中定义了字符。如果至少满足下列条件之一,则定义字符:
- 它在UnicodeData文件中有一个条目。
- 它具有UnicodeData文件定义的范围中的值。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isDefined(int)
方法。- 参数
-
ch
- 要测试的角色 - 结果
-
true
如果字符在Unicode中具有已定义的含义; 否则为false
。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isDigit(char)
,isLetter(char)
,isLetterOrDigit(char)
,isLowerCase(char)
,isTitleCase(char)
,isUpperCase(char)
-
isDefined
public static boolean isDefined(int codePoint)
确定是否在Unicode中定义了字符(Unicode代码点)。如果至少满足下列条件之一,则定义字符:
- 它在UnicodeData文件中有一个条目。
- 它具有UnicodeData文件定义的范围中的值。
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符在Unicode中具有已定义的含义; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isDigit(int)
,isLetter(int)
,isLetterOrDigit(int)
,isLowerCase(int)
,isTitleCase(int)
,isUpperCase(int)
-
isLetter
public static boolean isLetter(char ch)
确定指定的字符是否为字母。如果字符的一般类别类型(由
Character.getType(ch)
提供)是以下任何一种字符,则该字符被视为字母:-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isLetter(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果角色是一个字母;false
否则。 - 另请参见:
-
isDigit(char)
,isJavaIdentifierStart(char)
,isJavaLetter(char)
,isJavaLetterOrDigit(char)
,isLetterOrDigit(char)
,isLowerCase(char)
,isTitleCase(char)
,isUnicodeIdentifierStart(char)
,isUpperCase(char)
-
-
isLetter
public static boolean isLetter(int codePoint)
确定指定的字符(Unicode代码点)是否为字母。如果字符的一般类别类型(由
getType(codePoint)
提供)是以下任何一种字符,则该字符被视为字母:-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果角色是一个字母; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isDigit(int)
,isJavaIdentifierStart(int)
,isLetterOrDigit(int)
,isLowerCase(int)
,isTitleCase(int)
,isUnicodeIdentifierStart(int)
,isUpperCase(int)
-
-
isLetterOrDigit
public static boolean isLetterOrDigit(char ch)
确定指定的字符是字母还是数字。一个字符被认为是如果任何一个字母或数字
Character.isLetter(char ch)
或Character.isDigit(char ch)
回报true
的字符。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isLetterOrDigit(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符是字母或数字; 否则为false
。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isDigit(char)
,isJavaIdentifierPart(char)
,isJavaLetter(char)
,isJavaLetterOrDigit(char)
,isLetter(char)
,isUnicodeIdentifierPart(char)
-
isLetterOrDigit
public static boolean isLetterOrDigit(int codePoint)
确定指定的字符(Unicode代码点)是字母还是数字。一个字符被认为是如果任何一个字母或数字
isLetter(codePoint)
个或isDigit(codePoint)
回报true
的字符。- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符是字母或数字; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isDigit(int)
,isJavaIdentifierPart(int)
,isLetter(int)
,isUnicodeIdentifierPart(int)
-
isJavaLetter
@Deprecated(since="1.1")public static boolean isJavaLetter(char ch)
Deprecated.Replaced by isJavaIdentifierStart(char).确定指定的字符是否允许作为Java标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Java标识符:
-
isLetter(ch)
返回true
-
getType(ch)
返回LETTER_NUMBER
-
ch
是货币符号(例如'$'
) -
ch
是连接标点字符(例如'_'
)。
- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符可以启动Java标识符; 否则为false
。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isJavaLetterOrDigit(char)
,isJavaIdentifierStart(char)
,isJavaIdentifierPart(char)
,isLetter(char)
,isLetterOrDigit(char)
,isUnicodeIdentifierStart(char)
-
-
isJavaLetterOrDigit
@Deprecated(since="1.1")public static boolean isJavaLetterOrDigit(char ch)
Deprecated.Replaced by isJavaIdentifierPart(char).确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。当且仅当满足以下任何条件时,字符可能是Java标识符的一部分:
- 这是一封信
- 它是货币符号(例如
'$'
) - 它是一个连接标点字符(如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable
为该字符返回true
。
- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果该字符可能是Java标识符的一部分; 否则为false
。 - 从以下版本开始:
- 1.0.2
- 另请参见:
-
isJavaLetter(char)
,isJavaIdentifierStart(char)
,isJavaIdentifierPart(char)
,isLetter(char)
,isLetterOrDigit(char)
,isUnicodeIdentifierPart(char)
,isIdentifierIgnorable(char)
-
isAlphabetic
public static boolean isAlphabetic(int codePoint)
确定指定的字符(Unicode代码点)是否为字母。如果字符的一般类别类型(由
getType(codePoint)
提供)是以下任何一种,则该字符被视为字母字符:-
UPPERCASE_LETTER
-
LOWERCASE_LETTER
-
TITLECASE_LETTER
-
MODIFIER_LETTER
-
OTHER_LETTER
-
LETTER_NUMBER
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符是Unicode字母字符,false
。 - 从以下版本开始:
- 1.7
-
-
isIdeographic
public static boolean isIdeographic(int codePoint)
确定指定的字符(Unicode代码点)是否为Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符是Unicode表意文字字符,false
。 - 从以下版本开始:
- 1.7
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(char ch)
确定指定的字符是否允许作为Java标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Java标识符:
-
isLetter(ch)
返回true
-
getType(ch)
返回LETTER_NUMBER
-
ch
是货币符号(例如'$'
) -
ch
是连接标点字符(例如'_'
)。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isJavaIdentifierStart(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符可以启动Java标识符; 否则为false
。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isJavaIdentifierPart(char)
,isLetter(char)
,isUnicodeIdentifierStart(char)
,SourceVersion.isIdentifier(CharSequence)
-
-
isJavaIdentifierStart
public static boolean isJavaIdentifierStart(int codePoint)
确定字符(Unicode代码点)是否允许作为Java标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Java标识符:
-
isLetter(codePoint)
返回true
-
getType(codePoint)
返回LETTER_NUMBER
- 引用的字符是货币符号(例如
'$'
) - 引用的字符是连接标点字符(例如
'_'
)。
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符可以启动Java标识符; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isJavaIdentifierPart(int)
,isLetter(int)
,isUnicodeIdentifierStart(int)
,SourceVersion.isIdentifier(CharSequence)
-
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(char ch)
确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。如果满足以下任何条件,则字符可能是Java标识符的一部分:
- 这是一封信
- 它是货币符号(例如
'$'
) - 它是一个连接标点字符(如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable
回报true
的字符
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isJavaIdentifierPart(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果该字符可能是Java标识符的一部分; 否则为false
。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isIdentifierIgnorable(char)
,isJavaIdentifierStart(char)
,isLetterOrDigit(char)
,isUnicodeIdentifierPart(char)
,SourceVersion.isIdentifier(CharSequence)
-
isJavaIdentifierPart
public static boolean isJavaIdentifierPart(int codePoint)
确定字符(Unicode代码点)是否可能是Java标识符的一部分,而不是第一个字符。如果满足以下任何条件,则字符可能是Java标识符的一部分:
- 这是一封信
- 它是货币符号(例如
'$'
) - 它是一个连接标点字符(如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable(codePoint)
个回报true
的字符
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符可能是Java标识符的一部分; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isIdentifierIgnorable(int)
,isJavaIdentifierStart(int)
,isLetterOrDigit(int)
,isUnicodeIdentifierPart(int)
,SourceVersion.isIdentifier(CharSequence)
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(char ch)
确定指定的字符是否允许作为Unicode标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Unicode标识符:
-
isLetter(ch)
返回true
-
getType(ch)
返回LETTER_NUMBER
。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isUnicodeIdentifierStart(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符可能启动Unicode标识符; 否则为false
。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isJavaIdentifierStart(char)
,isLetter(char)
,isUnicodeIdentifierPart(char)
-
-
isUnicodeIdentifierStart
public static boolean isUnicodeIdentifierStart(int codePoint)
确定是否允许指定的字符(Unicode代码点)作为Unicode标识符中的第一个字符。当且仅当满足下列条件之一时,字符才可以启动Unicode标识符:
-
isLetter(codePoint)
返回true
-
getType(codePoint)
返回LETTER_NUMBER
。
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符可能启动Unicode标识符; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isJavaIdentifierStart(int)
,isLetter(int)
,isUnicodeIdentifierPart(int)
-
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(char ch)
确定指定的字符是否可能是Unicode标识符的一部分,而不是第一个字符。当且仅当以下陈述之一为真时,字符可能是Unicode标识符的一部分:
- 这是一封信
- 它是一个连接标点字符(如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable
返回true
这个字符。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isUnicodeIdentifierPart(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符可能是Unicode标识符的一部分; 否则为false
。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isIdentifierIgnorable(char)
,isJavaIdentifierPart(char)
,isLetterOrDigit(char)
,isUnicodeIdentifierStart(char)
-
isUnicodeIdentifierPart
public static boolean isUnicodeIdentifierPart(int codePoint)
确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。当且仅当以下陈述之一为真时,字符可能是Unicode标识符的一部分:
- 这是一封信
- 它是一个连接标点字符(如
'_'
) - 这是一个数字
- 它是一个数字字母(例如罗马数字字符)
- 它是一个组合标记
- 它是一个非间距标记
-
isIdentifierIgnorable
为此字符返回true
。
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符可能是Unicode标识符的一部分; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isIdentifierIgnorable(int)
,isJavaIdentifierPart(int)
,isLetterOrDigit(int)
,isUnicodeIdentifierStart(int)
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(char ch)
确定指定的字符是否应被视为Java标识符或Unicode标识符中的可忽略字符。Java标识符或Unicode标识符中可以忽略以下Unicode字符:
- ISO控制字符不是空格
-
'\u0000'
至'\u0008'
-
'\u000E'
至'\u001B'
-
'\u007F'
至'\u009F'
-
- 具有
FORMAT
常规类别值的所有字符
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isIdentifierIgnorable(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符是可忽略的控制字符,可能是Java或Unicode标识符的一部分; 否则为false
。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isJavaIdentifierPart(char)
,isUnicodeIdentifierPart(char)
- ISO控制字符不是空格
-
isIdentifierIgnorable
public static boolean isIdentifierIgnorable(int codePoint)
确定指定的字符(Unicode代码点)是否应被视为Java标识符或Unicode标识符中的可忽略字符。Java标识符或Unicode标识符中可以忽略以下Unicode字符:
- ISO控制字符不是空格
-
'\u0000'
至'\u0008'
-
'\u000E'
至'\u001B'
-
'\u007F'
至'\u009F'
-
- 具有
FORMAT
常规类别值的所有字符
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符是可忽略的控制字符,可能是Java或Unicode标识符的一部分; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isJavaIdentifierPart(int)
,isUnicodeIdentifierPart(int)
- ISO控制字符不是空格
-
toLowerCase
public static char toLowerCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为小写。请注意,对于某些字符范围,
Character.isLowerCase(Character.toLowerCase(ch))
并不总是返回true
,特别是那些符号或表意符号。通常,应使用
String.toLowerCase()
将字符映射为小写。String
案例映射方法比Character
案例映射方法有几个好处。String
案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character
案例映射方法则不能。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
toLowerCase(int)
方法。- 参数
-
ch
- 要转换的字符。 - 结果
- 字符的小写等价物,如果有的话; 否则,角色本身。
- 另请参见:
-
isLowerCase(char)
,String.toLowerCase()
-
toLowerCase
public static int toLowerCase(int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写。请注意,对于某些字符范围,
Character.isLowerCase(Character.toLowerCase(codePoint))
并不总是返回true
,特别是那些符号或表意符号。通常,应使用
String.toLowerCase()
将字符映射为小写。String
案例映射方法比Character
案例映射方法有几个好处。String
案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character
案例映射方法则不能。- 参数
-
codePoint
- 要转换的字符(Unicode代码点)。 - 结果
- 字符的小写等效项(Unicode代码点),如果有的话; 否则,角色本身。
- 从以下版本开始:
- 1.5
- 另请参见:
-
isLowerCase(int)
,String.toLowerCase()
-
toUpperCase
public static char toUpperCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为大写。请注意,对于某些字符范围,
Character.isUpperCase(Character.toUpperCase(ch))
并不总是返回true
,特别是那些符号或表意符号。通常,应使用
String.toUpperCase()
将字符映射为大写。String
案例映射方法比Character
案例映射方法有几个好处。String
案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character
案例映射方法则不能。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
toUpperCase(int)
方法。- 参数
-
ch
- 要转换的字符。 - 结果
- 字符的大写等价物,如果有的话; 否则,角色本身。
- 另请参见:
-
isUpperCase(char)
,String.toUpperCase()
-
toUpperCase
public static int toUpperCase(int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为大写。请注意,对于某些字符范围,
Character.isUpperCase(Character.toUpperCase(codePoint))
并不总是返回true
,特别是那些符号或表意符号。通常,应使用
String.toUpperCase()
将字符映射为大写。String
案例映射方法比Character
案例映射方法有几个好处。String
案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character
案例映射方法则不能。- 参数
-
codePoint
- 要转换的字符(Unicode代码点)。 - 结果
- 字符的大写等价物,如果有的话; 否则,角色本身。
- 从以下版本开始:
- 1.5
- 另请参见:
-
isUpperCase(int)
,String.toUpperCase()
-
toTitleCase
public static char toTitleCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为标题。 如果一个字符没有明确的标题映射,并且根据UnicodeData本身不是一个标题字符串,那么大写映射将作为等效的标题映射返回。 如果char
参数已经是标题char
,则将返回相同的char
值。请注意,对于某些字符范围,
Character.isTitleCase(Character.toTitleCase(ch))
并不总是返回true
。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
toTitleCase(int)
方法。- 参数
-
ch
- 要转换的字符。 - 结果
- 相当于该字符的标题词,如果有的话; 否则,角色本身。
- 从以下版本开始:
- 1.0.2
- 另请参见:
-
isTitleCase(char)
,toLowerCase(char)
,toUpperCase(char)
-
toTitleCase
public static int toTitleCase(int codePoint)
使用UnicodeData文件中的案例映射信息将字符(Unicode代码点)参数转换为titlecase。 如果一个字符没有明确的标题映射,并且根据UnicodeData本身不是一个标题字符串,那么大写映射将作为等效的标题映射返回。 如果字符参数已经是标题字符,则将返回相同的字符值。请注意,对于某些字符范围,
Character.isTitleCase(Character.toTitleCase(codePoint))
并不总是返回true
。- 参数
-
codePoint
- 要转换的字符(Unicode代码点)。 - 结果
- 相当于该字符的标题词,如果有的话; 否则,角色本身。
- 从以下版本开始:
- 1.5
- 另请参见:
-
isTitleCase(int)
,toLowerCase(int)
,toUpperCase(int)
-
digit
public static int digit(char ch, int radix)
返回指定基数中字符ch
的数值。如果基数不在范围
MIN_RADIX
≤radix
≤MAX_RADIX
或者价值ch
不是指定基数的有效数字,-1
返回。 如果至少满足下列条件之一,则字符是有效数字:- 方法
isDigit
是字符的true
,并且字符的Unicode十进制数值(或其单字符分解)小于指定的基数。 在这种情况下,返回十进制数值。 - 该字符是大写拉丁字母
'A'
至'Z'
,其代码小于radix + 'A' - 10
。 在这种情况下,返回ch - 'A' + 10
。 - 该字符是小写拉丁字母
'a'
到'z'
,其代码小于radix + 'a' - 10
。 在这种情况下,返回ch - 'a' + 10
。 - 该字符是全
'\uFF21'
写拉丁字母A('\uFF21'
)到Z('\uFF3A'
)之一,其代码小于radix + '\uFF21' - 10
。 在这种情况下,返回ch - '\uFF21' + 10
。 - 该字符是全宽小写拉丁字母a(
'\uFF41'
)到z('\uFF5A'
)之一,其代码小于radix + '\uFF41' - 10
。 在这种情况下,返回ch - '\uFF41' + 10
。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
digit(int, int)
方法。- 参数
-
ch
- 要转换的字符。 -
radix
- 基数。 - 结果
- 指定基数中字符表示的数值。
- 另请参见:
-
forDigit(int, int)
,isDigit(char)
- 方法
-
digit
public static int digit(int codePoint, int radix)
返回指定基数中指定字符(Unicode代码点)的数值。如果基数不在范围
MIN_RADIX
≤radix
≤MAX_RADIX
,或者如果字符不是指定基数的有效数字,-1
返回。 如果至少满足下列条件之一,则字符是有效数字:- 方法
isDigit(codePoint)
是字符的true
,并且字符的Unicode十进制数值(或其单字符分解)小于指定的基数。 在这种情况下,返回十进制数值。 - 该字符是大写拉丁字母
'A'
至'Z'
,其代码小于radix + 'A' - 10
。 在这种情况下,返回codePoint - 'A' + 10
。 - 该字符是小写拉丁字母
'a'
至'z'
,其代码小于radix + 'a' - 10
。 在这种情况下,返回codePoint - 'a' + 10
。 - 该字符是全
'\uFF21'
写拉丁字母A('\uFF21'
)到Z('\uFF3A'
)之一,其代码小于radix + '\uFF21' - 10
。 在这种情况下,返回codePoint - '\uFF21' + 10
。 - 该字符是全宽小写拉丁字母a(
'\uFF41'
)到z('\uFF5A'
)之一,其代码小于radix + '\uFF41'- 10
。 在这种情况下,返回codePoint - '\uFF41' + 10
。
- 参数
-
codePoint
- 要转换的字符(Unicode代码点)。 -
radix
- 基数。 - 结果
- 指定基数中字符表示的数值。
- 从以下版本开始:
- 1.5
- 另请参见:
-
forDigit(int, int)
,isDigit(int)
- 方法
-
getNumericValue
public static int getNumericValue(char ch)
返回指定的Unicode字符表示的int
值。 例如,字符'\u216C'
(罗马数字50)将返回值为50的int。大写字母AZ(
'\u0041'
到'\u005A'
),小写字母('\u0061'
到'\u007A'
)和全宽变体('\uFF21'
到'\uFF3A'
和'\uFF41'
到'\uFF5A'
)形式的数值从10到35'\uFF5A'
。这与Unicode规范无关,不会为这些char
值分配数值。如果字符没有数字值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
getNumericValue(int)
方法。- 参数
-
ch
- 要转换的字符。 - 结果
- 字符的数值,作为非负
int
值; -2如果字符具有数值但该值不能表示为非负int
值; 如果字符没有数字值,则返回-1。 - 从以下版本开始:
- 1.1
- 另请参见:
-
forDigit(int, int)
,isDigit(char)
-
getNumericValue
public static int getNumericValue(int codePoint)
返回指定字符(Unicode代码点)表示的int
值。 例如,字符'\u216C'
(罗马数字50)将返回值为50的int
。在他们的大写(字母AZ
'\u0041'
通过'\u005A'
),小写('\u0061'
通过'\u007A'
()和全宽变体'\uFF21'
通过'\uFF3A'
和'\uFF41'
通过'\uFF5A'
)形式具有10到35的数值这是独立于Unicode规范,其中的不会为这些char
值分配数值。如果字符没有数字值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。
- 参数
-
codePoint
- 要转换的字符(Unicode代码点)。 - 结果
- 字符的数值,作为非负
int
值; -2如果字符具有数字值但该值不能表示为非负int
值; 如果字符没有数字值,则返回-1。 - 从以下版本开始:
- 1.5
- 另请参见:
-
forDigit(int, int)
,isDigit(int)
-
isSpace
@Deprecated(since="1.1")public static boolean isSpace(char ch)
Deprecated.Replaced by isWhitespace(char).确定指定的字符是否为ISO-LATIN-1空格。 此方法仅返回以下五个字符的true
: truechars Character Code Name'\t'
U+0009
HORIZONTAL TABULATION
'\n'
U+000A
NEW LINE
'\f'
U+000C
FORM FEED
'\r'
U+000D
CARRIAGE RETURN
' '
U+0020
SPACE
- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符是ISO-LATIN-1空格; 否则为false
。 - 另请参见:
-
isSpaceChar(char)
,isWhitespace(char)
-
isSpaceChar
public static boolean isSpaceChar(char ch)
确定指定的字符是否为Unicode空格字符。 当且仅当Unicode标准将字符指定为空格字符时,才将字符视为空格字符。 如果角色的常规类别类型是以下任何一种,则此方法返回true:-
SPACE_SEPARATOR
-
LINE_SEPARATOR
-
PARAGRAPH_SEPARATOR
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isSpaceChar(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果角色是空格字符; 否则为false
。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isWhitespace(char)
-
-
isSpaceChar
public static boolean isSpaceChar(int codePoint)
确定指定的字符(Unicode代码点)是否为Unicode空格字符。 当且仅当Unicode标准将字符指定为空格字符时,才将字符视为空格字符。 如果角色的常规类别类型是以下任何一种,则此方法返回true:- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果角色是空格字符; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isWhitespace(int)
-
isWhitespace
public static boolean isWhitespace(char ch)
根据Java确定指定的字符是否为空格。 当且仅当它满足以下条件之一时,字符才是Java空白字符:- 它是Unicode空格字符(
SPACE_SEPARATOR
,LINE_SEPARATOR
,或PARAGRAPH_SEPARATOR
),但不也是非打破空间('\u00A0'
,'\u2007'
,'\u202F'
)。 - 它是
'\t'
,U + 0009 HORIZONTAL'\t'
。 - 它是
'\n'
,U + 000A LINE FEED。 - 它是
'\u000B'
,U + 000B VERTICAL'\u000B'
。 - 它是
'\f'
,U + 000C FORM FEED。 - 它是
'\r'
,U + 000D'\r'
RETURN。 - 它是
'\u001C'
,U + 001C FILE SEPARATOR。 - 它是
'\u001D'
,U + 001D GROUP SEPARATOR。 - 它是
'\u001E'
,U + 001E RECORD SEPARATOR。 - 它是
'\u001F'
,U + 001F UNIT SEPARATOR。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isWhitespace(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符是Java空白字符; 否则为false
。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isSpaceChar(char)
- 它是Unicode空格字符(
-
isWhitespace
public static boolean isWhitespace(int codePoint)
根据Java确定指定的字符(Unicode代码点)是否为空白。 当且仅当它满足以下条件之一时,字符才是Java空白字符:- 它是Unicode空格字符(
SPACE_SEPARATOR
,LINE_SEPARATOR
,或PARAGRAPH_SEPARATOR
),但不也是非打破空间('\u00A0'
,'\u2007'
,'\u202F'
)。 - 它是
'\t'
,U + 0009 HORIZONTAL'\t'
。 - 它是
'\n'
,U + 000A LINE FEED。 - 它是
'\u000B'
,U + 000B VERTICAL'\u000B'
。 - 它是
'\f'
,U + 000C FORM FEED。 - 这是
'\r'
,U + 000D'\r'
RETURN。 - 它是
'\u001C'
,U + 001C FILE SEPARATOR。 - 它是
'\u001D'
,U + 001D GROUP SEPARATOR。 - 它是
'\u001E'
,U + 001E RECORD SEPARATOR。 - 它是
'\u001F'
,U + 001F UNIT SEPARATOR。
- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符是Java空白字符; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isSpaceChar(int)
- 它是Unicode空格字符(
-
isISOControl
public static boolean isISOControl(char ch)
确定指定的字符是否为ISO控制字符。 一个字符被认为如果其代码是在范围为ISO控制字符'\u0000'
通过'\u001F'
或在范围'\u007F'
通过'\u009F'
。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isISOControl(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
-
true
如果字符是ISO控制字符; 否则为false
。 - 从以下版本开始:
- 1.1
- 另请参见:
-
isSpaceChar(char)
,isWhitespace(char)
-
isISOControl
public static boolean isISOControl(int codePoint)
确定引用的字符(Unicode代码点)是否为ISO控制字符。 一个字符被认为如果其代码是在范围为ISO控制字符'\u0000'
通过'\u001F'
或在范围'\u007F'
通过'\u009F'
。- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果角色是ISO控制角色; 否则为false
。 - 从以下版本开始:
- 1.5
- 另请参见:
-
isSpaceChar(int)
,isWhitespace(int)
-
getType
public static int getType(char ch)
返回表示字符常规类别的值。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
getType(int)
方法。- 参数
-
ch
- 要测试的角色。 - 结果
- 类型为
int
的值,表示字符的常规类别。 - 从以下版本开始:
- 1.1
- 另请参见:
-
COMBINING_SPACING_MARK
,CONNECTOR_PUNCTUATION
,CONTROL
,CURRENCY_SYMBOL
,DASH_PUNCTUATION
,DECIMAL_DIGIT_NUMBER
,ENCLOSING_MARK
,END_PUNCTUATION
,FINAL_QUOTE_PUNCTUATION
,FORMAT
,INITIAL_QUOTE_PUNCTUATION
,LETTER_NUMBER
,LINE_SEPARATOR
,LOWERCASE_LETTER
,MATH_SYMBOL
,MODIFIER_LETTER
,MODIFIER_SYMBOL
,NON_SPACING_MARK
,OTHER_LETTER
,OTHER_NUMBER
,OTHER_PUNCTUATION
,OTHER_SYMBOL
,PARAGRAPH_SEPARATOR
,PRIVATE_USE
,SPACE_SEPARATOR
,START_PUNCTUATION
,SURROGATE
,TITLECASE_LETTER
,UNASSIGNED
,UPPERCASE_LETTER
-
getType
public static int getType(int codePoint)
返回表示字符常规类别的值。- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
- 类型为
int
的值,表示角色的常规类别。 - 从以下版本开始:
- 1.5
- 另请参见:
-
COMBINING_SPACING_MARK
,CONNECTOR_PUNCTUATION
,CONTROL
,CURRENCY_SYMBOL
,DASH_PUNCTUATION
,DECIMAL_DIGIT_NUMBER
,ENCLOSING_MARK
,END_PUNCTUATION
,FINAL_QUOTE_PUNCTUATION
,FORMAT
,INITIAL_QUOTE_PUNCTUATION
,LETTER_NUMBER
,LINE_SEPARATOR
,LOWERCASE_LETTER
,MATH_SYMBOL
,MODIFIER_LETTER
,MODIFIER_SYMBOL
,NON_SPACING_MARK
,OTHER_LETTER
,OTHER_NUMBER
,OTHER_PUNCTUATION
,OTHER_SYMBOL
,PARAGRAPH_SEPARATOR
,PRIVATE_USE
,SPACE_SEPARATOR
,START_PUNCTUATION
,SURROGATE
,TITLECASE_LETTER
,UNASSIGNED
,UPPERCASE_LETTER
-
forDigit
public static char forDigit(int digit, int radix)
确定指定基数中特定数字的字符表示形式。 如果值radix
不是有效基数,或者值digit
不是指定基数中的有效数字,则返回空字符('\u0000'
)。该
radix
参数是有效的,如果它是大于或等于MIN_RADIX
且小于或等于MAX_RADIX
。 如果0 <= digit < radix
,则digit
参数有效。如果该数字小于10,则返回
'0' + digit
。 否则,返回值'a' + digit - 10
。- 参数
-
digit
- 要转换为字符的数字。 -
radix
- 基数。 - 结果
- 指定基数中指定数字的
char
表示形式。 - 另请参见:
-
MIN_RADIX
,MAX_RADIX
,digit(char, int)
-
getDirectionality
public static byte getDirectionality(char ch)
返回给定字符的Unicode方向性属性。 字符方向性用于计算文本的视觉排序。 未定义char
值的方向性值为DIRECTIONALITY_UNDEFINED
。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
getDirectionality(int)
方法。- 参数
-
ch
-char
,其请求方向性属性。 - 结果
-
char
值的方向性属性。 - 从以下版本开始:
- 1.4
- 另请参见:
-
DIRECTIONALITY_UNDEFINED
,DIRECTIONALITY_LEFT_TO_RIGHT
,DIRECTIONALITY_RIGHT_TO_LEFT
,DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
,DIRECTIONALITY_EUROPEAN_NUMBER
,DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
,DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
,DIRECTIONALITY_ARABIC_NUMBER
,DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
,DIRECTIONALITY_NONSPACING_MARK
,DIRECTIONALITY_BOUNDARY_NEUTRAL
,DIRECTIONALITY_PARAGRAPH_SEPARATOR
,DIRECTIONALITY_SEGMENT_SEPARATOR
,DIRECTIONALITY_WHITESPACE
,DIRECTIONALITY_OTHER_NEUTRALS
,DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
,DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
,DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
,DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
,DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
,DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
,DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
,DIRECTIONALITY_FIRST_STRONG_ISOLATE
,DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
-
getDirectionality
public static byte getDirectionality(int codePoint)
- 参数
-
codePoint
- 请求方向性属性的字符(Unicode代码点)。 - 结果
- 角色的方向性。
- 从以下版本开始:
- 1.5
- 另请参见:
-
DIRECTIONALITY_UNDEFINED
,DIRECTIONALITY_LEFT_TO_RIGHT
,DIRECTIONALITY_RIGHT_TO_LEFT
,DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
,DIRECTIONALITY_EUROPEAN_NUMBER
,DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
,DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
,DIRECTIONALITY_ARABIC_NUMBER
,DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
,DIRECTIONALITY_NONSPACING_MARK
,DIRECTIONALITY_BOUNDARY_NEUTRAL
,DIRECTIONALITY_PARAGRAPH_SEPARATOR
,DIRECTIONALITY_SEGMENT_SEPARATOR
,DIRECTIONALITY_WHITESPACE
,DIRECTIONALITY_OTHER_NEUTRALS
,DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
,DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
,DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
,DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
,DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
,DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
,DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
,DIRECTIONALITY_FIRST_STRONG_ISOLATE
,DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
-
isMirrored
public static boolean isMirrored(char ch)
确定是否根据Unicode规范镜像该字符。 当以从右到左的文本显示时,镜像字符应使其字形水平镜像。 例如,'\u0028'
LEFT PARENTHESIS在语义上被定义为左括号 。 这将显示为从右到左的文本中从左到右但作为“)”的文本中的“(”。注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括增补字符),请使用
isMirrored(int)
方法。- 参数
-
ch
-char
,请求镜像属性 - 结果
-
true
如果char是镜像的,则false
如果char
未镜像或未定义。 - 从以下版本开始:
- 1.4
-
isMirrored
public static boolean isMirrored(int codePoint)
确定是否根据Unicode规范镜像指定的字符(Unicode代码点)。 当以从右到左的文本显示时,镜像字符应使其字形水平镜像。 例如,'\u0028'
LEFT PARENTHESIS在语义上被定义为左括号 。 这将显示为从右到左的文本中从左到右但作为“)”的文本中的“(”。- 参数
-
codePoint
- 要测试的字符(Unicode代码点)。 - 结果
-
true
如果字符被镜像,false
如果字符不是镜像的或没有定义。 - 从以下版本开始:
- 1.5
-
compareTo
public int compareTo(Character anotherCharacter)
以数字方式比较两个Character
对象。- Specified by:
-
compareTo
在界面Comparable<Character>
- 参数
-
anotherCharacter
- 要比较的Character
。 - 结果
- 值
0
如果参数Character
等于这个Character
; 的值小于0
,如果这Character
在数值上比少Character
参数; 如果此Character
在数值上大于Character
参数(无符号比较),则值大于0
。 请注意,这是严格的数字比较; 它不依赖于语言环境。 - 从以下版本开始:
- 1.2
-
compare
public static int compare(char x, char y)
以数字方式比较两个char
值。 返回的值与返回的值相同:Character.valueOf(x).compareTo(Character.valueOf(y))
- 参数
-
x
- 第一个char
来比较 -
y
- 第二个char
进行比较 - 结果
- 值
0
如果x == y
; 小于0
的值,如果x < y
; 如果为0
则值大于x > y
- 从以下版本开始:
- 1.7
-
reverseBytes
public static char reverseBytes(char ch)
返回通过反转指定的char
值中的字节顺序获得的值。- 参数
-
ch
- 其中char
反转字节顺序。 - 结果
- 通过反转(或等效地,交换)指定的
char
值中的字节获得的值。 - 从以下版本开始:
- 1.5
-
getName
public static String getName(int codePoint)
返回指定字符codePoint
的Unicode名称,如果代码点为unassigned
,则返回null。注意:如果未通过UnicodeData文件(由Unicode Consortium维护的Unicode字符数据库的一部分)为指定的字符分配名称,则返回的名称与表达式的结果相同。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
- 参数
-
codePoint
- 字符(Unicode代码点) - 结果
- 指定字符的Unicode名称,如果未分配代码点,则返回null。
- 异常
-
IllegalArgumentException
- 如果指定的codePoint
不是有效的Unicode代码点。 - 从以下版本开始:
- 1.7
-
codePointOf
public static int codePointOf(String name)
返回给定Unicode字符名称指定的Unicode字符的代码点值。注意:如果UnicodeData文件(由Unicode Consortium维护的Unicode字符数据库的一部分)未为字符分配名称,则其名称将定义为表达式的结果
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
name
匹配不区分大小写,删除了任何前导和尾随空格字符。- 参数
-
name
- Unicode字符名称 - 结果
- 由其名称指定的字符的代码点值。
- 异常
-
IllegalArgumentException
- 如果指定的name
不是有效的Unicode字符名称。 -
NullPointerException
- 如果name
是null
- 从以下版本开始:
- 9
-
-