模块  java.base
软件包  java.lang

Class Character

  • 实现的所有接口
    SerializableComparable<Character>

    public final class Characterextends Objectimplements Serializable, Comparable<Character>
    Character类在对象中包装基本类型char的值。 类型为Character的对象包含单个字段,其类型为char

    此外,该类提供了几种方法来确定字符的类别(小写字母,数字等)以及将字符从大写转换为小写,反之亦然。

    字符信息基于Unicode标准10.0.0版。

    Character的方法和数据由UnicodeData文件中的信息定义,该文件是Unicode Consortium维护的Unicode字符数据库的一部分。 此文件指定各种属性,包括每个已定义的Unicode代码点或字符范围的名称和常规类别。

    该文件及其描述可从Unicode Consortium获得:

    Unicode Character Representations

    char数据类型(因此Character对象封装的值)基于原始Unicode规范,该规范将字符定义为固定宽度的16位实体。 此后,Unicode标准已更改为允许表示形式需要16位以上的字符。 合法代码点 s的范围现在是U + 0000到U + 10FFFF,称为Unicode标量值 (请参阅Unicode标准中U + n表示法的 definition.

    The set of characters from U+0000 to U+FFFF有时被称为基本多语言平面(BMP) 代码点大于U + FFFF的Characters称为补充字符 s。 Java平台使用char数组和StringStringBuffer类中的UTF-16表示。 在此表示中,补充字符表示为一对char值,第一个来自高代理范围(\ uD800- \ uDBFF),第二个来自低代理范围(\ uDC00- \ uDFFF)。

    因此, char值表示基本多语言平面(BMP)代码点,包括代理代码点或UTF-16编码的代码单元。 int值表示所有Unicode代码点,包括补充代码点。 int的较低(最低有效)21位用于表示Unicode代码点,而较高(最高有效)11位必须为零。 除非另有说明,否则关于补充字符和代理char值的行为如下:

    • 仅接受char值的方法不支持增补字符。 它们将代理范围中的char值视为未定义的字符。 例如, Character.isLetter('\uD840')返回false ,即使此字符串中的任何低代理值后面的特定值也表示字母。
    • 接受int值的方法支持所有Unicode字符,包括增补字符。 例如, Character.isLetter(0x2F81A)返回true因为代码点值表示一个字母(CJK表意文字)。

    在Java SE API文档中, Unicode代码点用于U + 0000和U + 10FFFF之间的字符值, Unicode代码单元用于16位char值,这些值是UTF-16编码的代码单元。 有关Unicode术语的更多信息,请参阅Unicode Glossary

    从以下版本开始:
    1.0
    另请参见:
    Serialized Form
    • 构造方法摘要

      构造方法  
      构造器 描述
      Character​(char value)
      已过时。
      使用此构造函数很少是合适的。
    • 方法摘要

      所有方法  静态方法  实例方法 具体的方法  弃用的方法 
      变量和类型 方法 描述
      static int charCount​(int codePoint)
      确定表示指定字符(Unicode代码点)所需的 char值的数量。
      char charValue()
      返回此 Character对象的值。
      static int codePointAt​(char[] a, int index)
      返回 char数组的给定索引处的代码点。
      static int codePointAt​(char[] a, int index, int limit)
      返回 char数组的给定索引处的代码点,其中只能使用 index小于 limit数组元素。
      static int codePointAt​(CharSequence seq, int index)
      返回 CharSequence的给定索引处的代码点。
      static int codePointBefore​(char[] a, int index)
      返回 char数组的给定索引之前的代码点。
      static int codePointBefore​(char[] a, int index, int start)
      返回 char数组的给定索引之前的代码点,其中只能使用 index大于或等于 start数组元素。
      static int codePointBefore​(CharSequence seq, int index)
      返回 CharSequence的给定索引之前的代码点。
      static int codePointCount​(char[] a, int offset, int count)
      返回 char数组参数的子数组中的Unicode代码点数。
      static int codePointCount​(CharSequence seq, int beginIndex, int endIndex)
      返回指定char序列的文本范围内的Unicode代码点数。
      static int codePointOf​(String name)
      返回给定Unicode字符名称指定的Unicode字符的代码点值。
      static int compare​(char x, char y)
      以数字方式比较两个 char值。
      int compareTo​(Character anotherCharacter)
      以数字方式比较两个 Character对象。
      static int digit​(char ch, int radix)
      返回指定基数中的字符 ch的数值。
      static int digit​(int codePoint, int radix)
      返回指定基数中指定字符(Unicode代码点)的数值。
      boolean equals​(Object obj)
      将此对象与指定的对象进行比较。
      static char forDigit​(int digit, int radix)
      确定指定基数中特定数字的字符表示形式。
      static byte getDirectionality​(char ch)
      返回给定字符的Unicode方向性属性。
      static byte getDirectionality​(int codePoint)
      返回给定字符的Unicode方向性属性(Unicode代码点)。
      static String getName​(int codePoint)
      返回指定字符 codePoint的Unicode名称,如果代码点为 unassigned ,则返回null。
      static int getNumericValue​(char ch)
      返回指定的Unicode字符表示的 int值。
      static int getNumericValue​(int codePoint)
      返回指定字符(Unicode代码点)表示的 int值。
      static int getType​(char ch)
      返回表示字符常规类别的值。
      static int getType​(int codePoint)
      返回表示字符常规类别的值。
      int hashCode()
      返回此Character的哈希码; 等于调用charValue()的结果。
      static int hashCode​(char value)
      返回char值的哈希码; Character.hashCode()兼容。
      static char highSurrogate​(int codePoint)
      返回主导替代(一个 high surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。
      static boolean isAlphabetic​(int codePoint)
      确定指定的字符(Unicode代码点)是否为字母。
      static boolean isBmpCodePoint​(int codePoint)
      确定指定的字符(Unicode代码点)是否在 Basic Multilingual Plane (BMP)中
      static boolean isDefined​(char ch)
      确定是否在Unicode中定义了字符。
      static boolean isDefined​(int codePoint)
      确定是否在Unicode中定义了字符(Unicode代码点)。
      static boolean isDigit​(char ch)
      确定指定的字符是否为数字。
      static boolean isDigit​(int codePoint)
      确定指定的字符(Unicode代码点)是否为数字。
      static boolean isHighSurrogate​(char ch)
      确定给定的 char值是否为 Unicode high-surrogate code unit (也称为 前导代理代码单元 )。
      static boolean isIdentifierIgnorable​(char ch)
      确定指定的字符是否应被视为Java标识符或Unicode标识符中的可忽略字符。
      static boolean isIdentifierIgnorable​(int codePoint)
      确定指定的字符(Unicode代码点)是否应被视为Java标识符或Unicode标识符中的可忽略字符。
      static boolean isIdeographic​(int codePoint)
      确定指定的字符(Unicode代码点)是否为Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。
      static boolean isISOControl​(char ch)
      确定指定的字符是否为ISO控制字符。
      static boolean isISOControl​(int codePoint)
      确定引用的字符(Unicode代码点)是否为ISO控制字符。
      static boolean isJavaIdentifierPart​(char ch)
      确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。
      static boolean isJavaIdentifierPart​(int codePoint)
      确定字符(Unicode代码点)是否可能是Java标识符的一部分,而不是第一个字符。
      static boolean isJavaIdentifierStart​(char ch)
      确定指定的字符是否允许作为Java标识符中的第一个字符。
      static boolean isJavaIdentifierStart​(int codePoint)
      确定字符(Unicode代码点)是否允许作为Java标识符中的第一个字符。
      static boolean isJavaLetter​(char ch)
      已过时。
      替换为isJavaIdentifierStart(char)。
      static boolean isJavaLetterOrDigit​(char ch)
      已过时。
      替换为isJavaIdentifierPart(char)。
      static boolean isLetter​(char ch)
      确定指定的字符是否为字母。
      static boolean isLetter​(int codePoint)
      确定指定的字符(Unicode代码点)是否为字母。
      static boolean isLetterOrDigit​(char ch)
      确定指定的字符是字母还是数字。
      static boolean isLetterOrDigit​(int codePoint)
      确定指定的字符(Unicode代码点)是字母还是数字。
      static boolean isLowerCase​(char ch)
      确定指定的字符是否为小写字符。
      static boolean isLowerCase​(int codePoint)
      确定指定的字符(Unicode代码点)是否为小写字符。
      static boolean isLowSurrogate​(char ch)
      确定给定的 char值是否为 Unicode low-surrogate code unit (也称为 trailing-surrogate代码单元 )。
      static boolean isMirrored​(char ch)
      确定是否根据Unicode规范镜像该字符。
      static boolean isMirrored​(int codePoint)
      确定是否根据Unicode规范镜像指定的字符(Unicode代码点)。
      static boolean isSpace​(char ch)
      已过时。
      替换为isWhitespace(char)。
      static boolean isSpaceChar​(char ch)
      确定指定的字符是否为Unicode空格字符。
      static boolean isSpaceChar​(int codePoint)
      确定指定的字符(Unicode代码点)是否为Unicode空格字符。
      static boolean isSupplementaryCodePoint​(int codePoint)
      确定指定的字符(Unicode代码点)是否在 supplementary character范围内。
      static boolean isSurrogate​(char ch)
      确定给定的 char值是否为Unicode 代理代码单元
      static boolean isSurrogatePair​(char high, char low)
      确定指定的 char值对是否为有效 Unicode surrogate pair
      static boolean isTitleCase​(char ch)
      确定指定的字符是否为标题字符。
      static boolean isTitleCase​(int codePoint)
      确定指定的字符(Unicode代码点)是否为标题字符。
      static boolean isUnicodeIdentifierPart​(char ch)
      确定指定的字符是否可能是Unicode标识符的一部分,而不是第一个字符。
      static boolean isUnicodeIdentifierPart​(int codePoint)
      确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。
      static boolean isUnicodeIdentifierStart​(char ch)
      确定指定的字符是否允许作为Unicode标识符中的第一个字符。
      static boolean isUnicodeIdentifierStart​(int codePoint)
      确定是否允许指定的字符(Unicode代码点)作为Unicode标识符中的第一个字符。
      static boolean isUpperCase​(char ch)
      确定指定的字符是否为大写字符。
      static boolean isUpperCase​(int codePoint)
      确定指定的字符(Unicode代码点)是否为大写字符。
      static boolean isValidCodePoint​(int codePoint)
      确定指定的代码点是否有效 Unicode code point value
      static boolean isWhitespace​(char ch)
      根据Java确定指定的字符是否为空格。
      static boolean isWhitespace​(int codePoint)
      根据Java确定指定的字符(Unicode代码点)是否为空白。
      static char lowSurrogate​(int codePoint)
      返回尾随替代(一个 low surrogate code unit所述的) surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。
      static int offsetByCodePoints​(char[] a, int start, int count, int index, int codePointOffset)
      返回给定的索引 char子阵是从给定的偏移 indexcodePointOffset代码点。
      static int offsetByCodePoints​(CharSequence seq, int index, int codePointOffset)
      返回给定char序列中的索引,该索引从给定的 index偏移 codePointOffset代码点。
      static char reverseBytes​(char ch)
      返回通过反转指定的 char值中的字节顺序获得的值。
      static char[] toChars​(int codePoint)
      将指定字符(Unicode代码点)转换为存储在 char数组中的UTF-16表示形式。
      static int toChars​(int codePoint, char[] dst, int dstIndex)
      将指定字符(Unicode代码点)转换为其UTF-16表示形式。
      static int toCodePoint​(char high, char low)
      将指定的代理项对转换为其补充代码点值。
      static char toLowerCase​(char ch)
      使用UnicodeData文件中的大小写映射信息将字符参数转换为小写。
      static int toLowerCase​(int codePoint)
      使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写。
      String toString()
      返回表示此 Character值的 String对象。
      static String toString​(char c)
      返回表示指定的 charString对象。
      static String toString​(int codePoint)
      返回表示指定字符(Unicode代码点)的 String对象。
      static char toTitleCase​(char ch)
      使用UnicodeData文件中的大小写映射信息将字符参数转换为标题。
      static int toTitleCase​(int codePoint)
      使用UnicodeData文件中的案例映射信息将字符(Unicode代码点)参数转换为titlecase。
      static char toUpperCase​(char ch)
      使用UnicodeData文件中的大小写映射信息将字符参数转换为大写。
      static int toUpperCase​(int codePoint)
      使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为大写。
      static Character valueOf​(char c)
      返回表示指定的 char值的 Character实例。
    • 字段详细信息

      • MIN_VALUE

        public static final char MIN_VALUE
        此字段的常量值是类型 char '\u0000'
        从以下版本开始:
        1.0.2
        另请参见:
        常数字段值
      • MAX_VALUE

        public static final char MAX_VALUE
        此字段的常量值是类型 char '\uFFFF'
        从以下版本开始:
        1.0.2
        另请参见:
        常数字段值
      • TYPE

        public static final <Character> TYPE
        实例表示基本类型 char
        从以下版本开始:
        1.1
      • UNASSIGNED

        public static final byte UNASSIGNED
        Unicode规范中的常规类别“Cn”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • UPPERCASE_LETTER

        public static final byte UPPERCASE_LETTER
        Unicode规范中的常规类别“Lu”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • LOWERCASE_LETTER

        public static final byte LOWERCASE_LETTER
        Unicode规范中的常规类别“Ll”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • TITLECASE_LETTER

        public static final byte TITLECASE_LETTER
        Unicode规范中的常规类别“Lt”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • MODIFIER_LETTER

        public static final byte MODIFIER_LETTER
        Unicode规范中的常规类别“Lm”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • OTHER_LETTER

        public static final byte OTHER_LETTER
        Unicode规范中的常规类别“Lo”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • NON_SPACING_MARK

        public static final byte NON_SPACING_MARK
        Unicode规范中的常规类别“Mn”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • ENCLOSING_MARK

        public static final byte ENCLOSING_MARK
        Unicode规范中的常规类别“Me”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • COMBINING_SPACING_MARK

        public static final byte COMBINING_SPACING_MARK
        Unicode规范中的常规类别“Mc”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • DECIMAL_DIGIT_NUMBER

        public static final byte DECIMAL_DIGIT_NUMBER
        Unicode规范中的常规类别“Nd”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • LETTER_NUMBER

        public static final byte LETTER_NUMBER
        Unicode规范中的常规类别“Nl”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • OTHER_NUMBER

        public static final byte OTHER_NUMBER
        Unicode规范中的常规类别“否”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • SPACE_SEPARATOR

        public static final byte SPACE_SEPARATOR
        Unicode规范中的常规类别“Zs”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • LINE_SEPARATOR

        public static final byte LINE_SEPARATOR
        Unicode规范中的常规类别“Zl”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • PARAGRAPH_SEPARATOR

        public static final byte PARAGRAPH_SEPARATOR
        Unicode规范中的常规类别“Zp”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • CONTROL

        public static final byte CONTROL
        Unicode规范中的常规类别“Cc”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • FORMAT

        public static final byte FORMAT
        Unicode规范中的常规类别“Cf”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • PRIVATE_USE

        public static final byte PRIVATE_USE
        Unicode规范中的常规类别“Co”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • SURROGATE

        public static final byte SURROGATE
        Unicode规范中的常规类别“Cs”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • DASH_PUNCTUATION

        public static final byte DASH_PUNCTUATION
        Unicode规范中的常规类别“Pd”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • START_PUNCTUATION

        public static final byte START_PUNCTUATION
        Unicode规范中的常规类别“Ps”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • END_PUNCTUATION

        public static final byte END_PUNCTUATION
        Unicode规范中的常规类别“Pe”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • CONNECTOR_PUNCTUATION

        public static final byte CONNECTOR_PUNCTUATION
        Unicode规范中的常规类别“Pc”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • OTHER_PUNCTUATION

        public static final byte OTHER_PUNCTUATION
        Unicode规范中的常规类别“Po”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • MATH_SYMBOL

        public static final byte MATH_SYMBOL
        Unicode规范中的常规类别“Sm”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • CURRENCY_SYMBOL

        public static final byte CURRENCY_SYMBOL
        Unicode规范中的常规类别“Sc”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • MODIFIER_SYMBOL

        public static final byte MODIFIER_SYMBOL
        Unicode规范中的常规类别“Sk”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • OTHER_SYMBOL

        public static final byte OTHER_SYMBOL
        Unicode规范中的常规类别“So”。
        从以下版本开始:
        1.1
        另请参见:
        常数字段值
      • INITIAL_QUOTE_PUNCTUATION

        public static final byte INITIAL_QUOTE_PUNCTUATION
        Unicode规范中的常规类别“Pi”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • FINAL_QUOTE_PUNCTUATION

        public static final byte FINAL_QUOTE_PUNCTUATION
        Unicode规范中的常规类别“Pf”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_UNDEFINED

        public static final byte DIRECTIONALITY_UNDEFINED
        未定义的双向字符类型。 未定义的char值在Unicode规范中具有未定义的方向性。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_LEFT_TO_RIGHT

        public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
        Unicode规范中的强双向字符类型“L”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_RIGHT_TO_LEFT

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
        Unicode规范中的强双向字符类型“R”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
        Unicode规范中的强双向字符类型“AL”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_EUROPEAN_NUMBER

        public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
        Unicode规范中的弱双向字符类型“EN”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR

        public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
        Unicode规范中的弱双向字符类型“ES”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR

        public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
        Unicode规范中的弱双向字符类型“ET”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_ARABIC_NUMBER

        public static final byte DIRECTIONALITY_ARABIC_NUMBER
        Unicode规范中的弱双向字符类型“AN”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_COMMON_NUMBER_SEPARATOR

        public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
        Unicode规范中的弱双向字符类型“CS”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_NONSPACING_MARK

        public static final byte DIRECTIONALITY_NONSPACING_MARK
        Unicode规范中的弱双向字符类型“NSM”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_BOUNDARY_NEUTRAL

        public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
        Unicode规范中的弱双向字符类型“BN”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_PARAGRAPH_SEPARATOR

        public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
        Unicode规范中的中性双向字符类型“B”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_SEGMENT_SEPARATOR

        public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
        Unicode规范中的中性双向字符类型“S”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_WHITESPACE

        public static final byte DIRECTIONALITY_WHITESPACE
        Unicode规范中的中性双向字符类型“WS”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_OTHER_NEUTRALS

        public static final byte DIRECTIONALITY_OTHER_NEUTRALS
        Unicode规范中的中性双向字符类型“ON”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING

        public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
        Unicode规范中的强双向字符类型“LRE”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE

        public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
        Unicode规范中的强双向字符类型“LRO”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
        Unicode规范中的强双向字符类型“RLE”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
        Unicode规范中的强双向字符类型“RLO”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_POP_DIRECTIONAL_FORMAT

        public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
        Unicode规范中的弱双向字符类型“PDF”。
        从以下版本开始:
        1.4
        另请参见:
        常数字段值
      • DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE

        public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_ISOLATE
        Unicode规范中的弱双向字符类型“LRI”。
        从以下版本开始:
        9
        另请参见:
        常数字段值
      • DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE

        public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ISOLATE
        Unicode规范中的弱双向字符类型“RLI”。
        从以下版本开始:
        9
        另请参见:
        常数字段值
      • DIRECTIONALITY_FIRST_STRONG_ISOLATE

        public static final byte DIRECTIONALITY_FIRST_STRONG_ISOLATE
        Unicode规范中的弱双向字符类型“FSI”。
        从以下版本开始:
        9
        另请参见:
        常数字段值
      • DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE

        public static final byte DIRECTIONALITY_POP_DIRECTIONAL_ISOLATE
        Unicode规范中的弱双向字符类型“PDI”。
        从以下版本开始:
        9
        另请参见:
        常数字段值
      • MIN_HIGH_SURROGATE

        public static final char MIN_HIGH_SURROGATE
        UTF-16编码中Unicode high-surrogate code unit的最小值,常量'\uD800' 高代理人也被称为领导代理人
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • MAX_HIGH_SURROGATE

        public static final char MAX_HIGH_SURROGATE
        UTF-16编码中的最大值为Unicode high-surrogate code unit ,常量为'\uDBFF' 高代理人也被称为领导代理人
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • MIN_LOW_SURROGATE

        public static final char MIN_LOW_SURROGATE
        UTF-16编码中Unicode low-surrogate code unit的最小值,常量'\uDC00' 低代理也被称为尾随代理
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • MAX_LOW_SURROGATE

        public static final char MAX_LOW_SURROGATE
        UTF-16编码中的最大值Unicode low-surrogate code unit ,常量'\uDFFF' 低代理也被称为尾随代理
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • MIN_SURROGATE

        public static final char MIN_SURROGATE
        UTF-16编码中Unicode代理项代码单元的最小值,常量 '\uD800'
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • MAX_SURROGATE

        public static final char MAX_SURROGATE
        UTF-16编码中Unicode代理项代码单元的最大值,常量 '\uDFFF'
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • MIN_CODE_POINT

        public static final int MIN_CODE_POINT
        最小值 Unicode code point ,常数 U+0000
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • MAX_CODE_POINT

        public static final int MAX_CODE_POINT
        最大值 Unicode code point ,常数 U+10FFFF
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • SIZE

        public static final int SIZE
        用于表示无符号二进制形式的 char值的位数,常量 16
        从以下版本开始:
        1.5
        另请参见:
        常数字段值
      • BYTES

        public static final int BYTES
        用于表示无符号二进制形式的 char值的字节数。
        从以下版本开始:
        1.8
        另请参见:
        常数字段值
    • 构造方法详细信息

      • Character

        @Deprecated(since="9")public Character​(char value)
        Deprecated.
        It is rarely appropriate to use this constructor. The static factory valueOf(char) is generally a better choice, as it is likely to yield significantly better space and time performance.
        构造一个新分配的 Character对象,该对象表示指定的 char值。
        参数
        value - 要由 Character对象表示的值。
    • 方法详细信息

      • valueOf

        public static Character valueOf​(char c)
        返回表示指定的char值的Character实例。 如果不需要新的Character实例,则通常应优先使用此方法,而不是构造函数Character(char) ,因为此方法可能通过缓存频繁请求的值来显着提高空间和时间性能。 此方法将始终缓存'\u0000''\u007F'范围内的值,并且可以缓存此范围之外的其他值。
        参数
        c - char值。
        结果
        Character实例,代表 c
        从以下版本开始:
        1.5
      • charValue

        public char charValue()
        返回此 Character对象的值。
        结果
        此对象表示的原始值 char
      • hashCode

        public static int hashCode​(char value)
        返回char值的哈希码; Character.hashCode()兼容。
        参数
        value - 要为其返回哈希码的 char
        结果
        char值的哈希码值。
        从以下版本开始:
        1.8
      • equals

        public boolean equals​(Object obj)
        将此对象与指定的对象进行比较。 当且仅当参数不是null并且是Character对象时,结果为true ,该对象表示与此对象相同的char值。
        重写:
        equals在类 Object
        参数
        obj - 要与之比较的对象。
        结果
        true如果对象相同; 否则为false
        另请参见:
        Object.hashCode()HashMap
      • toString

        public String toString()
        返回表示此Character值的String对象。 其结果是长度为1的串,其唯一分量是原始char由该表示值Character对象。
        重写:
        toString在类 Object
        结果
        此对象的字符串表示形式。
      • toString

        public static String toString​(char c)
        返回表示指定的charString对象。 结果是一个长度为1的字符串,仅由指定的char
        API Note:
        此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用toString(int)方法。
        参数
        c - 要转换的 char
        结果
        指定的 char的字符串表示 char
        从以下版本开始:
        1.4
      • toString

        public static String toString​(int codePoint)
        返回表示指定字符(Unicode代码点)的String对象。 结果是一个长度为1或2的字符串,仅由指定的codePoint
        参数
        codePoint - 要转换的 codePoint
        结果
        指定的 codePoint的字符串表示 codePoint
        异常
        IllegalArgumentException - 如果指定的 codePoint不是 valid Unicode code point
        从以下版本开始:
        11
      • isValidCodePoint

        public static boolean isValidCodePoint​(int codePoint)
        确定指定的代码点是否有效 Unicode code point value
        参数
        codePoint - 要测试的Unicode代码点
        结果
        true如果指定的代码点值介于MIN_CODE_POINTMAX_CODE_POINT之间; 否则为false
        从以下版本开始:
        1.5
      • isBmpCodePoint

        public static boolean isBmpCodePoint​(int codePoint)
        确定指定的字符(Unicode代码点)是否在Basic Multilingual Plane (BMP)中 这些代码点可以使用单个char表示。
        参数
        codePoint - 要测试的字符(Unicode代码点)
        结果
        true如果指定的代码点介于MIN_VALUEMAX_VALUE之间; 否则为false
        从以下版本开始:
        1.7
      • isSupplementaryCodePoint

        public static boolean isSupplementaryCodePoint​(int codePoint)
        确定指定的字符(Unicode代码点)是否在 supplementary character范围内。
        参数
        codePoint - 要测试的字符(Unicode代码点)
        结果
        true如果指定的代码点介于MIN_SUPPLEMENTARY_CODE_POINTMAX_CODE_POINT之间; 否则为false
        从以下版本开始:
        1.5
      • isSurrogatePair

        public static boolean isSurrogatePair​(char high,                                      char low)
        确定指定的char值对是否为有效Unicode surrogate pair

        此方法等效于表达式:

         isHighSurrogate(high) && isLowSurrogate(low) 
        参数
        high - 要测试的高代理代码值
        low - 要测试的低代理代码值
        结果
        true如果指定的高代理代理值和低代理代码值代表有效的代理对; 否则为false
        从以下版本开始:
        1.5
      • charCount

        public static int charCount​(int codePoint)
        确定表示指定字符(Unicode代码点)所需的char值的数量。 如果指定的字符等于或大于0x10000,则该方法返回2.否则,该方法返回1。

        此方法不会将指定的字符验证为有效的Unicode代码点。 如有必要,调用者必须使用isValidCodePoint验证字符值。

        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        2如果角色是有效的补充角色; 否则为1。
        从以下版本开始:
        1.5
        另请参见:
        isSupplementaryCodePoint(int)
      • toCodePoint

        public static int toCodePoint​(char high,                              char low)
        将指定的代理项对转换为其补充代码点值。 此方法不验证指定的代理项对。 如有必要,呼叫者必须使用isSurrogatePair对其进行验证。
        参数
        high - 高代理代码单元
        low - 低代理代码单元
        结果
        由指定的代理对组成的补充代码点。
        从以下版本开始:
        1.5
      • codePointAt

        public static int codePointAt​(CharSequence seq,                              int index)
        返回CharSequence的给定索引处的代码点。 如果char给定索引处的值CharSequence处于高代理项范围,下列指数小于所述长度CharSequence ,并且char以下索引处的值是在低代理项范围内,则所述辅助返回与此代理项对相对应的代码点。 否则,返回给定索引处的char值。
        参数
        seq - 一系列 char值(Unicode代码单元)
        index - 要转换的 char值(Unicode代码单位)的 seq
        结果
        给定索引处的Unicode代码点
        异常
        NullPointerException - 如果 seq为空。
        IndexOutOfBoundsException - 如果值 index为负数或不小于 seq.length()
        从以下版本开始:
        1.5
      • codePointAt

        public static int codePointAt​(char[] a,                              int index)
        返回char数组的给定索引处的代码点。 如果char数组中给定索引处的char值处于高代理范围内,则以下索引小于char数组的长度,并且以下索引处的char值处于低代理范围内,则返回与该代理对相对应的补充代码点。 否则,返回给定索引处的char值。
        参数
        a - 数组 char
        index - 要转换的 char数组中 char值(Unicode代码单位)的 char
        结果
        给定索引处的Unicode代码点
        异常
        NullPointerException - 如果 a为空。
        IndexOutOfBoundsException - 如果值 index为负数或不小于 char数组的长度。
        从以下版本开始:
        1.5
      • codePointAt

        public static int codePointAt​(char[] a,                              int index,                              int limit)
        返回char数组的给定索引处的代码点,其中只能使用index小于limit数组元素。 如果char数组中给定索引处的char值处于高代理范围内,则以下索引小于limit ,并且以下索引处的char值处于低代理范围,然后是补充代码点对应于此代理项对返回。 否则,返回给定索引处的char值。
        参数
        a - char数组
        index - 要转换的 char数组中 char值(Unicode代码单位)的 char
        limit - 可在 char数组中使用的最后一个数组元素之后的索引
        结果
        给定索引处的Unicode代码点
        异常
        NullPointerException - 如果 a为空。
        IndexOutOfBoundsException - 如果 index参数为负或不小于 limit参数,或者 limit参数为负或大于 char数组的长度。
        从以下版本开始:
        1.5
      • codePointBefore

        public static int codePointBefore​(CharSequence seq,                                  int index)
        返回CharSequence的给定索引之前的代码点。 如果char在值(index - 1)CharSequence处于低代理项范围, (index - 2)不为负,并且char在值(index - 2)CharSequence处于高代理项范围内,则对应于该代理对的增补代码点是回。 否则,返回char(index - 1)
        参数
        seq - CharSequence实例
        index - 应返回的代码点后面的索引
        结果
        给定索引之前的Unicode代码点值。
        异常
        NullPointerException - 如果 seq为空。
        IndexOutOfBoundsException - 如果 index参数小于1或大于 seq.length()
        从以下版本开始:
        1.5
      • codePointBefore

        public static int codePointBefore​(char[] a,                                  int index)
        返回char数组的给定索引之前的代码点。 如果char在值(index - 1)char阵列是在低代理项范围, (index - 2)不为负,并且char在值(index - 2)char阵列在高代理项范围内,则对应于该替代的增补代码点对返回。 否则,返回char(index - 1)
        参数
        a - char数组
        index - 应返回的代码点后面的索引
        结果
        给定索引之前的Unicode代码点值。
        异常
        NullPointerException - 如果 a为空。
        IndexOutOfBoundsException - 如果 index参数小于1或大于 char数组的长度
        从以下版本开始:
        1.5
      • codePointBefore

        public static int codePointBefore​(char[] a,                                  int index,                                  int start)
        返回char数组的给定索引之前的代码点,其中只能使用index大于或等于start数组元素。 如果char在值(index - 1)char阵列是在低代理项范围, (index - 2)不小于start ,并且char在值(index - 2)char阵列在高代理项范围内,则对应于所述补充代码点这个替代对被退回。 否则,返回char(index - 1)
        参数
        a - char数组
        index - 应返回的代码点后面的索引
        start - char数组中第一个数组元素的 char
        结果
        给定索引之前的Unicode代码点值。
        异常
        NullPointerException - 如果 a为空。
        IndexOutOfBoundsException - 如果 index参数不大于 start参数或大于 char数组的长度,或者 start参数为负或不小于 char数组的长度。
        从以下版本开始:
        1.5
      • toChars

        public static int toChars​(int codePoint,                          char[] dst,                          int dstIndex)
        将指定字符(Unicode代码点)转换为其UTF-16表示形式。 如果指定的代码点是BMP(基本多语言平面或平面0)值,则相同的值存储在dst[dstIndex] ,并返回1。 如果指定的代码点是补充字符,则其代理值存储在dst[dstIndex] (high-surrogate)和dst[dstIndex+1] (low-surrogate)中,并返回2。
        参数
        codePoint - 要转换的字符(Unicode代码点)。
        dst -的阵列 char ,其中 codePoint的UTF-16值被存储。
        dstIndex - 存储转换值的 dst数组的起始索引。
        结果
        如果代码点是BMP代码点,则为1;如果代码点是补充代码点,则为2。
        异常
        IllegalArgumentException - 如果指定的 codePoint不是有效的Unicode代码点。
        NullPointerException - 如果指定的 dst为空。
        IndexOutOfBoundsException - 如果dstIndex为负数或不小于dst.length ,或者如果dstdstIndex没有足够的数组元素来存储生成的char值。 (如果dstIndex等于dst.length-1且指定的codePoint是补充字符,则高代理值不会存储在dst[dstIndex] 。)
        从以下版本开始:
        1.5
      • toChars

        public static char[] toChars​(int codePoint)
        将指定字符(Unicode代码点)转换为存储在char数组中的UTF-16表示形式。 如果指定的代码点是BMP(基本多语言平面或平面0)值,则生成的char数组具有与codePoint相同的值。 如果指定的代码点是补充代码点,则生成的char数组具有相应的代理项对。
        参数
        codePoint - Unicode代码点
        结果
        具有 codePoint的UTF-16表示的 char阵列。
        异常
        IllegalArgumentException - 如果指定的 codePoint不是有效的Unicode代码点。
        从以下版本开始:
        1.5
      • codePointCount

        public static int codePointCount​(CharSequence seq,                                 int beginIndex,                                 int endIndex)
        返回指定char序列的文本范围内的Unicode代码点数。 文本范围开始在指定的beginIndex ,并延伸到char在索引endIndex - 1 因此,文本范围的长度(在char s中)是endIndex-beginIndex 文本范围内的未配对代理计为每个代码点。
        参数
        seq - 字符序列
        beginIndex - 文本范围的第一个 char的索引。
        endIndex - 文本范围的最后 char之后的索引。
        结果
        指定文本范围内的Unicode代码点数
        异常
        NullPointerException - 如果 seq为空。
        IndexOutOfBoundsException - 如果 beginIndex为负数,或者 endIndex大于给定序列的长度,或者 beginIndex大于 endIndex
        从以下版本开始:
        1.5
      • codePointCount

        public static int codePointCount​(char[] a,                                 int offset,                                 int count)
        返回char数组参数的子数组中的Unicode代码点数。 offset参数是子阵列的第一个char的索引, count参数指定char s char阵列的长度。 子阵列中的未配对代理计为每个代码点。
        参数
        a - char数组
        offset - 给定 char数组中第一个 char的索引
        count - char阵列的长度
        结果
        指定子数组中的Unicode代码点数
        异常
        NullPointerException - 如果 a为空。
        IndexOutOfBoundsException - 如果 offsetcount为负数,或者 offset + count大于给定数组的长度。
        从以下版本开始:
        1.5
      • offsetByCodePoints

        public static int offsetByCodePoints​(CharSequence seq,                                     int index,                                     int codePointOffset)
        返回给定char序列中的索引,该索引从给定的index偏移codePointOffset代码点。 indexcodePointOffset给出的文本范围内的未配对代理计为每个代码点。
        参数
        seq - 字符序列
        index - 要偏移的索引
        codePointOffset - 代码点中的偏移量
        结果
        char序列中的索引
        异常
        NullPointerException - 如果 seq为空。
        IndexOutOfBoundsException - 如果 index为负数或大于char序列的长度,或者如果 codePointOffset为正且从 index开始的子 index少于 codePointOffset代码点,或者如果 codePointOffset为负且 index之前的子 index小于绝对值 codePointOffset代码点。
        从以下版本开始:
        1.5
      • offsetByCodePoints

        public static int offsetByCodePoints​(char[] a,                                     int start,                                     int count,                                     int index,                                     int codePointOffset)
        返回给定的索引char子阵是从给定的偏移indexcodePointOffset代码点。 startcount参数指定char数组的子数组。 indexcodePointOffset给出的文本范围内的未配对代理计为每个代码点。
        参数
        a - char数组
        start - 子阵列的第一个 char的索引
        count - char阵列的长度
        index - 要偏移的索引
        codePointOffset - 代码点中的偏移量
        结果
        子阵列中的索引
        异常
        NullPointerException - 如果 a为空。
        IndexOutOfBoundsException - 如果 startcount为负数,或者如果 start + count大于给定数组的长度,或者 index小于 start或更大,那么 start + count ,或者 codePointOffset为正且文本范围以 index并以 start + count - 1结尾有少于 codePointOffset代码点,或者如果 codePointOffset为负且文本范围开始 start ,结束时用 index - 1具有比的绝对值较少 codePointOffset代码点。
        从以下版本开始:
        1.5
      • isLowerCase

        public static boolean isLowerCase​(char ch)
        确定指定的字符是否为小写字符。

        如果Character.getType(ch)提供的常规类别类型为LOWERCASE_LETTER ,或者它具有Unicode标准定义的贡献属性Other_Lowercase,则该字符为小写。

        以下是小写字符的示例:

         a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF' 

        许多其他Unicode字符也是小写的。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isLowerCase(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果字符是小写的; 否则为false
        另请参见:
        isLowerCase(char)isTitleCase(char)toLowerCase(char)getType(char)
      • isLowerCase

        public static boolean isLowerCase​(int codePoint)
        确定指定的字符(Unicode代码点)是否为小写字符。

        如果字符的常规类别类型(由getType(codePoint)提供)为LOWERCASE_LETTER ,或者它具有Unicode标准定义的贡献属性Other_Lowercase,则该字符为小写。

        以下是小写字符的示例:

         a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF' 

        许多其他Unicode字符也是小写的。

        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符是小写的; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isLowerCase(int)isTitleCase(int)toLowerCase(int)getType(int)
      • isUpperCase

        public static boolean isUpperCase​(char ch)
        确定指定的字符是否为大写字符。

        一个字符大写如果其一般类别类型,通过提供Character.getType(ch) ,是UPPERCASE_LETTER 或者它具有Unicode标准定义的贡献属性Other_Uppercase。

        以下是大写字符的示例:

         A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE' 

        许多其他Unicode字符也是大写的。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isUpperCase(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果字符是大写的; 否则为false
        从以下版本开始:
        1.0
        另请参见:
        isLowerCase(char)isTitleCase(char)toUpperCase(char)getType(char)
      • isUpperCase

        public static boolean isUpperCase​(int codePoint)
        确定指定的字符(Unicode代码点)是否为大写字符。

        如果字符的一般类别类型(由getType(codePoint)提供)为UPPERCASE_LETTER ,或者它具有Unicode标准定义的贡献属性Other_Uppercase,则该字符为大写。

        以下是大写字符的示例:

         A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE' 

        许多其他Unicode字符也是大写的。

        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符是大写的; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isLowerCase(int)isTitleCase(int)toUpperCase(int)getType(int)
      • isTitleCase

        public static boolean isTitleCase​(char ch)
        确定指定的字符是否为标题字符。

        字符是否为标题字符,如果它的一般类别类型,通过提供Character.getType(ch) ,是TITLECASE_LETTER

        有些字符看起来像一对拉丁字母。 例如,有一个大写字母,看起来像“LJ”,并有一个相应的小写字母,看起来像“lj”。 第三种形式,看起来像“Lj”,是使用初始大写以小写形式呈现单词时使用的适当形式,如书名。

        这些是此方法返回true一些Unicode字符:

        • LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
        • LATIN CAPITAL LETTER L WITH SMALL LETTER J
        • LATIN CAPITAL LETTER N WITH SMALL LETTER J
        • LATIN CAPITAL LETTER D WITH SMALL LETTER Z

        许多其他Unicode字符也是标题。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isTitleCase(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果角色是标题; 否则为false
        从以下版本开始:
        1.0.2
        另请参见:
        isLowerCase(char)isUpperCase(char)toTitleCase(char)getType(char)
      • isTitleCase

        public static boolean isTitleCase​(int codePoint)
        确定指定的字符(Unicode代码点)是否为标题字符。

        字符是否为标题字符,如果它的一般类别类型,通过提供getType(codePoint) ,是TITLECASE_LETTER

        有些字符看起来像一对拉丁字母。 例如,有一个大写字母,看起来像“LJ”,并有一个相应的小写字母,看起来像“lj”。 第三种形式,看起来像“Lj”,是使用初始大写以小写形式呈现单词时使用的适当形式,如书名。

        这些是此方法返回true一些Unicode字符:

        • LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON
        • LATIN CAPITAL LETTER L WITH SMALL LETTER J
        • LATIN CAPITAL LETTER N WITH SMALL LETTER J
        • LATIN CAPITAL LETTER D WITH SMALL LETTER Z

        许多其他Unicode字符也是标题。

        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果角色是标题; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isLowerCase(int)isUpperCase(int)toTitleCase(int)getType(int)
      • isDigit

        public static boolean isDigit​(char ch)
        确定指定的字符是否为数字。

        甲字符是数字,如果它的一般类别类型,通过提供Character.getType(ch) ,是DECIMAL_DIGIT_NUMBER

        一些包含数字的Unicode字符范围:

        • '\u0030''\u0039' ,ISO-LATIN-1位数( '0''9'
        • '\u0660''\u0669' ,阿拉伯语 - 印度数字
        • '\u06F0''\u06F9' ,扩展的阿拉伯语 - 印度数字
        • '\u0966''\u096F' ,梵文数字
        • '\uFF10''\uFF19''\uFF19'数字
        许多其他字符范围也包含数字。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isDigit(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果字符是数字; 否则为false
        另请参见:
        digit(char, int)forDigit(int, int)getType(char)
      • isDigit

        public static boolean isDigit​(int codePoint)
        确定指定的字符(Unicode代码点)是否为数字。

        甲字符是数字,如果它的一般类别类型,通过提供getType(codePoint) ,是DECIMAL_DIGIT_NUMBER

        一些包含数字的Unicode字符范围:

        • '\u0030''\u0039' ,ISO-LATIN-1位数( '0''9'
        • '\u0660''\u0669' ,阿拉伯语 - 印度数字
        • '\u06F0''\u06F9' ,扩展的阿拉伯语 - 印度数字
        • '\u0966''\u096F' ,梵文数字
        • '\uFF10''\uFF19' ,全角数字
        许多其他字符范围也包含数字。
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符是数字; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        forDigit(int, int)getType(int)
      • isDefined

        public static boolean isDefined​(char ch)
        确定是否在Unicode中定义了字符。

        如果至少满足下列条件之一,则定义字符:

        • 它在UnicodeData文件中有一个条目。
        • 它具有UnicodeData文件定义的范围中的值。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isDefined(int)方法。

        参数
        ch - 要测试的角色
        结果
        true如果字符在Unicode中具有已定义的含义; 否则为false
        从以下版本开始:
        1.0.2
        另请参见:
        isDigit(char)isLetter(char)isLetterOrDigit(char)isLowerCase(char)isTitleCase(char)isUpperCase(char)
      • isDefined

        public static boolean isDefined​(int codePoint)
        确定是否在Unicode中定义了字符(Unicode代码点)。

        如果至少满足下列条件之一,则定义字符:

        • 它在UnicodeData文件中有一个条目。
        • 它具有UnicodeData文件定义的范围中的值。
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符在Unicode中具有已定义的含义; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isDigit(int)isLetter(int)isLetterOrDigit(int)isLowerCase(int)isTitleCase(int)isUpperCase(int)
      • isLetter

        public static boolean isLetter​(int codePoint)
        确定指定的字符(Unicode代码点)是否为字母。

        如果字符的一般类别类型(由getType(codePoint)提供)是以下任何一种字符,则该字符被视为字母:

        • UPPERCASE_LETTER
        • LOWERCASE_LETTER
        • TITLECASE_LETTER
        • MODIFIER_LETTER
        • OTHER_LETTER
        并非所有信件都有案例。 许多字符都是字母,但既不是大写字母,也不是小写字母,也不是标题字母。
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果角色是一个字母; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isDigit(int)isJavaIdentifierStart(int)isLetterOrDigit(int)isLowerCase(int)isTitleCase(int)isUnicodeIdentifierStart(int)isUpperCase(int)
      • isJavaLetterOrDigit

        @Deprecated(since="1.1")public static boolean isJavaLetterOrDigit​(char ch)
        Deprecated.
        Replaced by isJavaIdentifierPart(char).
        确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。

        当且仅当满足以下任何条件时,字符可能是Java标识符的一部分:

        • 这是一封信
        • 它是货币符号(例如'$'
        • 它是一个连接标点字符(如'_'
        • 这是一个数字
        • 它是一个数字字母(例如罗马数字字符)
        • 它是一个组合标记
        • 它是一个非间距标记
        • isIdentifierIgnorable为该字符返回true
        参数
        ch - 要测试的角色。
        结果
        true如果该字符可能是Java标识符的一部分; 否则为false
        从以下版本开始:
        1.0.2
        另请参见:
        isJavaLetter(char)isJavaIdentifierStart(char)isJavaIdentifierPart(char)isLetter(char)isLetterOrDigit(char)isUnicodeIdentifierPart(char)isIdentifierIgnorable(char)
      • isAlphabetic

        public static boolean isAlphabetic​(int codePoint)
        确定指定的字符(Unicode代码点)是否为字母。

        如果字符的一般类别类型(由getType(codePoint)提供)是以下任何一种,则该字符被视为字母字符:

        • UPPERCASE_LETTER
        • LOWERCASE_LETTER
        • TITLECASE_LETTER
        • MODIFIER_LETTER
        • OTHER_LETTER
        • LETTER_NUMBER
        或者它具有由Unicode标准定义的贡献属性Other_Alphabetic。
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符是Unicode字母字符, false
        从以下版本开始:
        1.7
      • isIdeographic

        public static boolean isIdeographic​(int codePoint)
        确定指定的字符(Unicode代码点)是否为Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符是Unicode表意文字字符, false
        从以下版本开始:
        1.7
      • isJavaIdentifierStart

        public static boolean isJavaIdentifierStart​(int codePoint)
        确定字符(Unicode代码点)是否允许作为Java标识符中的第一个字符。

        当且仅当满足下列条件之一时,字符才可以启动Java标识符:

        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符可以启动Java标识符; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isJavaIdentifierPart(int)isLetter(int)isUnicodeIdentifierStart(int)SourceVersion.isIdentifier(CharSequence)
      • isJavaIdentifierPart

        public static boolean isJavaIdentifierPart​(char ch)
        确定指定的字符是否可能是Java标识符的一部分,而不是第一个字符。

        如果满足以下任何条件,则字符可能是Java标识符的一部分:

        • 这是一封信
        • 它是货币符号(例如'$'
        • 它是一个连接标点字符(如'_'
        • 这是一个数字
        • 它是一个数字字母(例如罗马数字字符)
        • 它是一个组合标记
        • 它是一个非间距标记
        • isIdentifierIgnorable回报true的字符

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isJavaIdentifierPart(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果该字符可能是Java标识符的一部分; 否则为false
        从以下版本开始:
        1.1
        另请参见:
        isIdentifierIgnorable(char)isJavaIdentifierStart(char)isLetterOrDigit(char)isUnicodeIdentifierPart(char)SourceVersion.isIdentifier(CharSequence)
      • isJavaIdentifierPart

        public static boolean isJavaIdentifierPart​(int codePoint)
        确定字符(Unicode代码点)是否可能是Java标识符的一部分,而不是第一个字符。

        如果满足以下任何条件,则字符可能是Java标识符的一部分:

        • 这是一封信
        • 它是货币符号(例如'$'
        • 它是一个连接标点字符(如'_'
        • 这是一个数字
        • 它是一个数字字母(例如罗马数字字符)
        • 它是一个组合标记
        • 它是一个非间距标记
        • isIdentifierIgnorable(codePoint)回报true的字符
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符可能是Java标识符的一部分; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isIdentifierIgnorable(int)isJavaIdentifierStart(int)isLetterOrDigit(int)isUnicodeIdentifierPart(int)SourceVersion.isIdentifier(CharSequence)
      • isUnicodeIdentifierStart

        public static boolean isUnicodeIdentifierStart​(int codePoint)
        确定是否允许指定的字符(Unicode代码点)作为Unicode标识符中的第一个字符。

        当且仅当满足下列条件之一时,字符才可以启动Unicode标识符:

        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符可能启动Unicode标识符; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isJavaIdentifierStart(int)isLetter(int)isUnicodeIdentifierPart(int)
      • isUnicodeIdentifierPart

        public static boolean isUnicodeIdentifierPart​(char ch)
        确定指定的字符是否可能是Unicode标识符的一部分,而不是第一个字符。

        当且仅当以下陈述之一为真时,字符可能是Unicode标识符的一部分:

        • 这是一封信
        • 它是一个连接标点字符(如'_'
        • 这是一个数字
        • 它是一个数字字母(例如罗马数字字符)
        • 它是一个组合标记
        • 它是一个非间距标记
        • isIdentifierIgnorable返回true这个字符。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isUnicodeIdentifierPart(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果字符可能是Unicode标识符的一部分; 否则为false
        从以下版本开始:
        1.1
        另请参见:
        isIdentifierIgnorable(char)isJavaIdentifierPart(char)isLetterOrDigit(char)isUnicodeIdentifierStart(char)
      • isUnicodeIdentifierPart

        public static boolean isUnicodeIdentifierPart​(int codePoint)
        确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。

        当且仅当以下陈述之一为真时,字符可能是Unicode标识符的一部分:

        • 这是一封信
        • 它是一个连接标点字符(如'_'
        • 这是一个数字
        • 它是一个数字字母(例如罗马数字字符)
        • 它是一个组合标记
        • 它是一个非间距标记
        • isIdentifierIgnorable为此字符返回true
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符可能是Unicode标识符的一部分; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isIdentifierIgnorable(int)isJavaIdentifierPart(int)isLetterOrDigit(int)isUnicodeIdentifierStart(int)
      • isIdentifierIgnorable

        public static boolean isIdentifierIgnorable​(char ch)
        确定指定的字符是否应被视为Java标识符或Unicode标识符中的可忽略字符。

        Java标识符或Unicode标识符中可以忽略以下Unicode字符:

        • ISO控制字符不是空格
          • '\u0000''\u0008'
          • '\u000E''\u001B'
          • '\u007F''\u009F'
        • 具有FORMAT常规类别值的所有字符

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isIdentifierIgnorable(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果字符是可忽略的控制字符,可能是Java或Unicode标识符的一部分; 否则为false
        从以下版本开始:
        1.1
        另请参见:
        isJavaIdentifierPart(char)isUnicodeIdentifierPart(char)
      • isIdentifierIgnorable

        public static boolean isIdentifierIgnorable​(int codePoint)
        确定指定的字符(Unicode代码点)是否应被视为Java标识符或Unicode标识符中的可忽略字符。

        Java标识符或Unicode标识符中可以忽略以下Unicode字符:

        • ISO控制字符不是空格
          • '\u0000''\u0008'
          • '\u000E''\u001B'
          • '\u007F''\u009F'
        • 具有FORMAT常规类别值的所有字符
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符是可忽略的控制字符,可能是Java或Unicode标识符的一部分; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isJavaIdentifierPart(int)isUnicodeIdentifierPart(int)
      • toLowerCase

        public static char toLowerCase​(char ch)
        使用UnicodeData文件中的大小写映射信息将字符参数转换为小写。

        请注意,对于某些字符范围, Character.isLowerCase(Character.toLowerCase(ch))并不总是返回true ,特别是那些符号或表意符号。

        通常,应使用String.toLowerCase()将字符映射为小写。 String案例映射方法比Character案例映射方法有几个好处。 String案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character案例映射方法则不能。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用toLowerCase(int)方法。

        参数
        ch - 要转换的字符。
        结果
        字符的小写等价物,如果有的话; 否则,角色本身。
        另请参见:
        isLowerCase(char)String.toLowerCase()
      • toLowerCase

        public static int toLowerCase​(int codePoint)
        使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写。

        请注意,对于某些字符范围, Character.isLowerCase(Character.toLowerCase(codePoint))并不总是返回true ,特别是那些符号或表意符号。

        通常,应使用String.toLowerCase()将字符映射为小写。 String案例映射方法比Character案例映射方法有几个好处。 String案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character案例映射方法则不能。

        参数
        codePoint - 要转换的字符(Unicode代码点)。
        结果
        字符的小写等效项(Unicode代码点),如果有的话; 否则,角色本身。
        从以下版本开始:
        1.5
        另请参见:
        isLowerCase(int)String.toLowerCase()
      • toUpperCase

        public static char toUpperCase​(char ch)
        使用UnicodeData文件中的大小写映射信息将字符参数转换为大写。

        请注意,对于某些字符范围, Character.isUpperCase(Character.toUpperCase(ch))并不总是返回true ,特别是那些符号或表意符号。

        通常,应使用String.toUpperCase()将字符映射为大写。 String案例映射方法比Character案例映射方法有几个好处。 String案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character案例映射方法则不能。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用toUpperCase(int)方法。

        参数
        ch - 要转换的字符。
        结果
        字符的大写等价物,如果有的话; 否则,角色本身。
        另请参见:
        isUpperCase(char)String.toUpperCase()
      • toUpperCase

        public static int toUpperCase​(int codePoint)
        使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为大写。

        请注意,对于某些字符范围, Character.isUpperCase(Character.toUpperCase(codePoint))并不总是返回true ,特别是那些符号或表意符号。

        通常,应使用String.toUpperCase()将字符映射为大写。 String案例映射方法比Character案例映射方法有几个好处。 String案例映射方法可以执行区域设置敏感的映射,上下文相关的映射和1:M字符映射,而Character案例映射方法则不能。

        参数
        codePoint - 要转换的字符(Unicode代码点)。
        结果
        字符的大写等价物,如果有的话; 否则,角色本身。
        从以下版本开始:
        1.5
        另请参见:
        isUpperCase(int)String.toUpperCase()
      • toTitleCase

        public static char toTitleCase​(char ch)
        使用UnicodeData文件中的大小写映射信息将字符参数转换为标题。 如果一个字符没有明确的标题映射,并且根据UnicodeData本身不是一个标题字符串,那么大写映射将作为等效的标题映射返回。 如果char参数已经是标题char ,则将返回相同的char值。

        请注意,对于某些字符范围, Character.isTitleCase(Character.toTitleCase(ch))并不总是返回true

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用toTitleCase(int)方法。

        参数
        ch - 要转换的字符。
        结果
        相当于该字符的标题词,如果有的话; 否则,角色本身。
        从以下版本开始:
        1.0.2
        另请参见:
        isTitleCase(char)toLowerCase(char)toUpperCase(char)
      • toTitleCase

        public static int toTitleCase​(int codePoint)
        使用UnicodeData文件中的案例映射信息将字符(Unicode代码点)参数转换为titlecase。 如果一个字符没有明确的标题映射,并且根据UnicodeData本身不是一个标题字符串,那么大写映射将作为等效的标题映射返回。 如果字符参数已经是标题字符,则将返回相同的字符值。

        请注意,对于某些字符范围, Character.isTitleCase(Character.toTitleCase(codePoint))并不总是返回true

        参数
        codePoint - 要转换的字符(Unicode代码点)。
        结果
        相当于该字符的标题词,如果有的话; 否则,角色本身。
        从以下版本开始:
        1.5
        另请参见:
        isTitleCase(int)toLowerCase(int)toUpperCase(int)
      • digit

        public static int digit​(char ch,                        int radix)
        返回指定基数中字符ch的数值。

        如果基数不在范围MIN_RADIX ≤ radix ≤ MAX_RADIX或者价值ch不是指定基数的有效数字, -1返回。 如果至少满足下列条件之一,则字符是有效数字:

        • 方法isDigit是字符的true ,并且字符的Unicode十进制数值(或其单字符分解)小于指定的基数。 在这种情况下,返回十进制数值。
        • 该字符是大写拉丁字母'A''Z' ,其代码小于radix + 'A' - 10 在这种情况下,返回ch - 'A' + 10
        • 该字符是小写拉丁字母'a''z' ,其代码小于radix + 'a' - 10 在这种情况下,返回ch - 'a' + 10
        • 该字符是全'\uFF21'写拉丁字母A( '\uFF21' )到Z( '\uFF3A' )之一,其代码小于radix + '\uFF21' - 10 在这种情况下,返回ch - '\uFF21' + 10
        • 该字符是全宽小写拉丁字母a( '\uFF41' )到z( '\uFF5A' )之一,其代码小于radix + '\uFF41' - 10 在这种情况下,返回ch - '\uFF41' + 10

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用digit(int, int)方法。

        参数
        ch - 要转换的字符。
        radix - 基数。
        结果
        指定基数中字符表示的数值。
        另请参见:
        forDigit(int, int)isDigit(char)
      • digit

        public static int digit​(int codePoint,                        int radix)
        返回指定基数中指定字符(Unicode代码点)的数值。

        如果基数不在范围MIN_RADIX ≤ radix ≤ MAX_RADIX ,或者如果字符不是指定基数的有效数字, -1返回。 如果至少满足下列条件之一,则字符是有效数字:

        • 方法isDigit(codePoint)是字符的true ,并且字符的Unicode十进制数值(或其单字符分解)小于指定的基数。 在这种情况下,返回十进制数值。
        • 该字符是大写拉丁字母'A''Z' ,其代码小于radix + 'A' - 10 在这种情况下,返回codePoint - 'A' + 10
        • 该字符是小写拉丁字母'a''z' ,其代码小于radix + 'a' - 10 在这种情况下,返回codePoint - 'a' + 10
        • 该字符是全'\uFF21'写拉丁字母A( '\uFF21' )到Z( '\uFF3A' )之一,其代码小于radix + '\uFF21' - 10 在这种情况下,返回codePoint - '\uFF21' + 10
        • 该字符是全宽小写拉丁字母a( '\uFF41' )到z( '\uFF5A' )之一,其代码小于radix + '\uFF41'- 10 在这种情况下,返回codePoint - '\uFF41' + 10
        参数
        codePoint - 要转换的字符(Unicode代码点)。
        radix - 基数。
        结果
        指定基数中字符表示的数值。
        从以下版本开始:
        1.5
        另请参见:
        forDigit(int, int)isDigit(int)
      • getNumericValue

        public static int getNumericValue​(char ch)
        返回指定的Unicode字符表示的int值。 例如,字符'\u216C' (罗马数字50)将返回值为50的int。

        大写字母AZ( '\u0041''\u005A' ),小写字母( '\u0061''\u007A' )和全宽变体( '\uFF21''\uFF3A''\uFF41''\uFF5A' )形式的数值从10到35 '\uFF5A' 。这与Unicode规范无关,不会为这些char值分配数值。

        如果字符没有数字值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用getNumericValue(int)方法。

        参数
        ch - 要转换的字符。
        结果
        字符的数值,作为非负int值; -2如果字符具有数值但该值不能表示为非负int值; 如果字符没有数字值,则返回-1。
        从以下版本开始:
        1.1
        另请参见:
        forDigit(int, int)isDigit(char)
      • getNumericValue

        public static int getNumericValue​(int codePoint)
        返回指定字符(Unicode代码点)表示的int值。 例如,字符'\u216C' (罗马数字50)将返回值为50的int

        在他们的大写(字母AZ '\u0041'通过'\u005A' ),小写( '\u0061'通过'\u007A' ()和全宽变体'\uFF21'通过'\uFF3A''\uFF41'通过'\uFF5A' )形式具有10到35的数值这是独立于Unicode规范,其中的不会为这些char值分配数值。

        如果字符没有数字值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。

        参数
        codePoint - 要转换的字符(Unicode代码点)。
        结果
        字符的数值,作为非负int值; -2如果字符具有数字值但该值不能表示为非负int值; 如果字符没有数字值,则返回-1。
        从以下版本开始:
        1.5
        另请参见:
        forDigit(int, int)isDigit(int)
      • isSpace

        @Deprecated(since="1.1")public static boolean isSpace​(char ch)
        Deprecated.
        Replaced by isWhitespace(char).
        确定指定的字符是否为ISO-LATIN-1空格。 此方法仅返回以下五个字符的true truechars Character Code Name '\t' U+0009 HORIZONTAL TABULATION '\n' U+000A NEW LINE '\f' U+000C FORM FEED '\r' U+000D CARRIAGE RETURN ' ' U+0020 SPACE
        参数
        ch - 要测试的角色。
        结果
        true如果字符是ISO-LATIN-1空格; 否则为false
        另请参见:
        isSpaceChar(char)isWhitespace(char)
      • isSpaceChar

        public static boolean isSpaceChar​(char ch)
        确定指定的字符是否为Unicode空格字符。 当且仅当Unicode标准将字符指定为空格字符时,才将字符视为空格字符。 如果角色的常规类别类型是以下任何一种,则此方法返回true:
        • SPACE_SEPARATOR
        • LINE_SEPARATOR
        • PARAGRAPH_SEPARATOR

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isSpaceChar(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果角色是空格字符; 否则为false
        从以下版本开始:
        1.1
        另请参见:
        isWhitespace(char)
      • isSpaceChar

        public static boolean isSpaceChar​(int codePoint)
        确定指定的字符(Unicode代码点)是否为Unicode空格字符。 当且仅当Unicode标准将字符指定为空格字符时,才将字符视为空格字符。 如果角色的常规类别类型是以下任何一种,则此方法返回true:
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果角色是空格字符; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isWhitespace(int)
      • isWhitespace

        public static boolean isWhitespace​(char ch)
        根据Java确定指定的字符是否为空格。 当且仅当它满足以下条件之一时,字符才是Java空白字符:
        • 它是Unicode空格字符( SPACE_SEPARATORLINE_SEPARATOR ,或PARAGRAPH_SEPARATOR ),但不也是非打破空间( '\u00A0''\u2007''\u202F' )。
        • 它是'\t' ,U + 0009 HORIZONTAL '\t'
        • 它是'\n' ,U + 000A LINE FEED。
        • 它是'\u000B' ,U + 000B VERTICAL '\u000B'
        • 它是'\f' ,U + 000C FORM FEED。
        • 它是'\r' ,U + 000D '\r' RETURN。
        • 它是'\u001C' ,U + 001C FILE SEPARATOR。
        • 它是'\u001D' ,U + 001D GROUP SEPARATOR。
        • 它是'\u001E' ,U + 001E RECORD SEPARATOR。
        • 它是'\u001F' ,U + 001F UNIT SEPARATOR。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isWhitespace(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果字符是Java空白字符; 否则为false
        从以下版本开始:
        1.1
        另请参见:
        isSpaceChar(char)
      • isWhitespace

        public static boolean isWhitespace​(int codePoint)
        根据Java确定指定的字符(Unicode代码点)是否为空白。 当且仅当它满足以下条件之一时,字符才是Java空白字符:
        • 它是Unicode空格字符( SPACE_SEPARATORLINE_SEPARATOR ,或PARAGRAPH_SEPARATOR ),但不也是非打破空间( '\u00A0''\u2007''\u202F' )。
        • 它是'\t' ,U + 0009 HORIZONTAL '\t'
        • 它是'\n' ,U + 000A LINE FEED。
        • 它是'\u000B' ,U + 000B VERTICAL '\u000B'
        • 它是'\f' ,U + 000C FORM FEED。
        • 这是'\r' ,U + 000D '\r' RETURN。
        • 它是'\u001C' ,U + 001C FILE SEPARATOR。
        • 它是'\u001D' ,U + 001D GROUP SEPARATOR。
        • 它是'\u001E' ,U + 001E RECORD SEPARATOR。
        • 它是'\u001F' ,U + 001F UNIT SEPARATOR。
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符是Java空白字符; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isSpaceChar(int)
      • isISOControl

        public static boolean isISOControl​(char ch)
        确定指定的字符是否为ISO控制字符。 一个字符被认为如果其代码是在范围为ISO控制字符'\u0000'通过'\u001F'或在范围'\u007F'通过'\u009F'

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isISOControl(int)方法。

        参数
        ch - 要测试的角色。
        结果
        true如果字符是ISO控制字符; 否则为false
        从以下版本开始:
        1.1
        另请参见:
        isSpaceChar(char)isWhitespace(char)
      • isISOControl

        public static boolean isISOControl​(int codePoint)
        确定引用的字符(Unicode代码点)是否为ISO控制字符。 一个字符被认为如果其代码是在范围为ISO控制字符'\u0000'通过'\u001F'或在范围'\u007F'通过'\u009F'
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果角色是ISO控制角色; 否则为false
        从以下版本开始:
        1.5
        另请参见:
        isSpaceChar(int)isWhitespace(int)
      • forDigit

        public static char forDigit​(int digit,                            int radix)
        确定指定基数中特定数字的字符表示形式。 如果值radix不是有效基数,或者值digit不是指定基数中的有效数字,则返回空字符( '\u0000' )。

        radix参数是有效的,如果它是大于或等于MIN_RADIX且小于或等于MAX_RADIX 如果0 <= digit < radix ,则digit参数有效。

        如果该数字小于10,则返回'0' + digit 否则,返回值'a' + digit - 10

        参数
        digit - 要转换为字符的数字。
        radix - 基数。
        结果
        指定基数中指定数字的 char表示形式。
        另请参见:
        MIN_RADIXMAX_RADIXdigit(char, int)
      • isMirrored

        public static boolean isMirrored​(char ch)
        确定是否根据Unicode规范镜像该字符。 当以从右到左的文本显示时,镜像字符应使其字形水平镜像。 例如, '\u0028' LEFT PARENTHESIS在语义上被定义为左括号 这将显示为从右到左的文本中从左到右但作为“)”的文本中的“(”。

        注意:此方法无法处理supplementary characters 要支持所有Unicode字符(包括增补字符),请使用isMirrored(int)方法。

        参数
        ch - char ,请求镜像属性
        结果
        true如果char是镜像的,则 false如果 char未镜像或未定义。
        从以下版本开始:
        1.4
      • isMirrored

        public static boolean isMirrored​(int codePoint)
        确定是否根据Unicode规范镜像指定的字符(Unicode代码点)。 当以从右到左的文本显示时,镜像字符应使其字形水平镜像。 例如, '\u0028' LEFT PARENTHESIS在语义上被定义为左括号 这将显示为从右到左的文本中从左到右但作为“)”的文本中的“(”。
        参数
        codePoint - 要测试的字符(Unicode代码点)。
        结果
        true如果字符被镜像, false如果字符不是镜像的或没有定义。
        从以下版本开始:
        1.5
      • compareTo

        public int compareTo​(Character anotherCharacter)
        以数字方式比较两个 Character对象。
        Specified by:
        compareTo在界面 Comparable<Character>
        参数
        anotherCharacter - 要比较的 Character
        结果
        0如果参数Character等于这个Character ; 的值小于0 ,如果这Character在数值上比少Character参数; 如果此Character在数值上大于Character参数(无符号比较),则值大于0 请注意,这是严格的数字比较; 它不依赖于语言环境。
        从以下版本开始:
        1.2
      • compare

        public static int compare​(char x,                          char y)
        以数字方式比较两个char值。 返回的值与返回的值相同:
          Character.valueOf(x).compareTo(Character.valueOf(y)) 
        参数
        x - 第一个 char来比较
        y - 第二个 char进行比较
        结果
        0如果x == y ; 小于0的值,如果x < y ; 如果为0则值大于x > y
        从以下版本开始:
        1.7
      • reverseBytes

        public static char reverseBytes​(char ch)
        返回通过反转指定的 char值中的字节顺序获得的值。
        参数
        ch - 其中 char反转字节顺序。
        结果
        通过反转(或等效地,交换)指定的 char值中的字节获得的值。
        从以下版本开始:
        1.5
      • getName

        public static String getName​(int codePoint)
        返回指定字符codePoint的Unicode名称,如果代码点为unassigned ,则返回null。

        注意:如果未通过UnicodeData文件(由Unicode Consortium维护的Unicode字符数据库的一部分)为指定的字符分配名称,则返回的名称与表达式的结果相同。

        Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);
        参数
        codePoint - 字符(Unicode代码点)
        结果
        指定字符的Unicode名称,如果未分配代码点,则返回null。
        异常
        IllegalArgumentException - 如果指定的 codePoint不是有效的Unicode代码点。
        从以下版本开始:
        1.7
      • codePointOf

        public static int codePointOf​(String name)
        返回给定Unicode字符名称指定的Unicode字符的代码点值。

        注意:如果UnicodeData文件(由Unicode Consortium维护的Unicode字符数据库的一部分)未为字符分配名称,则其名称将定义为表达式的结果

        Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ROOT);

        name匹配不区分大小写,删除了任何前导和尾随空格字符。

        参数
        name - Unicode字符名称
        结果
        由其名称指定的字符的代码点值。
        异常
        IllegalArgumentException - 如果指定的 name不是有效的Unicode字符名称。
        NullPointerException - 如果 namenull
        从以下版本开始:
        9