在Java中将UTF-8转换为ISO-8859-1

我不确定标准库中是否有将执行此操作的规范化例程。我不认为标准的Unicode规范化程序会处理“智能”引号的转换- 但不要引用我。

明智的做法是转储ISO-8859-1并开始使用UTF-8。也就是说，可以将任何通常允许的Unicode代码点编码为HTML网页，编码为ISO-8859-1。您可以使用转义序列对它们进行编码，如下所示：

public final class HtmlEncoder {
  private HtmlEncoder() {}

  public static <T extends Appendable> T escapeNonLatin(CharSequence sequence,
      T out) throws java.io.IOException {
    for (int i = 0; i < sequence.length(); i++) {
      char ch = sequence.charAt(i);
      if (Character.UnicodeBlock.of(ch) == Character.UnicodeBlock.BASIC_LATIN) {
        out.append(ch);
      } else {
        int codepoint = Character.codePointAt(sequence, i);
        // handle supplementary range chars
        i += Character.charCount(codepoint) - 1;
        // emit entity
        out.append("&#x");
        out.append(Integer.toHexString(codepoint));
        out.append(";");
      }
    }
    return out;
  }
}

用法示例：

String foo = "This is Cyrillic Ya: \u044F\n"
    + "This is fraktur G: \uD835\uDD0A\n" + "This is a smart quote: \u201C";

StringBuilder sb = HtmlEncoder.escapeNonLatin(foo, new StringBuilder());
System.out.println(sb.toString());

上面的字符左双引号（U+201C ）被编码为＆＃x201C;。同样，对其他两个任意代码点也进行了编码。

需要谨慎使用此方法。如果您的文本需要针对HTML进行转义，则需要在上述代码或“与”号最终转义之前完成。

java 2022/1/1 18:18:38 有420人围观

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节

关注并接收问题和回答的更新提醒

参与内容的编辑和改进，让解决方法与时俱进

请先登录

推荐问题

如何在JavaScript中将浮点数转换为整数？

如何在JavaScript中将浮点数转换为整数？

javascript 2022-01-01 1017
在Jenkins API中，有没有办法找到上一个版本的git commit？

在Jenkins API中，有没有办法找到上一个版本的git commit？

其他 2022-01-01 772
在JavaScript中删除数组元素-Delete与Splice

在JavaScript中删除数组元素-Delete与Splice

SQL 2022-01-01 1003
在Spring Boot中，如何在JSON中抛出异常

在Spring Boot中，如何在JSON中抛出异常

Java 2022-01-01 705
如何在JSP页面的选项标签上使用onClick（）或onSelect（）？

如何在JSP页面的选项标签上使用onClick（）或onSelect（）？

其他 2022-01-01 842
如何在JavaScript中将字符串转换为布尔值？

如何在JavaScript中将字符串转换为布尔值？

javascript 2022-01-01 716
同步静态方法在Java中如何工作？

同步静态方法在Java中如何工作？

java 2022-01-01 752
如何在JSON中使用if语句？

如何在JSON中使用if语句？

其他 2022-01-01 676
如何在Java中打开txt文件并读取数字

如何在Java中打开txt文件并读取数字

java 2022-01-01 700
在Jenkins中设置特定的Python

在Jenkins中设置特定的Python

python 2022-01-01 716
在Jsp中解释动态属性时出现问题

在Jsp中解释动态属性时出现问题

其他 2022-01-01 661
为什么无法在Java中扩展注释？

为什么无法在Java中扩展注释？

java 2022-01-01 860
在jsp页面中显示jfreechart

在jsp页面中显示jfreechart

其他 2022-01-01 649
您在Java中建议使用哪种HTML解析库？

您在Java中建议使用哪种HTML解析库？

java 2022-01-01 649
在JMeter 5.0中从Scheduler中删除了Start Time和End Time

在JMeter 5.0中从Scheduler中删除了Start Time和End Time

其他 2022-01-01 764
如何在Java中将括号内的字符串（嵌套）匹配？

如何在Java中将括号内的字符串（嵌套）匹配？

java 2022-01-01 704
在Java中获取登录用户名

在Java中获取登录用户名

java 2022-01-01 635
国际化如何在JavaScript中起作用？

国际化如何在JavaScript中起作用？

javascript 2022-01-01 788
如何在JavaScript中按类获取元素？

如何在JavaScript中按类获取元素？

javascript 2022-01-01 638
在JavaScript中定义枚举的首选语法是什么？

在JavaScript中定义枚举的首选语法是什么？

javascript 2022-01-01 728

在Java中将UTF-8转换为ISO-8859-1

撰写回答

推荐问题

如何在JavaScript中将浮点数转换为整数？

在Jenkins API中，有没有办法找到上一个版本的git commit？

在JavaScript中删除数组元素-Delete与Splice

在Spring Boot中，如何在JSON中抛出异常

如何在JSP页面的选项标签上使用onClick（）或onSelect（）？

如何在JavaScript中将字符串转换为布尔值？

同步静态方法在Java中如何工作？

如何在JSON中使用if语句？

如何在Java中打开txt文件并读取数字

在Jenkins中设置特定的Python

在Jsp中解释动态属性时出现问题

为什么无法在Java中扩展注释？

在jsp页面中显示jfreechart

您在Java中建议使用哪种HTML解析库？

在JMeter 5.0中从Scheduler中删除了Start Time和End Time

如何在Java中将括号内的字符串（嵌套）匹配？

在Java中获取登录用户名

国际化如何在JavaScript中起作用？

如何在JavaScript中按类获取元素？

在JavaScript中定义枚举的首选语法是什么？

分类汇总

您的鼓励是对我最大的支持