(5条消息) pinyin4j简单介绍使用

简介:

pinyin4j是一个开源的流行java库(官网地址:http://pinyin4j.sourceforge.net/,在线文档:http://pinyin4j.sourceforge.net/pinyin4j-doc/ ),使用来处理中文转换成拼音(汉语拼音,罗马拼音等),功能强大。
        有几个常用的类:
        net.sourceforge.pinyin4j.PinyinHelper;
        net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
        net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
        net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
        net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
    
    PinyinHelper:提供了几个实用程序函数,用于将中文字符(简体和繁体)转换为各种中文罗马化表示。
    HanyuPinyinOutputFormat:这个类定义了如何输出汉语拼音。
    HanyuPinyinCaseType:为汉语拼音字符串的输出案例提供了几种选项。
    HanyuPinyinToneType:该类提供了几种输出中文音调的选项。
    HanyuPinyinVCharType:这个类为'ü'的输出提供了几个选项。

使用的时候需要下载pinyin4j.jar包,或者通过maven下载,依赖如下:

<dependency>
    <groupId>com.belerweb</groupId>
    <artifactId>pinyin4j</artifactId>
    <version>2.5.0</version>
</dependency>

例子:

  1. package com.wmlce;
  2. import net.sourceforge.pinyin4j.PinyinHelper;
  3. import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
  4. import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
  5. import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
  6. import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
  7. import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
  8. public class TestPinyin4jCsdn {
  9. public static String getAllPinyin(String hanzi) {
  10. //输出格式设置
  11. HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
  12. /**
  13. * 输出大小写设置
  14. *
  15. * LOWERCASE:输出小写
  16. * UPPERCASE:输出大写
  17. */
  18. format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
  19. /**
  20. * 输出音标设置
  21. *
  22. * WITH_TONE_MARK:直接用音标符(必须设置WITH_U_UNICODE,否则会抛出异常)
  23. * WITH_TONE_NUMBER:1-4数字表示音标
  24. * WITHOUT_TONE:没有音标
  25. */
  26. format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
  27. /**
  28. * 特殊音标ü设置
  29. *
  30. * WITH_V:用v表示ü
  31. * WITH_U_AND_COLON:用"u:"表示ü
  32. * WITH_U_UNICODE:直接用ü
  33. */
  34. format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
  35. char[] hanYuArr = hanzi.trim().toCharArray();
  36. StringBuilder pinYin = new StringBuilder();
  37. try {
  38. for (int i = 0, len = hanYuArr.length; i < len; i++) {
  39. //匹配是否是汉字
  40. if (Character.toString(hanYuArr[i]).matches("[\\u4E00-\\u9FA5]+")) {
  41. //如果是多音字,返回多个拼音,这里只取第一个
  42. String[] pys = PinyinHelper.toHanyuPinyinStringArray(hanYuArr[i], format);
  43. pinYin.append(pys[0]).append(" ");
  44. } else {
  45. pinYin.append(hanYuArr[i]).append(" ");
  46. }
  47. }
  48. } catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {
  49. badHanyuPinyinOutputFormatCombination.printStackTrace();
  50. }
  51. return pinYin.toString();
  52. }
  53. public static String getFirstPinYin(String hanyu) {
  54. HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();
  55. format.setCaseType(HanyuPinyinCaseType.UPPERCASE);
  56. format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
  57. StringBuilder firstPinyin = new StringBuilder();
  58. char[] hanyuArr = hanyu.trim().toCharArray();
  59. try {
  60. for (int i = 0, len = hanyuArr.length; i < len; i++) {
  61. if(Character.toString(hanyuArr[i]).matches("[\\u4E00-\\u9FA5]+")){
  62. String[] pys = PinyinHelper.toHanyuPinyinStringArray(hanyuArr[i],format);
  63. firstPinyin.append(pys[0].charAt(0));
  64. }else {
  65. firstPinyin.append(hanyuArr[i]);
  66. }
  67. }
  68. } catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {
  69. badHanyuPinyinOutputFormatCombination.printStackTrace();
  70. }
  71. return firstPinyin.toString();
  72. }
  73. public static void main(String[] args) {
  74. String pinYin = getAllPinyin("秋水共长天一色");
  75. String firstPinYin = getFirstPinYin("秋水共长天一色");
  76. System.out.println("秋水共长天一色全拼:"+pinYin);
  77. System.out.println("秋水共长天一色首字母:"+firstPinYin);
  78. }
  79. }

 

(0)

相关推荐