当前位置: 首页 > news >正文

OJ-1017中文分词模拟器

示例0

输入:

ilovechina
i,ilove,lo,love,ch,china,lovechina

输出:

ilove,china

示例1

输入:

ilovechina
i,love,china,ch,na,ve,lo,this,is,the,word

输出:

i,love,china

说明:
示例2

输入:

iat
i,love,china,ch,na,ve,lo,this,is,the,word,beauti,tiful,ful

输出:i,a,t

说明:单个字母,不在词库中且不成词则直接输出单个字母

示例3

输入:
ilovechina,thewordisbeautiful
i,love,china,ch,na,ve,lo,this,is,the,word,beauti,tiful,ful

输出:
i,love,china,the,word,is,beauti,ful

说明:标点符号为英文标点符号

import java.util.Arrays;
import java.util.List;
import java.util.Scanner;public class 中文模拟分词器2 {public static void main(String[] args) {Scanner in = new Scanner(System.in);String input = in.nextLine();List<String> dict = Arrays.asList(in.nextLine().split(","));int len = input.length();StringBuilder sb = new StringBuilder();int i = 0;while (i < len) {int j = len;boolean found = false;while (j > i) {String s = input.substring(i, j);if (s.matches("[a-zA-Z]+") && (dict.contains(s) || s.length() == 1)) {sb.append(s).append(",");found = true;i = j;break;}j--;}if (!found) {i++;}}System.out.println(sb.substring(0, sb.length() - 1));}
}


 


http://www.mrgr.cn/news/52652.html

相关文章:

  • Linux基础指令
  • HTML+Node+Mysql+Navicat 实现注册登录的接口
  • frameworks 之 触摸事件窗口查找
  • Lintcode 135 · 数字组合【中的 排列组合问题 DFS Java】
  • 植物大战僵尸杂交版即将新增内容介绍
  • 【每日一题】LeetCode每日一题-无重复字符的最长子串
  • 浅谈es6箭头函数
  • 碳酸二辛酯行业分析:未来几年年复合增长率CAGR为3.37%
  • 【前端】Matter:过滤与高级碰撞检测
  • ssm基于SSM的社区管理系统+vue
  • 10秒钟用Midjourney画出国风味的变形金刚
  • VS Code对齐NoteBook和Terminal的Python环境
  • 【ICPC】The 2021 CCPC Guilin Onsite (XXII Open Cup, Grand Prix of EDG) D
  • 速盾:cdn有防御吗?
  • 动态规划(1)斐波那契数列模型
  • mysql--索引
  • Hi3061M——VL53L0X激光测距(IIC)(同样适用于其他MCU)
  • JAVA八股
  • ts 中 type 和 interface 的区别
  • 【vivado】vivado联合modelsim仿真