[2021 카카오 코딩테스트] 신규 아이디 추천(문자열, String Lv. 1) - java 자바

2021. 11. 24. 05:00네카라쿠배 취준반 - 프로그래머스 문제 풀이

0. 자세한 설명은 YouTube 영상으로

 

1. 문제 설명 (출처 : 프로그래머스)

카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.
다음은 카카오 아이디의 규칙입니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
     만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.

예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

1단계 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다. : "...!@BaT#*..y.abcdefghijklm"  "...!@bat#*..y.abcdefghijklm"

2단계 '!', '@', '#', '*' 문자가 제거되었습니다. : "...!@bat#*..y.abcdefghijklm" → "...bat..y.abcdefghijklm"

3단계 '...'와 '..' 가 '.'로 바뀌었습니다. : "...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"

4단계 아이디의 처음에 위치한 '.'가 제거되었습니다. : ".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

5단계 아이디가 빈 문자열이 아니므로 변화가 없습니다. : "bat.y.abcdefghijklm"  "bat.y.abcdefghijklm"

6단계 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm"  "bat.y.abcdefghi"

7단계 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다. : "bat.y.abcdefghi"  "bat.y.abcdefghi"

 

따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.

 

제한사항

  • new_id는 길이 1 이상 1,000 이하인 문자열입니다.
  • new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
  • new_id에 나타날 수 있는 특수문자는 -_.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.

 

입출력 예

No. new_id result
예1 "...!@BaT#*..y.abcdefghijklm" "bat.y.abcdefghi"
예2 "z-+.^." "z--"
예3 "=.=" "aaa"
예4 "123_.def" "123_.def"
예5 "abcdefghijklmn.p" "abcdefghijklmn"

 

2. 문제 접근 방식 (문제 단순화 하기)

  • 단계가 7개라 할 건 많아 보이지만, 막상 문제 자체는 간단하다.
  • 매 단계에서 실수 없이 시키는 대로만 잘하면 되는 문제이기 때문에, 정확히 뭘 해야 되는지만 간단명료하게 짚고 넘어가면 된다. 

시키는 것만 잘 하자

  • 위 내용을 보고 대부분 사람들이 먼저 떠올리는 건 '정규표현식'일 것이다.
  • 나도 마찬가지로 정규표현식이 떠올랐고, 그와 함께 그동안 정규표현식을 등한시했던 나날들을 떠올리며 후회하는 마음이 들었다.
  • 하지만 내가 아는 한 대부분은 정규표현식을 그때그때 구글링 해서 쓰지, 외워서 쓰는 사람은 거의 없었다.
  • 그러니 당황하거나 후회에 빠지기보다는 정규표현식 없이도 풀 수 있다는 생각으로 문제를 풀어보고,
    정규표현식을 사용한다면 얼마나 더 간단해지는지 한번 짚고 넘어가면 좋을 것 같다.

 

3-1. 해결책 1 - 정규표현식 없이 푸는 solution

class Solution {
    public String solution(String new_id) {
        // 1
        String answer = "";
        new_id = new_id.toLowerCase();
        // 2
        for (int i = 0; i < new_id.length(); i++) {
            char ch = new_id.charAt(i);
            if (Character.isAlphabetic(ch) || 
                Character.isDigit(ch) || 
                ch == '-' || ch == '_' || ch == '.')
                answer += ch;
        }
        // 3
        while (answer.indexOf("..") != -1)
            answer = answer.replace("..", ".");

        // 4
        if (!answer.isEmpty() && answer.charAt(0) == '.')
            answer = answer.substring(1);
        if (!answer.isEmpty() && answer.charAt(answer.length() - 1) == '.')
            answer = answer.substring(0, answer.length() - 1);

        // 5
        if (answer.isEmpty())
            answer = "a";

        // 6
        if (answer.length() > 15) {
            answer = answer.substring(0, 15);
            if (answer.charAt(answer.length() - 1) == '.')
                answer = answer.substring(0, answer.length() - 1);
        }

        // 7
        while (answer.length() < 3)
            answer += answer.charAt(answer.length() - 1);

        return answer;
    }

    public static void main(String[] args) {
        Solution sol = new Solution();
        System.out.print(sol.solution("=.="));
    }
}

  • 1단계 : .toLowerCase 함수를 기억하면 소문자로 치환하는 것은 어려울 게 없다.
  • 2단계 : isAlphabetic, isDigit 함수 정도는 알아둬야 문자열 처리 문제에서 기본적인 문제라도 풀 수 있다.
  • 3단계 : "."이 여러 개 있는 걸 어떻게 처리할지 고민이었다면 while loop를 활용해서 replace 해주면 된다.
    • 그렇다면 "..." 라는 String이 ".."로 바뀌고, 다음 while loop에서는 "."으로 바뀌어서 여러 번의 while loop를 돌며 모든 복수 개의 점을 하나의 점으로 바꿔준다.
  • 4단계 : .substring 함수를 활용하면 한 문자열의 부분을 잘라낼 수 있다. 
  • 5단계 : .isEmpty 함수를 활용하면 문자열의 empty 여부를 판단할 수 있다.
  • 6단계 : 4단계와 동일하게 substring으로 잘라내면 된다.
  • 7단계 : while loop을 활용하여 answer.length()가 3이 되지 않을 경우에만 마지막 character를 붙인다.

 

 

 

 

 

 

3-2. 해결책 2 - 정규표현식을 활용한 solution

class Solution {
    public String solution(String new_id) {
        // 1
        String answer = new_id.toLowerCase();
        // 2
        answer = answer.replaceAll("[^-_.a-z0-9]", "");
        // 3
        answer = answer.replaceAll("\\.+", ".");
        // 4
        answer = answer.replaceAll("^[.]|[.]$", "");
        // 5
        if (answer.equals(""))
            answer = "a";
        // 6
        if (answer.length() > 15){
            answer = answer.substring(0, 15);
            answer = answer.replaceAll("[.]$", "");
        }
        // 7
        while (answer.length() < 3)
            answer += answer.charAt(answer.length() - 1);

        return answer;
    }

    public static void main(String[] args) {
        Solution sol = new Solution();
        System.out.print(sol.solution("...!@BaT#*..y.abcdefghijklm"));
    }
}

  • 정규표현식의 기본 형태는 String.replaceAll('From', 'To')이다.
  • 그래서 변경하고자 하는 String에 대해서 'From : 어떤 문자열을', 'To : 어떻게 바꿀지'를 정규표현식으로 표현하면 된다.
  • 여기서 정규표현식을 활용하는 단계는 2, 3, 4, 6-2단계이다.
  • 각각의 단계에서 사용되는 정규표현식이 의미하는 것은 다음과 같다.

 

4. 정리

  • 문자열 유형 문제는 카카오와 같은 기업들에서만 나와서 자주 접하지 않을 수도 있다.
  • 그러다 보니 매번 헷갈릴 수 있는데, 이럴 때 기본적인 것들 몇 가지만 외워두자.
  • .toLowerCase, isAlphabetic, isDigit, isEmpty, substring 등의 문자열 관련 함수들은 기본이다.
  • 정규표현식은 위의 표에 정리한 내용 정도만 외워두고, 다음 문제에서 또 나오면 조금씩 더 외워가자.
  • 기본자세는 정규표현식 없이도 회사 합격해서 잘 다닐 수 있다는 마음으로 조금씩 외워 나가면 될 것 같다.

 

  • 자세한 설명은 유튜브 영상 참고