알고리즘 공부/파이썬 알고리즘 인터뷰

04 가장 흔한 단어(Most common words)

환성 2022. 1. 10. 17:09
728x90

문제: 금지된 단어를 제외한 가장 흔하게 등장하는 단어를 출력하라. 대소문자 구분을 하지 않으며, 구두점(마침표, 쉼표) 또한 무시한다.

 

예제:

Input: paragraph = "Bob hit a ball, the hit BALL flew far after it was hit.", banned = ["hit"]
Output: "ball"
Explanation: 
"hit" occurs 3 times, but it is a banned word.
"ball" occurs twice (and no other word does), so it is the most frequent non-banned word in the paragraph. 
Note that words in the paragraph are not case sensitive,
that punctuation is ignored (even if adjacent to words, such as "ball,"), 
and that "hit" isn't the answer even though it occurs more because it is banned.
Input: paragraph = "a.", banned = []
Output: "a"

 

솔루션:

  • 리스트 컴프리헨션, Counter 객체 사용
    def mostCommonWord(self, paragraph: str, banned : List[str]) -> str:
      words = [word for word in re.sub(r'[^\w]', ' ',paragraph).lower().split() # ^not을 의미 .
        if word not in banned] #  \w는 단어 문자를 뜻함, 즉 단어 문자가 아닌 모든 문자를 공백으로 치환 
    
      counts = collections.Counter(words)
      return counts.most_common(1)[0][0] # 가장 흔하게 등장하는 단어의 첫 번째 인덱스 리턴, (balls,2)

 

 

 

 

문제 출처: https://leetcode.com/problems/most-common-word/