AI Researcher가 될끄야!/자연어처리8 [자연어 처리] 정규표현 정의 : 텍스트 편집기 또는 프로그래밍 언어에서 특정 유형의 문자열을 검색 또는 치환할 때 사용 문자열의 검색과 치환 외에도 텍스트 처리의 핵심 사용예 특정 문자열 포함 문자열 모두검색 특정유형 문자열 검색 반복메타 문자 매칭 및 기타 메타 문자 정규표현 이스케이프문자 -매치 함수 import re re.match('1','1234') type(re.match('1','1234')) 다만 매치하는 것이 없을 때는 아무것도 출력되지 않음 (오류는 나지 않음) -정규표현과 조건문 a=['abc','bcd103','103abc'] re.search('\w+',a)//오류 for i in a : if re.search('\d+',i): print(i,re.search('\d+',i).group()) -finda.. 2021. 1. 12. [자연어 처리] 파이썬 기본데이터 구조 및 함수 함수 Collections.Counter 분석대상의 빈도를 파악할 수 있음 매개변수를 어떻게 넣냐에 따라 스플릿(단어를 나누는) 기준이 다름. 기본적으로는 하나의 문자열마다 카운팅. import collections a='apple\tapple\tbanana' collections.Counter(a) type(collections.Counter(a)) 데이터 타입은 collections.Counter 내부적으로는 사전 형식이나 외부적으로는 카운터 데이터 구조. collections.Counter(a).most_common() 카운터 구조를 리스트구조로 바꾸어줌. dict(Counter(a)) 이렇게 할 시에는 사전구조로 바뀜. -Counter와 사전 메소드 b=Counter(a) b.items() b.k.. 2021. 1. 12. 이전 1 2 다음