혼공#파이썬데이터분석#공부기록#파이썬#데이터#분석2 03-1 혼공 파이썬 데이터 분석 불필요한 데이터 삭제하기 데이터정제: 수집된 데이터에서 잘못된 부분을 고치거나 제거하여 필요한 데이터를 준비하는 과정 데이터 올바르게 정제되지 못하면 분석된 결과 왜곡될 수 있음 데이터 랭글링(데이터 먼징):데이터 정제하는 과정과 분석 및 머신러닝에 적합한 형태로 데이터를 변환하는 과정 원소별 비교: 판다스의 데이터프레임과 인덱스를 하나의 값과 비교하면 데이터프레임과 인덱스에 있는 모든 원소와 비교 비교한 결과는 True 또는 False 로 이루어진 불리언 배열로 반환 넘파이:파이썬의 대표적 다차원 배열 판다스의 데이터프레임과 달리 한 종류의 데이터만 담을 수 있지만 매우 효율적이며 높은 성능 파이썬의 다른 과학 패키지와 호환성이 높으며 기본 데이터 구조로 널리 사용 [핵심함수와 메서드] DataFram.. 2023. 7. 26. Chapter02-2 혼공 파이썬 데이터 분석 웹스크래핑 사용하기 웹스크래핑:웹사이트에서 필요한 데이터 추출하는 기술 사용하기 먼저 공개API를 통해 사용할 수 있는지 확인 필요 뷰티풀수프:HTML문서 파싱하는데 사용하는 대표적 파이썬 패키지 Requests 패키지로 가져온 HTML에서 원하는 태그나 텍스트를 찾는 기능을 제공 핵심 함수와 메서드 Loc:레이블 또는 불리언 배열로 데이터 프레임의 행과 열을 선택 정수로 지정하면 인덱스의 레이블로 간주 불리언 배열로 지정할 경우 배열의 길이는 행 또는 열의 전체 길이와 같아야 한다 BeautifulSoup.find():현재 태그 아래의 지식 태그 중에서 지정된 이름에 맞는 모든 태그 찾는다 찾은 태그가 없을 경우 None 반환 BeautifulSoup.find.all():현재 태그 아래의 자식 태그 중.. 2023. 7. 24. 이전 1 다음