본문 바로가기

전체 글24

데이터 과학을 위한 통계 Part 1 데이터 분석을 위해서는 통계 지식이 필수라 하여, 요즘 통계학에 관심이 많아졌다. 그러던 중, 통계 지식을 파이썬에 응용하는 방법도 알려주는 좋은 책을 발견하여 이 책으로 공부하기로 했다! 아직 1강만 봤지만 기초 지식도 잘 설명되어 있을 뿐만 아니라, 코드도 알려줘서 넘 좋다:) 앞으로 완독까지 화이팅!! Part 1. 탐색적 데이터 분석 (EDA) 정형화: 가공 안한 데이터를 활용 가능한 데이터로. 테이블 형태가 기본. 수치형 데이터 (숫자로 표현) : 연속형 (풍속, 지속시간 등), 이산형 (횟수 같은 정수값) 범주형 데이터 (가능 범주 안의 값) : 이진형 (모아니면도), 순서형 (값들 사이에 순서가 있음) 테이블에서의 각 열: feature 각 행: record *응답변수/ 종속변수 예측 모델에.. 2022. 3. 16.
MODE 사이트에서 데이터분석 혼자 공부하기 SQL 코드도 다 배웠는데... 이론은 이제 알겠고, 근데 이게 어떻게 쓰인다는 건가. Join 함수를 통해 각종 자료들을 정리해서 원하는 정보를 볼 수 있겠다는 건 알겠다. 하지만 데이터 분석가에게 SQL이 엄청 중요하다던데, 데이터 분석가는 어떻게 SQL을 사용하는지가 궁금했다. 그래서 알게 된 사이트가 mode! 이론 뿐만이 아니라, 3개의 실제 analytics 예제가 있어서 이 예제만 보기로 했다. 영어 원서를 번역하면서 정리한 것이기 때문에 한글과 영어가 뒤죽박죽으로 섞여있고, 전체 내용을 정리한 것이 아닌 나에게 필요한 부분들만 정리했기에, 문제별로 맨 밑에 있는 Insight 부분만 볼 것을 추천한다. engagement: 제품과 상호작용하여 일종의 서버 호출을 수행하는 것 (ex.버튼 클.. 2022. 3. 12.
세상에서 가장 쉬운 통계학 입문 - 그로스마케터 권장도서 데이터 분석을 하는 사람이라면, 해당 데이터를 분석하기 위해 통계학적 지식이 필수적이다. 하지만 나는 통계를 1도 접해본 적이 없으므로, 기초 통계학 베이스부터 다지기로 했다. 그중 이 책을 참고서로 선정한 이유는, 통계학 입문자들에게 가장 추천하는 책이라길래 골랐다! 책에 대한 전반적인 리뷰라기보단, 책을 통해 배운 것을 적으며 복습해 보고자 한다. [1장] 평균값 = 계급값x상대도수의 합계. 평균을 구하는 다양한 방법: (x+y)/2 = 산술평균 (가장 일반적인 방법) √xy = 상승평균 (성장율 평균에 잘 사용됨) √(x**2 + y**2) / 2 = 제곱평균 (마이너스 값이 있을 때. 편차들의 평균 값) 평균으로 전체를 알 수는 없다. (평균소득 != 평등한 나라) 고로, '표준 편차' 가 필요하.. 2022. 3. 8.
데이터분석 웹크롤링 RISS로 쉽게 연습하기 ※ 모든 과정의 코드를 가져오지는 않았다는 점 참고해주세요. ※ 간단한 크롤링 방법을 제외하고, 신경 쓴 부분들만 가져왔습니다. #폴더 생성 방법 f_dir = 'c:\\py_temp\\' now= time.localtime() time_stamp='%d-%d-%d-%d'%(now.tm_mon, now.tm_mday, now.tm_hour, now.tm_min) folder_name = f_dir+search+'_'+time_stamp os.mkdir(folder_name) #폴더 생성 os.chdir(folder_name) #디렉토리 변경 #텍스트 파일 생성 f_name = folder_name+'\\'+search'+'.txt' #\\를 넣어서, 경로로 들어가게 함 #콤마 제거하기 search_num.. 2022. 3. 5.
반응형