광주인력개발원 일일포스팅(메모장)
-
15주차 화 1128(데이터_수집하기)광주인력개발원 일일포스팅(메모장) 2023. 11. 28. 15:58
file_path = "./01_data/한국전력거래소_시간별 전력수요량_20211231.csv" df = pd.read_csv(file_path, encoding="euc-kr") 날짜1시2시3시4시5시6시7시8시9시...15시16시17시18시19시20시21시22시23시24시 02021-01-01649426259360905598895963859936601935998259626...56691582996042562931641766364562754615616197963055 12021-01-02606585860357309566635673357327583785928560669...55493578656140764223650826425762981616866196264227 22021-01-0361992597235..
-
15주차 화 1128 (데이터_전처리기초)광주인력개발원 일일포스팅(메모장) 2023. 11. 28. 13:34
""" - 행렬 데이터를 처리하기 위한 다양한 함수를 지원하는 라이브러리 - 파일 읽기, 저장, 행렬데이터 처리, 기본시각화 등 지원 - 데이터 전처리 과정에서 주로 사용됨 데이터 수집 > 데이터 전처리 > 데이터 가공(필요시 전처리) > 데이터 분석 탐색 / 시각화(필요시 전처리) > 필요시 모델 훈련(머신러닝 or 딥러닝) > 웹서비스 또는 분석보고서 * 일반적으로 책에서는 : 데이터수집 > 전처리 > 분석 > 시각화로 설명되고 있다. * 분석과정은 회사에 따라 다름. """ 판다스 임포트! import pandas as pd """ - 날짜 확인 : 기준일로 사용 - 범주형 데이터 확인 : 예로 남자 또는 여자와 같은 데이터(연령) - """ ### 데이터 읽어들이기 ### 파일 위치 지정 fil..
-
14주차 금 1124(데이터 분석, 조인관련..)광주인력개발원 일일포스팅(메모장) 2023. 11. 24. 16:45
-- [문제] /* - 회원아이디 b001 회원 마일리지값보다 큰, - 회원정보 조회하기 - 조회컬럼 : 회원아이디, 이름 */ SELECT mem_id, mem_name, mem_mileage FROM member WHERE mem_id = 'b001' ; SELECT A.mem_id, A.mem_name FROM member A, (SELECT mem_id, mem_name, mem_mileage FROM member WHERE mem_id = 'b001') B WHERE A.mem_mileage > B.mem_mileage; -- 다른방법 SELECT mem_id, mem_name FROM member WHERE mem_mileage > (SELECT mem_mileage FROM member WH..
-
14주차 목 1123(데이터 분석, 조인(Join)광주인력개발원 일일포스팅(메모장) 2023. 11. 23. 18:13
조인이다! -- join /* - Inner Join 방식은 : 인반방식 or 표준방식 모두 표준처럼 사용됨 (Inner Join - 일반방식) Select 테이블1. 컬럼1...테이블n.컬럼1 From 테이블1, 테이블2... 테이블n Where 관계조건(PK = FK) And 일반조건 (Inner Join - 표준방식) Select 테이블1. 컬럼1...테이블n.컬럼1 From 테이블1 Inner Join 테이블2 On(관계조건(PK = FK) And 일반조건) Inner Join 테이블n On(관계조건(PK = FK) And 일반조건) Group by ....그룹이 있는경우 Having ....그룹 조건이 있는경우 Order by ....정렬이 있는 경우 */ */ -- 크로스 조인 -- : 아래 ..
-
14주차 수 1122(데이터분석, 그룹함수 와 집합함수)광주인력개발원 일일포스팅(메모장) 2023. 11. 22. 18:43
-- 그룹함수 또는 집합함수 ... -- 표준... /* - count() : 행의 갯수 (컬럼명을 사용하는 경우 null은 제외) - avg() : 평균 ( null인 경우 처리 필요 ) - max() : 최대값( null인 경우 처리 필요 ) - min() : 최소값( null인 경우 처리 필요 ) - sum() : 합계 ( null인 경우 처리 필요 ) */ SELECT COUNT(*) AS all_cnt, AVG(mem_mileage) AS all_avg, SUM(mem_mileage) AS all_sum, MAX(mem_mileage) AS mileage_max, MIN(mem_mileage) AS mileage_min FROM MEMBER; -- null이 존재하는 컬럼의 경우에는 -- : n..
-
14주차 수 1122( 데이터분석, 함수)광주인력개발원 일일포스팅(메모장) 2023. 11. 22. 17:39
-- 회사 종속 함수들...`다른` DB에서는 함수이름이 조금 다름 -- [문제] -- 상품분류명에 컴퓨터가 포함되어 있고, -- 주문이력이 있는 상품에 대한 데이터를 조회 -- 상품명, 상품분류명 조회하기 SELECT prod_name, (SELECT lprod_nm FROM lprod WHERE lprod_gu = prod_lgu) AS lprod_nm FROM prod -- 조건절 WHERE prod_lgu IN (SELECT lprod_gu FROM lprod WHERE lprod_nm LIKE '%컴퓨터%') AND prod_id IN (SELECT cart_prod FROM cart); -- Replace() : 치환하기 SELECT REPLACE('컬럼1에 찾을값이 있다', '찾을값', '바..
-
14주차 화 1121(데이터 분석, 연산자, 문제풀이)광주인력개발원 일일포스팅(메모장) 2023. 11. 21. 17:10
별칭사용하기 별칭을 사용하는 이유 : 긴 단어를 줄여서 사용하는데 좋음 /* SQL에서 별칭을 사용할 수 있는 곳 - 컬럼명 대신 별칭 사용 : 예시) mem_id as id - 테이블명 대신 별칭 사용 : 예시) From member mem */ -- 회원 테이블 전체 조회하기 -- 컬럼명 : [mem_id, mem_pass, ...] -- [{'a001','ab',...},{'b001','bc',...},{'...'},,,] SELECT * FROM member; -- 회원의 마일리지 값이 10 이상인 데이터만 조회하기 -- 조회컬럼은 회원아이디, 회원이름, 마일리지 -- 별칭, id, mame, point -- 사용할 테이블명 : member -- 사용할 컬럼명 : mem_mileage, mem_i..
-
14주차 월 1120(데이터베이스, MariaDB CRUD)광주인력개발원 일일포스팅(메모장) 2023. 11. 20. 16:49
DBMS는 데이터베이스 관리 시스템(Database Management System)의 약어로, 데이터베이스를 관리하고 조작하는 소프트웨어 시스템입니다. DBMS는 데이터베이스를 효과적으로 관리하여 데이터의 안전성, 일관성, 공유성 등을 제공하고, 사용자와 응용 프로그램이 데이터에 접근할 수 있도록 인터페이스를 제공합니다. 다양한 DBMS가 있지만, 주로 사용되는 몇 가지 유형은 다음과 같습니다: 관계형 데이터베이스 관리 시스템 (RDBMS): 예시: MySQL, PostgreSQL, Oracle, Microsoft SQL Server 데이터를 테이블로 구성하고, 테이블 간의 관계를 이용하여 데이터를 조직하는 방식을 채택합니다. 비관계형 데이터베이스 관리 시스템 (NoSQL DBMS): 예시: Mongo..