우리 에프아이에스 기술 세미나 2

1차 기술세미나(2024.01.03 발표)

주제 : 데이터 처리를 위한 Pandas와 Numpy의 활용목차 1. 데이터에 대한 이해2. Pandas, Numpy 소개3. Pandas 실제 사용 예시4. Pandas 성능 향상을 위한 tip 1. 데이터에 대한 이해현재 데이터는 폭발적으로 증가하는 추세 데이터의 크기가 커질수록 데이터를 분석하기 어려워짐.=> Numpy와 Pandas는 데이터를 '효율적'으로 분석하기 위한 패키지 2. Pandas, Numpy 소개- Pandas란 무엇인가?정의 : 데이터 처리를 위한 Python 라이브러리강점 : 대용량 데이터 처리 가능, 데이터 구조화 기능, 데이터 조작 기능, 데이터 시각화 기능 - Numpy란 무엇인가?정의 : 행렬 및 대규모 다차원 배열을 처리하는 Python 연산 라이브러리강점1. ndar..

2차 기술세미나 정리(2024.03.07 발표)

주제 : SQL 성능 최적화 전략 1. 인덱스 최적화2. 파티셔닝 최적화3. 쿼리 튜닝으로 나누어 최적화 전략를 세웠다. 1. 인덱스 최적화인덱스 정의 데이터 베이스 테이블의 성능 향상. 검색 및 정렬 작업을 빠르게 수행하기 위한 데이터의 논리적 순서를저장하는 데이터 구조인덱스 장단점장점 : 데이터 검색 속도 향상, 정렬된 데이터 접근 용이, 데이터 집합 연산 최적화단점 : 스토리지 공간 요구, 데이터 변경에 따른 오버헤드, 인덱스 선택과 관리의 복잡성인덱스 종류(저장 방식)클러스터형 인덱스 테이블 당 1개만 존재 가능데이터 정렬에 따른 영향물리적으로 레코드 정렬보조 인덱스 테이블 당 여러개 존재 가능데이터 정렬에 영향 미치지 않음.다양한 쿼리 유형 지원인덱스 생성 조건카디널리티(cardinality)가..