티스토리 뷰
목차
SQLD 자격증 취득을 축하드립니다! 하지만 치열한 데이터 분석가(DA) 채용 시장에서 자격증 한 줄만으로는 합격의 문을 뚫기 어렵습니다. 기업이 진짜 원하는 것은 "객관식 이론 문제를 잘 푸는 사람"이 아니라, "실제 방대한 데이터를 다루고 분석하여 비즈니스 인사이트를 도출할 수 있는 사람"입니다. 이를 증명할 수 있는 유일하고도 가장 강력한 무기가 바로 '데이터 분석 포트폴리오'입니다. 특히 누구나 접근할 수 있는 '공공데이터'를 활용하여 나만의 가설을 세우고 직접 구축한 DB에서 SQL로 데이터를 가공해 낸다면, 실무에 즉시 투입 가능한 준비된 인재임을 완벽하게 어필할 수 있습니다. 오늘 포스팅에서는 SQLD 취득 후 실전 경험이 없어 막막함을 느끼는 취업 준비생들을 위해, 공공데이터 선정부터 로컬 데이터베이스 구축, 고난도 SQL 쿼리 작성, 그리고 노션(Notion)을 활용한 매력적인 문서화 작업까지 포트폴리오 제작의 5단계 핵심 로드맵을 1,500자 분량으로 밀도 있게 총정리해 드립니다.
1. 기획 및 공공데이터 선정: 'Why'에서 출발하라
데이터 분석 포트폴리오의 첫 단추는 엉뚱하게도 데이터가 아닌 '문제 정의'입니다. 무작정 방대한 데이터를 다운로드하기 전에, 내가 평소 관심 있던 사회 현상이나 비즈니스 문제를 먼저 고민해야 합니다. 예를 들어 "서울시 공공자전거(따릉이)의 출퇴근 시간대 거치대 재배치 효율화 방안"이나 "기상청 날씨 데이터와 배달 앱 주문량의 상관관계"와 같이 구체적인 가설을 세운 뒤, 공공데이터포털이나 서울열린데이터광장에서 관련 CSV 파일을 수집하십시오. 목적 없는 분석은 단순한 통계 요약표에 불과하지만, 뚜렷한 가설(Why)을 검증하기 위해 기획된 분석은 채용 담당자의 흥미를 단숨에 사로잡는 강력한 스토리텔링이 됩니다.





2. 로컬 DB 구축 및 데이터 적재 (ETL 파이프라인 경험)
SQLD 시험에서는 종이에 적힌 쿼리만 눈으로 읽었다면, 이제는 직접 나만의 데이터베이스 환경을 세팅해야 할 차례입니다. 실무에서 가장 널리 쓰이는 무료 오픈소스 RDBMS인 MySQL이나 PostgreSQL을 개인 PC에 설치하십시오. DBeaver나 DataGrip 같은 데이터베이스 클라이언트 툴을 연결한 뒤, 수집한 공공데이터 CSV 파일을 테이블(Table) 형태로 임포트(Import)하는 작업을 거칩니다. 이때 컬럼의 데이터 타입(Data Type)을 알맞게 설계하고, 결측치(NULL)나 이상치를 식별하여 1차 정제하는 전처리 과정을 직접 겪어보는 것 자체가 데이터 엔지니어링의 훌륭한 실무 경험이 됩니다.
3. 핵심 역량 어필: 고난도 SQL 쿼리를 활용한 심층 추출
이 단계가 바로 포트폴리오의 심장이자 SQLD 소지자의 진가를 발휘할 곳입니다. 단순한 SELECT와 WHERE 절만 나열해서는 실무 역량을 증명할 수 없습니다. 대여 이력 테이블과 회원 정보 테이블을 엮는 복잡한 다중 조인(JOIN), 서브쿼리(Subquery)와 CTE(WITH 절)를 활용한 논리적 모듈화, 그리고 실무 분석의 꽃이라 불리는 **윈도우 함수(ROW_NUMBER, RANK, LEAD, LAG)**를 적극적으로 사용하여 시계열 추이나 그룹별 순위를 추출해 보십시오. 복잡한 비즈니스 로직을 지저분한 엑셀 작업 없이 SQL 쿼리 하나로 깔끔하고 효율적으로 처리한 코드는, 지원자가 쿼리 최적화와 데이터 모델링을 완벽히 이해하고 있음을 면접관에게 확실히 각인시킵니다.





4. 시각화 대시보드 구축 및 비즈니스 인사이트 도출
SQL로 정제된 숫자 결과물(Result Set)을 이력서에 덩그러니 올릴 수는 없습니다. 채용 담당자와 현업 실무진은 숫자의 나열보다 직관적으로 한눈에 들어오는 '시각화(Visualization)' 자료를 원합니다. 추출한 데이터를 태블로 퍼블릭(Tableau Public), 파워비아이(Power BI), 혹은 파이썬(Python)의 시각화 라이브러리에 연동하여 보기 좋은 그래프와 대시보드로 구성하십시오. 그리고 가장 중요한 것은 "이 그래프가 의미하는 바가 무엇인지", "이 분석 결과를 바탕으로 어떤 비즈니스적 액션을 취해야 하는지"에 대한 **'액션 가능한 인사이트(Actionable Insight)'**를 덧붙이는 것입니다. 데이터의 결론을 내리지 못하는 분석은 미완성입니다.
5. 깃허브(GitHub)와 노션(Notion)을 활용한 매력적인 문서화
마지막으로 이 모든 과정을 남들이 읽기 쉽고 매력적으로 포장하는 '문서화' 작업이 필요합니다. 개발자 친화적인 깃허브(GitHub) 저장소를 파서 작성한 SQL 코드와 원본(또는 샘플) 데이터를 업로드하고, 마크다운(Markdown)을 활용하여 README.md 파일에 분석 요약을 꼼꼼히 작성하십시오. 더 나아가 노션(Notion)을 활용해 프로젝트 배경, 가설 설정, ERD 구조, 핵심 SQL 코드 스니펫, 시각화 대시보드, 그리고 최종 결론과 한계점까지 하나의 웹페이지처럼 깔끔하게 정리하여 이력서에 링크로 첨부하십시오. 코드를 얼마나 잘 짰는지보다, 나의 분석 과정을 얼마나 논리적으로 타인에게 설명하고 설득할 수 있는지가 합격을 가르는 최종 승부처가 됩니다.







🔗 포트폴리오 제작 필수 활용 사이트