반응형 데이터 엔지니어2 [쉽게 설명한] 정형, 비정형, 반정형 데이터 데이터베이스라는 말은 누구나 들어봤을 것이다. 데이터를 저장하는 장소? 맞다. 그럼 데이터베이스에는 어떤 데이터를 저장할 수 있을까? 숫자? 텍스트(글자)? 그림(이미지)? 음성(소리)? 영상? 파일? 이렇게 데이터의 종류는 너무나도 많다. 위 그림에서 숫자, 글자와 같이 미리 만들어진 형식 또는 틀에 저장되는 데이터를 정형 데이터라고 한다. 그냥 행과 열로 이루어진 표에 저장할 수 있는 데이터를 정형 데이터라 보면 된다. 엑셀, 구글 스프레드시트, 워드에 저장하는 데이터라고 생각하자. 그리고 그림, 음성과 같이 데이터 하나하나가 데이터 뭉치(객체)로 되어있는 데이터를 비정형 데이터라고 한다. 무슨 말이냐면 우리가 보기에는 그림, 음성 데이터도 표에 삽입할 수 있는 하나의 데이터처럼 보이지만 분석하기 위.. 2020. 6. 3. [쉽게 설명한] 데이터 모델링 데이터모델링은 아주 기초적인 내용이지만 개념을 전혀 모르면 쓸모없는(효율적이지 않은) 데이터베이스를 만들어 버릴 수도 있기 때문에... 반드시 공부하고 넘어가자. 하지만 내용이 어렵지 않고 데이터베이스를 만들면서 자연스럽게 익숙해지니 걱정 안 해도 된다! 먼저, 모델링이란 말이 뭘까? 많이 사용하는 단어지만 뭔가 추상적인 단어라 감이 안 올 수 있다. 예전에 수강했던 머신러닝 수업에서 강사님은 모델링을 [옷의 사이즈를 찾는 과정]에 비유하셨다. (※TIP - 머신러닝 모델링의 결과는 함수이고, 데이터 모델링의 결과는 데이터베이스다) 나에게 딱 맞는 옷을 사면 좋겠지만 의류회사는 나 혼자만을 위해서 딱 맞는 옷을 만들어 줄 수 없다. 최대한 많은 사람들에게 팔 수 있도록 여러 체형을 측정해서 일정 범위별 .. 2020. 6. 2. 이전 1 다음 반응형