[ADSP] 1과목 오답노트
1과목 문제
데이터 마스킹
데이터 마스킹이란 데이터의 길이, 유형, 형식과 같은 속성을 유지한 채, 새롭고 읽기 쉬운 데이터를 익명으로 생성하는 기술
반정형 데이터
데이터 내부에 메타 데이터를 갖고 있으며 일반적으로 파일 형태로 저장
표출화
개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정
공통화는 암묵적 지식 노하우를 다른 사람에게 알려주는 것
연결화는 책이나 교본에 자신이 알고있는 새로운 지식을 추가하는 것
내면화는 만들어진 책이나 교본을 보고 암묵적 지식을 습득하는 것
메타데이터, 인덱스
메타데이터 - 데이터에 대한 데이터로써 하위레벨의 데이터를 설명/기술하려는 것
인덱스 - 데이터베이스 내의 데이터를 신속하게 정렬하고 탐색하게 해주는 구조
스키마구조 - 데이터베이스의 구조와 제약조건에 관한 전반적인 명세를 기술한 것
데이터 마트 - 데이터 웨어하우스와 사용자 사이의 중간층에 위치한 것으로, 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스
ERP(Enterprise Resource Planning)
인사, 재무, 생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리 시스템의 경영자원을 하나의 통합 시스템으로 재구축함으로써 생산성을 극대화하려는 경영혁신기법
CRM(Customer Relationship Management)
- 기업이 고객과 관련된 내외부 자료를 분석, 통합해 고객 중심 자원을 극대화
SCM(Supply Chain Management)
- ‘공급망 관리’를 뜻하는 말로, 기업에서 원재료의 생상, 유통 등 모든 공급망 단계를 최적화
- 외부 공급업체 또는 제휴업체와 통합된 정보시스템
- 자재 구매, 생산, 제고, 유통, 판매, 고객 데이터로 구성
KMS(Knowledge Management System)
- 지식관리시스템을 의미, 기업 경영을 지식이라는 관점에서 새롭게 조명하는 접근방식
데이터의 가치를 측정하기 어려운 이유
- 데이터 활용 방식: 재사용, 재조합(Mashup), 다목적용 개발
- 새로운 가치 창출
- 분석 기술 발전
데이터 난수화
- 고객의 과거 구매기록이나 나이, 수입, 건강정보와 같은 데이터가 해독이 불가능한 난수화를 통해 변경된 채로 기업에 전송
- 데이터가 본래 목적 외에 가공되고 처리되는 것을 방지하는 기술
신용평가(Credit Rating)
- 투자자 보호를 위하여 금융상품 및 신용공여 등에 대하여 그 원리금이 상환될 가능성과 기업, 법인 및 간접투자기구 등의 신용도를 평가하는 행위
- 핀테크 분야에서 활발하게 이루어짐
K-NN(K Nearest Neighbot)
학습 데이터 중 가장 유사한 K개의 데이터를 이용해서 값을 예측하는 방법, 딥러닝과 관련 X
딥러닝과 관련있는 분석 기법
- LSTM(Long Short-Term Memory)
- Autoencoder
- RNN(Recurrent Neural Network)
Deep learning 소프트웨어
- Caffe
- Tensorflow
- Theano
데이터베이스
- 관계형 DBMS
- 데이터를 컬럼과 로우를 이루는 하나 이상의 테이블
- 고유키가 각 로우를 식별
- 객체지향 DBMS
- 정보를 ‘객체’형태로 표현하는 데이터베이스
- 사용자 정의 데이터 및 멀티미디어 데이터 등 복잡한 데이터 구조를 표현 관리할 수 있는 데이터베이스 관리 시스템
- 네트워크 DBMS
- 레코드들이 노드로, 레코드들 사이의 관계가 간선으로 표현되는 그래프를 기반으로 하는 DB모델
- 계층형 DBMS
- 트리 구조를 기반으로하는 계층 DB모델
데이터 처리 영역
- 분석적영역
- 수학
- 확률모델
- 머신러닝
- 분석학
- 패턴인식과 학습
- 불확실성 모델링
- IT영역
- 시그널 프로세싱
- 프로그래밍
- 데이터 엔지니어링
- 데이터 웨어하우스
- 고성능 컴퓨팅
- 분산 컴퓨팅
- 비즈니스 컨설팅 영역
- 커뮤니케이션
- 프레젠테이션
- 스토리텔링
- 시각화
인문학 열풍
- 컨버전스 -> 디버전스
- 생산 -> 서비스
- 생산 -> 시장창조
데이터 레이크
- 정제되지 않은 자연스러운 상태의 아주 큰 데이터 세트
- 2017년은 이를 적절히 관리해 운영하는 첫해
유전자 알고리즘
- 생명의 진화를 모방해 최적해를 구하는 알고리즘
- 존 홀랜드가 1975년 개발
- 어떤 미지의 함수 Y=f(x)를 최적화하는 해를 찾기위해, 진화를 모방한 탐색 알고리즘
댓글남기기