본문 바로가기

반응형

전체 글

[데이터 시리즈 #4] 옵트인과 옵트아웃 이해하기 본 시리즈는 제가 과거 책을 출판해볼까 하고 Brunch에 연재 하다가 곧 바빠서 그만두고 묵혀 두던 글을 블로그로 가져오려는 것입니다. 그래서 최대한 객관적으로 쓰려다 보니 제가 평소에 얘기하던 어조와는 조금 다를 수 있습니다. 그리고 새로 올라온 글 같지만 일부 Outdated된 내용이 있을 수 있음을 미리 알립니다. (지금은 시간이 다시 생겼으니 혹시 이런 내용으로 책을 출판사가 있다면 연락바랍니다😊 비전공자들에게 데이터나 AI를 쉽게 이해시키기 위한 목적의 연재입니다.) 목차1. 데이터란 무엇인가?2. 빅데이터란 무엇인가?3. 데이터 활용과 개인정보 보호4. 옵트인과 옵트아웃5. 데이터 댐과 데이터 레이크 옵트인과 옵트아웃미국과 유럽에서 개인정보를 바라보는 관점의 차이 앞선 글에서 개인정보 활용.. 더보기
[데이터 시리즈 #3] 데이터 활용과 개인정보 보호 본 시리즈는 제가 과거 책을 출판해볼까 하고 Brunch에 연재 하다가 곧 바빠서 그만두고 묵혀 두던 글을 블로그로 가져오려는 것입니다. 그래서 최대한 객관적으로 쓰려다 보니 제가 평소에 얘기하던 어조와는 조금 다를 수 있습니다. 그리고 새로 올라온 글 같지만 일부 Outdated된 내용이 있을 수 있음을 미리 알립니다. (지금은 시간이 다시 생겼으니 혹시 이런 내용으로 책을 출판사가 있다면 연락바랍니다😊 비전공자들에게 데이터나 AI를 쉽게 이해시키기 위한 목적의 연재입니다.) 목차1. 데이터란 무엇인가?2. 빅데이터란 무엇인가?3. 데이터 활용과 개인정보 보호4. 옵트인과 옵트아웃5. 데이터 댐과 데이터 레이크데이터 활용과 개인정보 보호개인정보 보호법과 데이터 3법 개정  빅데이터 활용, 데이터 경제.. 더보기
CPM(Critical Path Method, 임계경로법) 제대로 알기 (계산 예제) 한국에서 컴퓨터 공학을 전공하고, 정보처리기사부터 기술사까지 관련 자격증을 공부해본 사람이라면 PERT/CPM에 대해선 개념적인 부분은 대부분 알고 있는 것 같다. 프로젝트 관리라고 하면 대표적으로 언급되는 기술이기 때문에 시험에서 안나오는 일이 없다. 하지만 국내 IT 프로젝트 매니징에선 실제로 많이 쓰이지 않기에 개념 이상으로 더 깊게 들어가는 경우는 많지 않은 것 같다. 하지만 실제 계산을 해보지 않고 답안지용 개념만 외우다 보면 주요 개념 조차 헷갈려 착각하는 경우가 많기에 간단한 예제와 함께 정리를 한번 해보고자 한다. 우선 프로젝트 관리에서의 일정 관리, 그 중에서 임계경로법의 목표가 무엇인가? CPM의 목적은 "최단 경로"를 찾는 것이 아니다. "최장 경로"를 찾아 프로젝트의 지연을 방지하는.. 더보기
AVL 트리 (심화) - 더블 로테이션 이 글은 기본적인 AVL 트리에 대해 알고 있는 사람들을 위한, 좀 더 심화 버전의 글이다. 또는 AVL 트리를 조금 공부했지만 헷갈려서 정리가 필요한 사람을 위한 글이 될 수도 있다. AVL 트리는 컴퓨터 전공 대학생이나 개발 분야로 취직하고자 하는 사람들은 흔히 공부를 하는 주제이다. 보통 LL, RR, RL, LR 등의 상황에서 왼쪽 회전, 오른쪽 회전 등을 공부하였을 것이다. 하지만 여기서 우리는 조금 다른 표현을 쓴다. AVL이라는 개념이 처음 나왔을 때 없었던, 후세에 연구되어 좀 더 개선된 방식이다. 기존에, 우리는 아래와 같은 로테이션을 공부하였다. (이 부분은 그냥 훑고 지나가자) 오른쪽에 있던 2가 왼쪽 위로 올라가면서, 1이 왼쪽 아래로 내려가는 상황을 Left Rotation이라고 .. 더보기
Resilient Distributed Datasets (RDD) 스파크에 관한 논문 한국어 번역 Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster ComputingMatei Zaharia, Mosharaf Chowdhury, Tathagata Das, Ankur Dave, Justin Ma, Murphy McCauley, Michael J. Franklin, Scott Shenker, Ion StoicaUniversity of California, BerkeleyAbstract (초록)We present Resilient Distributed Datasets (RDDs), a distributed memory abstraction that lets programmers perform in-memory .. 더보기
Google MapReduce (맵리듀스) 논문 한국어 번역 뭔가 개념이 어렵거나 추상적인 느낌만 있고 분명하지 않을 때는 논문이나 책을 정독하는 것이 최고다. 지금은 하둡보단 Apache Spark가 업계의 표준으로 자리잡았지만 그 기반은 모두 구글의 맵리듀스를 기반으로 한다. 맵리듀스에 대한 개념을 모르고도 스파크는 충분히 사용할 수 있다. 하지만 스파크도 제대로 쓰기 위해선 그 기본 이론부터 다져볼 필요가 있다. MapReduce: Simplified Data Processing on Large Clusters Jeffrey Dean and Sanjay Ghemawatjeff@google.com, sanjay@google.comGoogle, Inc. Abstract (초록)MapReduce is a programming model and an associat.. 더보기
[데이터 시리즈 #2] 빅데이터란 무엇인가? 빅데이터란 무엇인가?다크 데이터로 보는 빅데이터의 개념 빅데이터가 무엇인지 소개하기 위해 다크 데이터를 먼저 설명하는 경우는 흔치 않을 겁니다. 하지만 이 책에서 데이터 관한 최대한 많은 개념들을 다루고자 하는 입장에서 기왕이면 다크 데이터라는 개념도 짚고 갈 겸, 이렇게 소개해보려고 합니다.참고로 다크 데이터는 요즘 이슈가 되는, 무서우면서 뭔가 불법적인 뉘앙스가 있는 '다크 웹'과는 연관이 거의 없습니다. 그냥 손에 잡히지 않는 무언가를 설명하기 위해 '다크'라는 수식어를 사용하고 있을 뿐입니다. 다크 데이터는 기업에서 다양한 IT 시스템, 네트워크 장비를 운용해가며 사업을 영위하는 과정에서 발생하는 수많은 데이터 중 '손댈 수 없는' 데이터를 말합니다. 손댈 수 없다는 의미는 우선 데이터가 어디 있.. 더보기
[데이터 시리즈 #1] 데이터란 무엇인가? 본 시리즈는 제가 과거 책을 출판해볼까 하고 Brunch에 연재 하다가 곧 바빠서 그만두고 묵혀 두던 글을 블로그로 가져오려는 것입니다. 그래서 최대한 객관적으로 쓰려다 보니 제가 평소에 얘기하던 어조와는 조금 다를 수 있습니다. 그리고 새로 올라온 글 같지만 일부 Outdated된 내용이 있을 수 있음을 미리 알립니다. (지금은 시간이 다시 생겼으니 혹시 이런 내용으로 책을 출판사가 있다면 연락바랍니다😊 비전공자들에게 데이터나 AI를 쉽게 이해시키기 위한 목적의 연재입니다.) 목차1. 데이터란 무엇인가?2. 빅데이터란 무엇인가?3. 데이터 활용과 개인정보 보호 우리가 앞으로 데이터에 대해 이야기하려면 데이터가 무엇인지 그 개념을 먼저 이해해야 합니다. 데이터의 사전적 정의는 "이론을 세우는 데 기초가.. 더보기

반응형