본문 바로가기
728x90

머신러닝3

[책 리뷰] 데이터 천재들은 어떻게 기획하고 분석할까? 이 책은 AI, 빅데이터 분야의 국내 전문가 6명이 공동 집필한 데이터 활용 입문서이다. 빅데이터 최신 경영 사례와 현업에서 활용되는 방식에 관해서 이야기한다. 데이터로 의사결정을 하고 합리적인 선택을 하는 방식에 대해서도 들을 수 있다. 어떤 목적을 추구하고 어떤 분석 결과를 기대하는지 어떤 데이터가 필요하고 어떤 분석 방법을 사용할지 결정하는 단계이다. 또한 기획 단계에서는 데이터 전문 분석가가 아닌 해당 비즈니스 분야의 전문가가 제일 잘할 수 있다는 사실을 인지해야 한다. 다른 데이터 분석 서적에서도 읽었지만 데이터 분석가는 어느 회의에나 참여해야 한다. 책에서는 분석이 데이터를 인사이트로 바꿔주는 과정이라고 정의했다. 이처럼 데이터 분석은 분석에서 끝나는 것이 아니라 분석한 후 인사이트를 도출한 .. 2023. 1. 22.
[컴퓨터비젼 과제] 6. SVM(Support Vector Machine) 서포트 벡터 머신이란(이하 SVM) 서포트 벡터 머신은 결정 경계(Decision Boundary), 즉 분류를 위한 일종의 기준선을 정의하는 모델. 새로운 점이 주어졌을 때 경계에 의해 분류됨 핵심은 이 결정 경계를 어떻게 정의하고 계산하는 것. 아래는 데이터의 속성(feature) 이 두개일 경우 생각해보면 결정경계는 아래 예시와 같이 일차함수로 간단히 정의됨 속성이 3개가 될 경우에는 다음과 같이 3차원 공간에서 면으로 정의됨 최적의 결정 경계는? 그럼 해결해야하는 문제는 최적의 결정 경계를 정하는 것 아래의 그래프들 중에서 무엇이 나을까 생각해보면 E랑 F랑 좀 아리송하긴 하지만 F라는 걸 알 수 있는데 이는 결정 경계가 두 클래스와 가장 멀리 떨어져 있기 때문이다. 정리를 해보자면 결정경계는 데.. 2021. 5. 27.
과제1. 머신러닝 강의 듣고 요약하기 강의는 모두를 위한 머신러닝이다. hunkim.github.io/ml/ 모두를 위한 머신러닝/딥러닝 강의 hunkim.github.io Lecture1. 머신러닝 기초 - ML이란? - Learning 이란? - regression 이란? - classification 이란? 머신러닝이란? - 프로그래밍으로는 하기 어려운 동작을 해결하기 위해 1959년 Arthur Samuel 에 의해 탄생 학습이란? Supervised/ UnSupervised 로 나뉘어지는데 Supervised 는 학습 데이터셋이 이미 label 되어 있는 것이다. 예를 들면 강아지/고양이/원숭이 사진이 각각 100개씩 이미 레이블화가 되어 있다는 거다. 아래의 그림을 통해 제대로 살펴볼 수 있다. 반대로 Unsupervised le.. 2020. 10. 28.
728x90