데이터분석과 머신러닝

https://github.com/yyhh314/AlgorithmVisualization/blob/main/DrawMatrixs.py GitHub - yyhh314/AlgorithmVisualization Contribute to yyhh314/AlgorithmVisualization development by creating an account on GitHub. github.com 행렬의 변화를 gif로 확인해볼 수 있으면 좋을 것 같아서 구현해보았다. * 일단 0부터 9까지의 정수 배열만 가능하고, 모든 정수 배열은 N*M사이즈로 동일해야 한다. * 미로찾기를 시각화하려고 만든 것이다. 결과 보기: 더보기 더보기 [ 구현 기능 ] 2. N*M 행렬의 변화과정을 gif파일로 저장 : draw_matr..
학습 글: 2022.02.24 - [분류 전체보기] - 딥러닝 | 인공 신경망 분류 모델 만들기 2022.02.25 - [분류 전체보기] - 딥러닝 | 딥러닝 모델 성능 높이기 | layer 추가 & 활성화함수 & 옵티마이저 조정하기 2022.02.26 - [데이터분석과 머신러닝] - 딥러닝 | 과대적합 피하기 | optimizer, dropout (+콜백) 마지막이네요.. 더이상 소통하지 않더라도 항상 기억하고 있을게요 힘차게 응원해주셔서 감사했습니다.. 넘 따뜻한 방학이었어요.. 💝 기본 미션: 확인문제 07-1 풀기 1. 어떤 인공 신경망의 입력 특성이 100개이고 밀집층에 있는 뉴런 개수가 10개일 때 필요한 모델 파라미터의 개수는? 답: ③ 1010개 풀이: 인공 신경망 모델에서의 모델 파라미터..
한빛미디어 도서 의 전개를 따른 내용이다. 챕터 7, 딥러닝을 시작합니다! * 딥러닝의 핵심 알고리즘 '인공 신경망' * 대표적인 인공 신경망 라이브러리 텐서플로, 케라스 * 인공 신경망 모델의 훈련을 돕는 도구 익히기 혼공단 활동의 마지막 챕터.. 하지만 머신러닝 책 진도는 남았다.. 이제 학기가 시작되니까 여름 방학에 이어서 해야 하려나 ㅠㅠ 혼공단 활동 덕분에 그래도 강제성이 좀 있어서 꾸준히 했다. 사용한 데이터와 따로 정의한 함수 정보 더보기 # 손실 곡선 확인하기 훈련된 모델이 과적합인지 판단하기 위해서 '훈련세트의 손실 곡선 vs 검증세트의 손실 곡선'을 시각화해보자. 딥러닝 모델은 epoch마다 손실을 계산한다. 훈련 데이터에 대한 손실을 줄여나가는 목적으로 학습이 이루어지는데, 과적합인지..
한빛미디어 도서 의 전개를 따른 내용이다. 챕터 7, 딥러닝을 시작합니다! * 딥러닝의 핵심 알고리즘 '인공 신경망' * 대표적인 인공 신경망 라이브러리 텐서플로, 케라스 * 인공 신경망 모델의 훈련을 돕는 도구 익히기 딥러닝 모델의 성능을 높이기 위해서는 - layer를 추가하기 - 적절한 활성화함수 사용하기 - 적절한 옵티마이저 사용하기 를 고려해볼 수 있다. 케라스의 도움을 받아서 순서대로 실습해볼 것이다. 데이터셋 준비 더보기 # layer 추가하기 인공 신경망이 여러 층 모이면 심층 신경망이 된다. => 딥러닝! 지난 번에는 오로지 입력층, 출력층만 있는 인공신경망을 만들었다. 이번에는 그 사이에 은닉층(hidden layer)를 추가해볼 것이다. ⓐ 층 추가 방법 1 layer 객체를 생성하여..
한빛미디어 도서 의 전개를 따른 내용이다. 챕터 7, 딥러닝을 시작합니다! * 딥러닝의 핵심 알고리즘 '인공 신경망' * 대표적인 인공 신경망 라이브러리 텐서플로, 케라스 * 인공 신경망 모델의 훈련을 돕는 도구 익히기 [ 주저리.. ] 패션 아이템 데이터셋 (fashion_mnist)로 실습했다. 데이터셋의 이미지를 슬쩍 보니까 아주 예쁜 킬힐이 보이네 갖고싶게두... 물론 난 킬힐에 아주 미숙하지만... 어떻게 하면 킬힐을 신고 잘 걸어다닐 수 있는지 모르겠다.. 데이터 준비 더보기 훈련 데이터 : 60000개의 28*28 이미지 타겟 데이터 : 60000개의 1차원 배열 테스트 데이터 : 10000개의 28*28 이미지 테스트 타깃 : 10000개의 1차원 배열 사용할 이미지 데이터 확인: ( 앞 ..
https://github.com/yyhh314/MachineLearning/blob/main/DrawKmeansProcess.py GitHub - yyhh314/MachineLearning Contribute to yyhh314/MachineLearning development by creating an account on GitHub. github.com k-means 알고리즘이 동작하는 과정을 보여주는 기능은 구현되어있는 것 같지 않아서 모듈로 만들어보았습니다. 시각적으로 k-means 과정을 확인할 수 있습니다. [ 구현 기능 ] 1. 정지된 scatter plot의 나열로 확인 : kmeans_process_2d() 2. gif파일로 확인 : gif_kmeans 사용 방법 1. !git clon..
학습 글: 2022.02.14 - [데이터분석과 머신러닝] - 머신러닝 | 픽셀 분포의 특징을 뽑아내어 clustering 2022.02.14 - [데이터분석과 머신러닝] - 머신러닝 | k-평균 알고리즘 (KMeans) | 군집 알고리즘 2022.02.17 - [데이터분석과 머신러닝] - 머신러닝 | 주성분분석(PCA)을 이미지 데이터에 적용하여 픽셀 축소하기 4주차 트리알고리즘이 가장 재밌었다고 했는데 바뀌었다. 5주차가 제일 인터레스팅... ㅇㅅㅇ! 역시 시각적으로 들어오는 데이터가 최고다!! 기본 미션: k-평균 알고리즘 작동 방식 설명하기 # K-평균 알고리즘 (k-means) 군집 알고리즘 중 하나이다. ▶ 알고리즘 ⓐ cluster 개수 k를 미리 지정하면, 무작위로 cluster cente..
한빛미디어 도서 의 전개를 따른 내용이다. 챕터 6, 비지도 학습 * 타깃이 없는 데이터를 사용하는 비지도학습과 대표적인 알고리즘을 소개 * 대표적인 군집 알고리즘인 k-평균과 DBSCAN을 배우자 * 대표적인 차원 축소 알고리즘인 주성분 분석 (PCA)를 배우자 [ 포스팅 목차 ] 1. 주성분 분석 (PCA) + 주성분이 가지는 의미 ? 2. PCA로 이미지를 축소하는 과정 3. 축소한 데이터를 복원하기 + 설명된 분산 (explained variance) ? 4. PCA로 축소한 데이터로 모델 훈련시 이점 # 주성분 분석(Principal Component Analysis, PCA) : 원본 데이터를 주성분(벡터)로 정사영시켜 차원을 줄이는 방법이다. 원본 데이터를 최대한 보존하며 변환한다. ◎ 이미..
한빛미디어 도서 의 전개를 따른 내용이다. 챕터 6, 비지도 학습 * 타깃이 없는 데이터를 사용하는 비지도학습과 대표적인 알고리즘을 소개 * 대표적인 군집 알고리즘인 k-평균과 DBSCAN을 배우자 * 대표적인 차원 축소 알고리즘인 주성분 분석 (PCA)를 배우자 k-평균 알고리즘으로 3종의 과일을 군집화해보자. 과연.. 성공적으로 군집을 형성할 것인지!! >_ cluster 크기 감소 -> 이너셔 감소 cluster 개수에 따른 이너셔 변화를 그래프로 확인해보자. (굽은 모양이 팔꿈치같다고 해서 엘보우라는 이름이 붙었다 한다.) (귀엽다ㅠㅠ) cluster가 증가하는데도 inertia값이 감소하는 속도가 갑자기 작아지는 구간이 있다. k=3지점! 그곳이 최적의 k 지점이다. (그 cluster 개수보다..
한빛미디어 도서 의 전개를 따른 내용이다. 챕터 6, 비지도 학습 * 타깃이 없는 데이터를 사용하는 비지도학습과 대표적인 알고리즘을 소개 * 대표적인 군집 알고리즘인 k-평균과 DBSCAN을 배우자 * 대표적인 차원 축소 알고리즘인 주성분 분석 (PCA)를 배우자 그토록 기다리던 비지도학습이다. 개인적으로 비지도학습은 결과를 확인하는 맛이 좀 있는 듯하다. 정답이 없어야 더 도전하는 맛이 있는 느낌이라고 해야하나..!! [ 포스팅 내용 ] 1. 군집(clustering) ㅡㅡㅡㅡㅡㅡㅡ( 실습 )ㅡㅡㅡㅡㅡㅡㅡ 2. 이미지 데이터의 구조 3. 픽셀이 이미지 특징을 어떻게 나타낼까 4. 특정 픽셀값 분포를 가진 이미지 골라내기 # 군집(clustering) 비슷한 샘플끼리 그룹으로 모으는 작업이다. 모인 그룹..
히어로맛쿠키
'데이터분석과 머신러닝' 카테고리의 글 목록