본문 바로가기

분류 전체보기

(76)
numpy 함수 정리 numpy Numeric Python import numpy as np : 입력받은 파이선 리스트를 넘파이 배열로 바꾸기 Numpy는 ndarray 라는 넘파이 전용 리스트를 사용하는데 쉽게 행렬이라 생각하시면 됩니다. 생성함수(Array Creation) • np.array() : 입력받은 파이선 리스트를 넘파이 배열로 바꾸기 • np.arange(N) : 0에서부터 N-1까지 1씩 증가하는 배열 만들기 >>> np.arange(5) array([0, 1, 2, 3, 4]) >>> np.arange(10, 30, 5) array([10, 15, 20, 25]) >>> np.arange(0, 2, 0.3) # it accepts float arguments array([0. , 0.3, 0.6, 0.9,..
[Day-54] chap.06_비지도 학습 1. 군집 알고리즘 비지도 학습 : 훈련 데이터에 타깃이 없어(정답지 없음) - 스스로 유용한 무언가를 학습해야 해. - 대표적인 알고리즘 : 군집, 차원 축소 군집(clustering) : 비슷한 샘플끼리 하나의 그룹으로 모으는 대표적인 비지도 학습 작업 - 군집 알고리즘으로 모은 샘플 그룹을 클러스터(cluster) 🔎 npy파일 넘파이 배열의 기본 저장 포맷 npy 이미지 데이터 각 픽셀을 수치화하여 npy 파일로 만들 수 있어 1. 코랩에서 npy 파일 다운받기 => wget 리눅스 명령어 사용해야 함. - 코랩은 파이썬 기반으로 이루어져있기 때문에 그냥 쓸 수 없어 !(느낌표) 붙이기 !wget https://bit.ly/fruits_300_data -O fruits_300.npy -O옵션 저장..
[Day-53] chap.05_트리 알고리즘 5-1. 결정트리 결정트리 : 예/아니오에 대한 질문을 이어나가면서 정답을 찾아 학습하는 알고리즘 불순도 : 결정 트리가 최적의 질문을 찾기 위한 기준 (지니 불순도 / 엔트로피 불순도) 정보 이득 : 부모 노드와 자식 노드의 불순도 차이 결정 트리 알고리즘 정보 이득이 최대화되도록 학습 특성 중요도 : 결정 트리에 사용된 특성이 불순도를 감소하는 데 기여한 정도 캔 와인을 판매하려고 하는데 캔에 레드와인인지 화이트 와인인지 표시가 되어있지 않음 알코올 도수, 당도, pH 값으로 와인의 종류를 구별해보기 0) 로지스틱 회귀로 와인 분류하기 # 데이터 불러오기(6,497개의 와인 샘플) import pandas as pd wine = pd.read_csv('https://bit.ly/wine_csv_dat..
[git] 오류 메시지_The requested URL returned error: 403 상황깃허브 저장소에 수정 권한을 받아 새로운 브랜치를 만들어 수정하고 add / commit 후 push를 하려고 하니 오류가 났다. 참고) [git] Github 협업하기1 (tistory.com) 👀❓에러 메시지fatal: unable to access 'https://github.com/Play-Web-miniProject/recommend_movie.git/': The requested URL returned error: 403PS C:\web_project\recommend_movie> git push origin2 main remote: Permission to Play-Web-miniProject/recommend_movie.git denied to 5dora. fatal: unable t..
[git] Github 협업하기1 보호되어 있는 글입니다.
[Day-52] 로지스틱 회귀 / 확률적 경사 하강법 Chap.04 다양한 분류 알고리즘 럭키백의 확률을 계산하라! 1. 분류 => 농어다 아니다 (k-최근접이웃 분류) 2. 회귀 => 예측 (농어의 길이/두께를 통해 무게 예측) 3. 확률 => 럭키백에 포함된 생선의 확률 알려줘 4-1. 로지스틱 회귀 1. k- 최근접 이웃 분류기로 확률 계산 # 데이터 준비하기 import pandas as pd fish = pd.read_csv('https://bit.ly/fish_csv_data') fish.head() # 위에서부터 5개 데이터 출력 # 판다스 CSV 파일의 첫 줄을 자동으로 인식해 열 제목으로 만들어줘 # 앞쪽 숫자 행 번호 # unique 중복값을 제외한 고유한 값을 꺼내줘 # 생선의 종류 print(pd.unique(fish['Species'..
[Day-51] 머신러닝_ 회귀 chap03. 회귀 알고리즘과 모델규제 📌 3-1. k-최근접 이웃 회귀 1) 지도학습의 두 가지 알고리즘 ㆍ분류 : 몇 개의 클래스 중 하나로 분류하는 문제 ㆍ회귀 : 임의의 어떤 숫자를 예측하는 문제(두 변수 사이의 상관관계를 분석하는 방법) - 회귀조건 => 종속변수와 독립변수가 필요함. 최소제곱합 2) k-nearest 최근접이웃 두 가지 알고리즘 ㆍ분류 => 신규 데이터가 들어왔을 때 가장 가까운 샘플 k개 선택 ㆍ회귀 => 가까운 이웃 샘플을 찾고 이 샘플들의 타깃값을 평균하여 예측 => 어떤 클래스를 선택하는 게 아니라 임의의 수치 💡 k-최근접이웃 회귀 : 가장 가까운 이웃 샘플을 찾고 이 샘플들의 타깃값을 평균하여 예측으로 삼음 - sklearn.neighbors 패키지의 KNeighbo..
[Day-50] 머신러닝 k-Nearest Neighbors 인공지능 => 데이터 필요(정확한!) 우리나라 아직 이미지에 대한 데이터 이미지에 라벨링 작업 필요 데이터에 대한 맥락 웹 크롤링한 데이터는 학습시키기 어려워 자연어 처리분야 유망* 머신러닝 > 딥러닝(뇌구조) > 인공지능 ㆍ 머신러닝 딥러닝 배우면서 이 작업할 때는 어떤 알고리즘에 어떤 모델 정리해 나가기 퍼셉트론 생성 ai(조합의 개념 기존 문장들을 조합해서 결론을 내려주는) LeNet-5 합성망 신공망에 대표 알고리즘 AlexNet이미지 분류쪽 yolo (You Only Look Once) 버전1만 창시자가 만들었어 binary classifiction 이진분류(두 가지 중에 어느 하나를 고르는 문제) 이미지 분류에서는 머신러닝 모든 ai분야에 기본 통계학과 깊은 연관 훈련데이터 / 테스트데이터 /..