일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 데이터3법
- AI
- 자료형
- 클라우드
- 알고리즘
- 도커
- 회귀분석
- 코딩테스트 연습
- vagrant
- 정보보안
- 웹 모의해킹
- 개인정보보호법
- 파이썬 문법
- XSS 취약점
- 데이터 분석
- 데이터분석
- 웹모의해킹
- 파이썬
- 백준
- 마이데이터
- 시저암호
- 머신러닝
- 코테
- 코딩테스트
- 함수
- AWS
- 프로그래머스
- 컴퓨터 구조
- docker
- 개인정보보호
- Today
- Total
목록AI (인공지능)/미니프로젝트 (9)
찬란하게
영/프/인/타 언어 판별기 {0} {1}
wepapp.py #!/usr/bin/env python3 import cgi, os.path import joblib # 학습된 모형 정보 읽어 들이기 pklfile = os.path.dirname(__file__) + "/freq2.pkl" clf = joblib.load(pklfile) # 텍스트 입력 양식 출력하기 def show_form(text, msg=""): with open("C:/pydata/cgi-bin/style2.py", "r", encoding="utf-8") as lp: html = lp.read() print(html.format(text, msg)) # 판정하기 def detect_lang(text): # 알파벳 출현 빈도 구하기 text = text.lower() code..

언어 판별 서비스 소개 알파벳으로 구성된 문장을 입력하면 그 문장이 영어인지, 프랑스어인지, 인도네시아어인지, 타갈로그어인지를 판별해준다. STEP1. 언어 판별하는 모형 학습시키기 모형 만드는 과정 파일로 저장 # # 1. 라이브러리 준비 # In[1]: from sklearn import svm, metrics # glob - 문자열을 파일 경로로 인식 -> 디렉터리 형태로 import glob, os.path, re, json # # 2. 함수 준비 # # check_freq() : 알파벳 출현 빈도 조사 # In[ ]: # 텍스트를 읽어 들이고 출현 빈도 조사하기 --- (※1) def check_freq(fname): name = os.path.basename(fname) lang = re.ma..
part1. 사전 과정¶ 1) import 라이브러리¶ In [2]: # 학습용 데이터 import mglearn.datasets import pandas as pd import numpy as np import sklearn # 차트 시각화 import matplotlib.pyplot as plt # 폰트 한글 설정 plt.rcParams['font.family'] = 'Gulim' 2) 데이터 준비¶ In [28]: X,y = mglearn.datasets.make_blobs(centers=4, random_state=8) len(X) Out[28]: 100 In [29]: # y값 범주형 데이터 준비 y = y%2 y Out[29]: array([1, 0, 1, 1, 1, 0, 0, 1, 1, 1,..
Boston 주택가격 예측 - 회귀분석을 통해서¶ part1. data 준비 과정¶ Import Library¶ In [1]: import mglearn import sklearn 다중선형회귀분석¶ y(label) : 주택가격 x(features) : 주택가격에 미치는 요인 -> school 위치, station... In [5]: X, y = mglearn.datasets.load_extended_boston() X len(X) Out[5]: 506 In [3]: y # 수치형 Out[3]: array([24. , 21.6, 34.7, 33.4, 36.2, 28.7, 22.9, 27.1, 16.5, 18.9, 15. , 18.9, 21.7, 20.4, 18.2, 19.9, 23.1, 17.5, 20.2..
part1. 패키지 임포트¶ In [2]: import mglearn import sklearn In [3]: # 패키지 잘 들어왔는지 확인 # 대문자 x는 전체 집합 X,y = mglearn.datasets.make_forge() X[:5] # ndarray : 수치형 Out[3]: array([[ 9.96346605, 4.59676542], [11.0329545 , -0.16816717], [11.54155807, 5.21116083], [ 8.69289001, 1.54322016], [ 8.1062269 , 4.28695977]]) In [4]: y # 범주형 데이터 Out[4]: array([1, 0, 1, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1,..
In [124]: from IPython.core.display import display, HTML display(HTML("")) In [125]: #경고(WARNING) 비표시 import warnings warnings.filterwarnings('ignore') 1) 쇼핑 웹에서 주문수 분석하기!¶ step 1 : 데이터 읽기¶ 데이터 준비 :¶ customer_master : 고객 정보 item_master : 상품 정보 transaction1 & 2 : 거래 내역 transaction_detail_1 & 2 : 거래 내역 디테일 In [126]: import pandas as pd customer_master = pd.read_csv('dataset/customer_master.csv') c..
서울시 범죄현황 통계자료 분석 및 시각화 0. import import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from matplotlib import font_manager, rc # rc == run configure(configuration file) 1. 데이터 입력 및 데이터 전처리 1) df = pd.read_excel() # 파일 읽기 # 서울시 관서별 5대 범죄 발생 & 검거 현황 @ data.go.kr # 원본 데이터 및 전처리 작업을 위한 파이썬 코드 @ folder named [ Original data source & data preprocessing (5대범죄 & 인구..