광주인공지능학원
(광주인공지능학원) 마지막 3차프로젝트 이야기
광주인공지능학원 스마트인재개발원의 마지막 이야기입니다 :) 3차프로젝트 최종발표회가 끝나고 8월 31일(노래가사 같네요.. 8월 31일..) 을 마지막으로 수료식을 가졌습니다. 마지막 프로젝트인만큼 최선을 다했고 하루에 4~5시간씩 자면서 준비했습니다. 그래서 결과도 최우수상을 수상하고 팀원들과도 ..ㅠㅠ 다같이 상받고 눈물을 흘렸습니다. 아래는 저희팀 발표 영상입니다. 광주인공지능학원 스마트인재개발원.. 오묘한 학원인 것 같습니다. 힘든데.. 힘들고 분명 따라가기 버거운데 어느순간 실력은 조금씩 늘고 팀원들과 결과물이 나옵니다.. 만들고나면 우리가 정말 이걸 어떻게 만들었지? 하면서 놀라곤 합니다.. 여튼 이 날은 발표준비도 해야했고, 전시도 가서 봐야했고, 셋팅도 해야하고 고용노동부 차관님과 이야기도..
(광주인공지능학원) 3차프로젝트 MediaPipe 복습하기
The solution utilizes a two-step detector-tracker ML pipeline, proven to be effective in our MediaPipe Hands and MediaPipe Face Mesh solutions. Using a detector, the pipeline first locates the person/pose region-of-interest (ROI) within the frame. The tracker subsequently predicts the pose landmarks and segmentation mask within the ROI using the ROI-cropped frame as input. Note that for video us..
(광주인공지능학원)3차프로젝트 MFCC 복습하기
Voice can combine what people say and how they say it by two-factor authentication in a single action. Other identifications like fingerprints, handwriting, iris, retina, face scans can also help in biometrics but voice identification is needed as an authentication that is both secure and unique. Voice can combine two factors, namely, personal voice recognition and telephone recognition. Voice r..
(광주인공지능학원) 3차프로젝트 안드로이드 어플리케이션 만들기 및 논문분석
광주인공지능학원에서의 프로젝트 최종관문 안드로이드 어플리케이션 만들기이다. 광주인공지능학원 이은비쌤에게 전수 받은 안드로이드 실력을 뽐내본다. 광주인공지능학원 수업 중 안드로이드 수업은 모든 학생들이 최고 열심히 듣는다 바로바로 결과물이보이기도하고 광주인공지능학원 이은비쌤이 정말.. 열정적으로 알려주시기도 하신다. 그리고 광주인공지능학원 우리팀은 웹으로 만들지 않고 안드로이드로 직접 코딩하며 제작하였다. 다들 자바개발자가 되고싶기도하고 좀 더 우리 스스로 만들어보고 싶은 욕구가 강하기 때문이다. 광주인공지능학원에서 약 2주정도 배웠지만 정말 퀄리티가 높게 나온 것 같다. 아직 디자인적인 요소가 부족하지만 이런부분들은 차차 보완할 요소이다. 아래는 광주인공지능학원에서 배운 안드로이드이다. package c..
(광주인공지능학원) 3차프로젝트 멀티쓰레드 설계 및 울음소리 분석
광주인공지능학원 스마트인재개발원의 3차프로젝트 1주 남은 상황... 모션감지 및 울음소리 CNN분석이 끝났다. 광주인공지능학원에서의 팀원들과 마지막 7일을 밤을 새며 작업중이다. 오늘은 쓰레드 포스팅이다.. 정말 어려운 부분이다.. 1. 음성레코드함수 def record(): global room global cry while(True): if os.path.isfile('file.wav'): os.remove('file.wav') FORMAT = pyaudio.paInt16 CHANNELS = 1 RATE = 44100 CHUNK = 1024 RECORD_SECONDS = 5 WAVE_OUTPUT_FILENAME = "file.wav" audio = pyaudio.PyAudio() # start Rec..
(광주인공지능학원) 3차프로젝트 파이썬 멀티쓰레드 & CNN 신생아 울음소리 분석(2)
광주인공지능학원 스마트인재개발원에서의 3차프로젝트를... 밤을 새가며 하고있다. 그 와중에 광주인공지능학원과 별개로 스스로 면접지원하여 3군데에 합격도 했고 최종면접만 남았다. 광주인공지능학원 스마트인재개발원에서 기업도 추천해주셨지만 개인적으로 인공지능 개발자로 가고 싶기에 개인적으로 서류를 냈는데 모두 합격했다. 아마 광주인공지능 스마트인재개발원에서 받은 상장과 프로젝트가 한몫 한것 같다. CNN 모델링을 좀 더 해볼까 한다. 기존 MLP와 달리 CNN 2D 사용하려면 4차원데이터의 피쳐추출이 이루어져야한다 다음 소스는 3차원데이터로 피쳐가 추출 된다 max_ped_len = 271 test_num = 0 def extract_features2(file_name): audio, sample_rate =..
(광주인공지능학원)신생아 울음소리 분석 CNN모델 만들기
광주인공지능학원 스마트인재개발원에서의 3차프로젝트가 시작 우리팀은 아이의 움직임으로 생체징후 뒤집기를 파악하고, 방안 소리를 (조용함, 시끄러움, 울음, 웃음) 아이의 울음소리는 총 5가지 (고통, 트림, 배고픔, 불편함, 피곤함)으로 분류하려고 한다. 데이터는 수집량이 부족해서 4개의 전처리를 하였다. ①Adding white Noise ②Shfting the Sound ③Streching the Sound ④Reverse the sound import pandas as pd import librosa import numpy as np from sklearn.model_selection import train_test_split from tensorflow.keras.models import Seque..
(광주인공지능학원) CNN 기초공부하기 2
Conv2D ( filters = 32, kernel_size = (5, 5), padding='valid', input_shape=(28, 28, 1), activation='relu‘, strides = (2, 2) ) 첫번째 인자 : Convolution 필터의 수. 두번째 인자 : Convolution 커널의 (행, 열). Conv2D ( filters = 32, kernel_size = (5, 5), padding='valid', input_shape=(28, 28, 1), activation='relu‘, strides = (2, 2) ) padding : 경계 처리 방법을 정의. ‘valid’ : 유효한 영역만 출력. 따라서 출력 이미지 사이즈는 입력 사이즈보다 작다. ‘same’ : 출력 ..
(광주인공지능학원) CNN 딥러닝 기초다지기
MLP 이미지 분석 MLP은 층이 깊어지고 뉴런의 수가 많아지면 가중치 수가 급격히 늘어 난다. MLP 신경망을 이미지 처리에 사용한다면 이미지의 어떤 특정 패턴이 존재하는 위치에 민감하게 동작하며 패턴의 위치에 종속적인 결과를 얻는다. MLP는 아래 세 개의 5는 패턴이 다르다고 판단한다. MLP로 이러한 숫자 인식을 하려면 숫자의 크기를 비슷하게 맞추어야 한다. (광주인공지능학원) CNN (Convolution Neural Network) 광주인공지능학원 이명훈연구원님 설명에 의하면 1998년 Yann Lecun 교수에 의해 1950년 대 수행했던 고양이의 뇌 파 실험에 영감을 얻어 이미지 인식을 획기적으로 개선 할 수 있는 CNN 제안 이미지를 가까운 거리에서 본다면 조금 더 떨어져서 보면 더 떨어..
(광주인공지능학원) 3차 프로젝트 MFCC Deep Learning 기반의 음성인식 공부
음성 신호를 인식기를 통하여 문자나 사용자가 인식할 수 있는 데이터로 변환하는 음성인식 기술은 IT기술의 발달에 따라 다양한 용도로 사용이 가능하다. 이러한 기술은 이동 통신기기, 가전제품, 자동차, 로봇 등에 적용이 가능해지면서 일상 생활에 많은 변화를 가져오고 있다. 음성 인식 방법은 마이크 등의 입력장치에서 입력되는 음성신호를 미리 학습 된 음성신호나 DB에 저장해놓은 데이터를 비교하여 인식하 는 방법이 가장 많이 사용 잡음이 섞인 음성신호의 잡음을 제거하는 음성강화법 [1-3] 은 FIltering Techniques에 해당하는 SSM (Spectral Subtraction Method) [4,5], Wiener Filtering [6], SSA (Signal Subspace Approach) [..