딥러닝
(광주인공지능학원) 마지막 3차프로젝트 이야기
광주인공지능학원 스마트인재개발원의 마지막 이야기입니다 :) 3차프로젝트 최종발표회가 끝나고 8월 31일(노래가사 같네요.. 8월 31일..) 을 마지막으로 수료식을 가졌습니다. 마지막 프로젝트인만큼 최선을 다했고 하루에 4~5시간씩 자면서 준비했습니다. 그래서 결과도 최우수상을 수상하고 팀원들과도 ..ㅠㅠ 다같이 상받고 눈물을 흘렸습니다. 아래는 저희팀 발표 영상입니다. 광주인공지능학원 스마트인재개발원.. 오묘한 학원인 것 같습니다. 힘든데.. 힘들고 분명 따라가기 버거운데 어느순간 실력은 조금씩 늘고 팀원들과 결과물이 나옵니다.. 만들고나면 우리가 정말 이걸 어떻게 만들었지? 하면서 놀라곤 합니다.. 여튼 이 날은 발표준비도 해야했고, 전시도 가서 봐야했고, 셋팅도 해야하고 고용노동부 차관님과 이야기도..
(광주인공지능학원) 3차프로젝트 MediaPipe 복습하기
The solution utilizes a two-step detector-tracker ML pipeline, proven to be effective in our MediaPipe Hands and MediaPipe Face Mesh solutions. Using a detector, the pipeline first locates the person/pose region-of-interest (ROI) within the frame. The tracker subsequently predicts the pose landmarks and segmentation mask within the ROI using the ROI-cropped frame as input. Note that for video us..
(광주인공지능학원)3차프로젝트 MFCC 복습하기
Voice can combine what people say and how they say it by two-factor authentication in a single action. Other identifications like fingerprints, handwriting, iris, retina, face scans can also help in biometrics but voice identification is needed as an authentication that is both secure and unique. Voice can combine two factors, namely, personal voice recognition and telephone recognition. Voice r..
(광주인공지능학원) 3차프로젝트 안드로이드 어플리케이션 만들기 및 논문분석
광주인공지능학원에서의 프로젝트 최종관문 안드로이드 어플리케이션 만들기이다. 광주인공지능학원 이은비쌤에게 전수 받은 안드로이드 실력을 뽐내본다. 광주인공지능학원 수업 중 안드로이드 수업은 모든 학생들이 최고 열심히 듣는다 바로바로 결과물이보이기도하고 광주인공지능학원 이은비쌤이 정말.. 열정적으로 알려주시기도 하신다. 그리고 광주인공지능학원 우리팀은 웹으로 만들지 않고 안드로이드로 직접 코딩하며 제작하였다. 다들 자바개발자가 되고싶기도하고 좀 더 우리 스스로 만들어보고 싶은 욕구가 강하기 때문이다. 광주인공지능학원에서 약 2주정도 배웠지만 정말 퀄리티가 높게 나온 것 같다. 아직 디자인적인 요소가 부족하지만 이런부분들은 차차 보완할 요소이다. 아래는 광주인공지능학원에서 배운 안드로이드이다. package c..
(광주인공지능학원) 3차프로젝트 멀티쓰레드 설계 및 울음소리 분석
광주인공지능학원 스마트인재개발원의 3차프로젝트 1주 남은 상황... 모션감지 및 울음소리 CNN분석이 끝났다. 광주인공지능학원에서의 팀원들과 마지막 7일을 밤을 새며 작업중이다. 오늘은 쓰레드 포스팅이다.. 정말 어려운 부분이다.. 1. 음성레코드함수 def record(): global room global cry while(True): if os.path.isfile('file.wav'): os.remove('file.wav') FORMAT = pyaudio.paInt16 CHANNELS = 1 RATE = 44100 CHUNK = 1024 RECORD_SECONDS = 5 WAVE_OUTPUT_FILENAME = "file.wav" audio = pyaudio.PyAudio() # start Rec..
(광주인공지능학원) 3차프로젝트 파이썬 멀티쓰레드 & CNN 신생아 울음소리 분석(2)
광주인공지능학원 스마트인재개발원에서의 3차프로젝트를... 밤을 새가며 하고있다. 그 와중에 광주인공지능학원과 별개로 스스로 면접지원하여 3군데에 합격도 했고 최종면접만 남았다. 광주인공지능학원 스마트인재개발원에서 기업도 추천해주셨지만 개인적으로 인공지능 개발자로 가고 싶기에 개인적으로 서류를 냈는데 모두 합격했다. 아마 광주인공지능 스마트인재개발원에서 받은 상장과 프로젝트가 한몫 한것 같다. CNN 모델링을 좀 더 해볼까 한다. 기존 MLP와 달리 CNN 2D 사용하려면 4차원데이터의 피쳐추출이 이루어져야한다 다음 소스는 3차원데이터로 피쳐가 추출 된다 max_ped_len = 271 test_num = 0 def extract_features2(file_name): audio, sample_rate =..
(광주인공지능학원)신생아 울음소리 분석 CNN모델 만들기
광주인공지능학원 스마트인재개발원에서의 3차프로젝트가 시작 우리팀은 아이의 움직임으로 생체징후 뒤집기를 파악하고, 방안 소리를 (조용함, 시끄러움, 울음, 웃음) 아이의 울음소리는 총 5가지 (고통, 트림, 배고픔, 불편함, 피곤함)으로 분류하려고 한다. 데이터는 수집량이 부족해서 4개의 전처리를 하였다. ①Adding white Noise ②Shfting the Sound ③Streching the Sound ④Reverse the sound import pandas as pd import librosa import numpy as np from sklearn.model_selection import train_test_split from tensorflow.keras.models import Seque..
(광주인공지능학원) CNN 기초공부하기 2
Conv2D ( filters = 32, kernel_size = (5, 5), padding='valid', input_shape=(28, 28, 1), activation='relu‘, strides = (2, 2) ) 첫번째 인자 : Convolution 필터의 수. 두번째 인자 : Convolution 커널의 (행, 열). Conv2D ( filters = 32, kernel_size = (5, 5), padding='valid', input_shape=(28, 28, 1), activation='relu‘, strides = (2, 2) ) padding : 경계 처리 방법을 정의. ‘valid’ : 유효한 영역만 출력. 따라서 출력 이미지 사이즈는 입력 사이즈보다 작다. ‘same’ : 출력 ..
(광주인공지능학원) CNN 딥러닝 기초다지기
MLP 이미지 분석 MLP은 층이 깊어지고 뉴런의 수가 많아지면 가중치 수가 급격히 늘어 난다. MLP 신경망을 이미지 처리에 사용한다면 이미지의 어떤 특정 패턴이 존재하는 위치에 민감하게 동작하며 패턴의 위치에 종속적인 결과를 얻는다. MLP는 아래 세 개의 5는 패턴이 다르다고 판단한다. MLP로 이러한 숫자 인식을 하려면 숫자의 크기를 비슷하게 맞추어야 한다. (광주인공지능학원) CNN (Convolution Neural Network) 광주인공지능학원 이명훈연구원님 설명에 의하면 1998년 Yann Lecun 교수에 의해 1950년 대 수행했던 고양이의 뇌 파 실험에 영감을 얻어 이미지 인식을 획기적으로 개선 할 수 있는 CNN 제안 이미지를 가까운 거리에서 본다면 조금 더 떨어져서 보면 더 떨어..
(광주인공지능학원) Skeleton Vector Information and RNN Learning Algorithm 공부하기
행동 인식은 데이터를 통해 인간의 행동을 인식하는 기술로서 비디오 감시 시스템을 통한 위험 행동과 같은 어플리케이션에 활용 되어 질 수 있다. 기존의 행동 인식 알고리즘은 2차원 카메라를 통한 영상이나 다중모드 센서, 멀티 뷰와 같은 장비를 이용한 방법을 사용하거나 3D 장비를 이용하여 이루어져 왔다. 2차원 데이터를 사용한 경우 3차원 공간의 행위 인식에서는 가려짐과 같은 현상으로 낮은 인식율을 보였고 다른 방법은 복잡한 장비의 구성이나 고가의 추가적인 장비로 인한 어려움이 많았다. 본 논문은 RGB와 Depth 정보만을 이용하여 추가적인 장비 없이 CCTV 영상만으로 인간의 행동을 인식하는 방법을 제안한다. 먼저 RGB 영상에서 스켈레톤 추출 알고리즘을 적용하여 관절과 신체부위의 포인트를 추출한다. ..
(광주인공지능학원) 3차 프로젝트 MFCC Deep Learning 기반의 음성인식 공부
음성 신호를 인식기를 통하여 문자나 사용자가 인식할 수 있는 데이터로 변환하는 음성인식 기술은 IT기술의 발달에 따라 다양한 용도로 사용이 가능하다. 이러한 기술은 이동 통신기기, 가전제품, 자동차, 로봇 등에 적용이 가능해지면서 일상 생활에 많은 변화를 가져오고 있다. 음성 인식 방법은 마이크 등의 입력장치에서 입력되는 음성신호를 미리 학습 된 음성신호나 DB에 저장해놓은 데이터를 비교하여 인식하 는 방법이 가장 많이 사용 잡음이 섞인 음성신호의 잡음을 제거하는 음성강화법 [1-3] 은 FIltering Techniques에 해당하는 SSM (Spectral Subtraction Method) [4,5], Wiener Filtering [6], SSA (Signal Subspace Approach) [..
(광주인공지능학원) 안드로이드 기초
기본 아키텍쳐 리눅스 커널 일단 가장 아랫단에, Linux 커널 이 올라가 있다. 일반적인 Linux 커널과 크게 다르지는 않지만, 모바일 디바이스에 최적화된 전력 관리 기능이나 안드로이드에 최적화된 Binder IPC (프로세스간 커뮤니케이션) 부분등이 포함되어 있다. 시스템 라이브러리 리눅스 커널위에는 C로 구현된 몇가지 네이티브 라이이브러리들이 올라가 있다. 3차원 그래픽을 위한, OPEN GL, 로컬 데이타 베이스를 제공하는 SQLLite 데이타 베이스, 웹 브라우징을 위한 WebKit, 멀티미디어 재생을 위한 Media Framework들이 올라가 있다. 이러한 시스템 라이브러리들은 내부적으로 JNI 인터페이스를 통해서 자바 코드로부터 호출되게 된다. 안드로이드 런타임 이러한 시스템 라이브러리 ..