Data Science
-
SFAW 2024 참관후기 - MLOps 범람의 시대Data Science 2024. 3. 31. 18:06
매년 3월 서울 삼성역 코엑스에서 이루어지는 Smart Factory Automation World(이하 SFAW)는 2015년도부터 진행된 행사이다. 단일 주제는 아니며 "국제공장자동화전", "스마트공장엑스포", "한국머신비전산업전" 및 각종 컨퍼런스가 세부 구성을 이루고 있다. 아래의 그림처럼 다양한 주제의 컨퍼런스를 만나볼 수 있다. 제조업 베이스의 Data/AI 관련 직군이나, Data/AI 관련 프로젝트를 수행하시는 분들에게는 다양한 사례 및 기술들을 접할 수 있는 기회의 장이다. 제조업이나 제조업을 대상으로 사업하는 IT 회사에 취직을 희망하는 준비생분들도 참관을 적극 권장드린다. 하드웨어부터 소프트웨어까지 정말 많은 내용들이 다루어지기에 최소 2일 방문을 추천드린다. 이번 글에서는 SFAW의..
-
Diffusion Model 기본 개념 공부하기Data Science/컴퓨터비전 2024. 3. 17. 19:08
Stable Diffusion이 선보인지 2년이 지난 지금. 뒤늦게나마 해당 모델에 대해서 공부를 시작하려한다. 그 첫번째로 오늘은 Diffusion Model의 개념에 대해서 공부해본다. 관련 자료들을 찾아가며 공부한 내용을 정리한 포스팅으로 잘못된 풀이나 정보에 대한 피드백은 언제나 감사히 받겠습니다. 1. 생성형 모델 생성형 모델은 입력받은 데이터와 유사한 분포를 따르는 새로운 데이터를 생성하는 모델이다. 즉, 데이터의 분포를 학습 한다고 할 수 있다. 기존의 대중적인 생성형 모델로는 GAN, VAE, Flow-based model이 있으며, 모두가 데이터의 분포를 학습하는 모습을 볼 수 있다. GAN : Generator가 주어진 latent vector로부터 실제(데이터)와 최대한 유사한 임의의..
-
AI 서울 2024 참관 후기Data Science 2024. 2. 1. 22:32
AI 서울은 서울특별시에서 3회째 운영하는 AI 오픈 디스커션이다. 뭔가 공공기관이 주최한다는 점에서 신선하게 다가왔던 해당 행사는 서울시청의 8층 다목적홀 및 간담회장을 이용해 진행되었다. 크게 6개의 볼거리가 있으며 자세한건 아래와 같다. 기조연설 Track 1 : 국내외 AI 트랜드 전망 Track 2 : IR 세션(오픈이노베이션, 캡스톤 발표 등) Track 3 : 기술세션(국외 저명 컨퍼런스 제출작 소개) 포스터세션 : (국외 저명 컨퍼런스 제출작 포스터 발표) 스타트업세션 : 스타트업 홍보부스 이중에서 내가 참관하여 들었던 내용들을 간단히 정리해보고, 나의 생각을 정리하는 글을 써보려 한다. 1. 기조연설 1.1 글로벌 AI 트랜드 전망 - Stuart Russell 교수님 AI(인공지능)이란..
-
제조업에서 사람의 눈을 컴퓨터비전으로 대체하기 위한 체크포인트Data Science 2023. 12. 17. 16:00
소프트웨어 회사에서 1년, 제조업에서 2년을 보낸 주니어 데이터사이언티스트입니다. 그동안 제조업에서 여러 컴퓨터비전 과제를 수행하면서 요구사항 분석부터 시스템화까지 여러 일들을 겪었는데, 그중 컴퓨터비전 과제를 하기 위해서 체크해야하는 부분들을 작성해봅니다. 제조업 전반이 아닌 저희 회사만의 문제일수도 있고, 맞지 않는 내용일 수 있지만 저의 생각을 정리하는 피드백이나 조언이 있으시다면 언제든지 환영합니다. 0. 시작하며 많은 기업들이 앞다투어서 AI를 자사의 도메인에 적용하고 있다. AI가 적용되는 수많은 프로젝트들은 크게 두가지로 나눌 수 있다. 기존에 사람이 하던 일은 대체하는 것과 새로운 일을 하는 것. 기존에 사람이 하던 일이라는 것은 이미 해당 기업에서 필요성이 합의되어 수행되던 일로 AI로 ..
-
[opencv/python] 동영상 읽어와서 처리 후 다시 동영상으로 만들기Data Science/컴퓨터비전 2023. 6. 18. 19:22
동영상을 기반으로한 프로젝트들을 하다보면, 결과에 대해서 표현해 주어야하는 경우가 생긴다. 해당 포스팅에서는 이에 대한 내용을 간략히 정리해본다. 1. 동영상 프레임(이미지) 단위로 불러오기 cap = cv2.VideoCapture("동영상 주소") if cap.isOpened(): ret, img = cap.read() while ret: ret, img = cap.read() if not ret: break ## 이미지 처리 부분 # ~~ 2. 미사용 프레임에 대해서 생략하기 특정 프레임을 스킵하고 싶다면 아래의 명령어로 cap.read 보다 빠르게 스킵 가능하다 cap.grab() 3. 이미지 처리하기 예측모델의 동작이나 전/후처리 가 여기에 해당할 수 있다. 해당 포스팅에서는 모델부분은 다루지 않..
-
[python, opencv] 판별된 오브젝트가 특정 영역 내부에 있는지 판단하기(다각형 폴리곤을 이용한 마스크 만들기, 작업구역 탐지, 위험구역 탐지)Data Science/컴퓨터비전 2023. 5. 30. 19:25
다양한 모양의 작업구역 등을 설정하고 이에 탐지된 오브젝트가 구역내 소속되어 있는지 판단하는 방법을 고민하던 중 폴리곤으로 mask를 만들고 and 연산을 하면 간단하다고 하여 이를 작성해본다. 실제 이미지 및 오브젝트 검출 부분까지 글에 가져오면 너무 분량이 많아져서, 검출된 오브젝트의 좌표값이 있다고 가정하고 간단한 예시로 진행하겠다. 1. 이미지 120*100짜리 이미지가 있다고 가정한다. img_mask = np.zeros((100,120,1),dtype=np.uint8) plt.imshow(img_mask) 2. 특정 영역 마스크 구역 생성(작업구역, 위험구역 등) 작업구역과 같이 사용자가 지정하고싶은 특정 구역을 나타내는 마스크를 만들어준다. 여러개의 다각형으로 다양한 구역을 표현 가능하다. ..
-
[Python, opencv] 다각형 그리기 코드 구현(cv2.polylines)Data Science/컴퓨터비전 2023. 5. 30. 18:56
파이썬에서 다각형을 그리기 위해서는 opencv를 활용하여 아래와 같이 그릴 수 있다. import cv2 import numpy as np # 0으로 채워진 이미지(array) 생성 image = np.zeros((150,150,3),np.uint8) # 다각형의 좌표를 순서대로 입력, 입력 순서대로 선을 그리게 된다 pts1 = np.array([[20,20],[130,70],[90,90],[80,130]],dtype=np.int32) # cv2의 polylines로 다각형 그리기 # cv2.polylines(원본그림, 좌표리스트, 마지막점과 첫점 연결 여부, 선색, 선 굵기) cv2.polylines(image,[pts1],True,(255,255,255),4) plt.imshow(image) 세번..
-
편상관계수 정의 및 파이썬 코드 구현(Partial Correlation Coefficient)Data Science/데이터마이닝 2023. 5. 7. 22:31
데이터 분석에 있어서 가장 많이 활용되는 기법 중 하나로 상관관계 분석이 있다. 그러나 실제 현업의 데이터에서는 여러 독립변수들이 직/간접적으로 영향을 미치며 이에 대한 정확한 상관관계/인과관계의 분석이 어렵다. 그렇기에 단순히 상관관계만을 보고 분석을 하는것은 한계가 있으며, 같이 활용 될 수 있는 편상관계수를 설명하고, 파이썬 코드로 구현하는 예시를 작성해본다. 1. 상관계수의 정의 및 한계(Correlation Coefficient) 상관계수는 두 변수간의 상호관계정도를 나타내는 통계적 수치이다. -1 ~ +1 사이의 값을 가지며, -1일때 완벽한 음의 상관관계 그리고 +1일때 완벽한 양의 상관관계를 나타낸다. 주의할 점은 상관계수가 0일 경우 상관관계가 0인 것이 아닌, 선형의 상관관계가 보이지 ..