[IMU] What is an IMU(Inertial Measurement Unit)- 관성측정 장치?
IMU가 무엇인지부터 deskew와 gravity alignment에 왜 중요한지까지, LiDAR 전처리 관점에서 차근차근 설명한 글.
기존 Tistory 글을 모두 끌어오되 예전 카테고리를 그대로 두지 않고, 지금의 관심사 기준으로 다시 분류했습니다. 먼저 읽을 글과, 어떤 주제에 오래 머물렀는지가 보이도록 구조를 바꿨습니다.
Start here
IMU가 무엇인지부터 deskew와 gravity alignment에 왜 중요한지까지, LiDAR 전처리 관점에서 차근차근 설명한 글.
서브 에이전트 중심 워크스페이스를 직접 구성하면서, AI 도구를 생산 시스템처럼 다루는 방식을 정리한 글.
SAM 3를 직접 설치하고 추론 결과를 다루면서, 새 모델을 실제 파이프라인에 붙일 때 중요한 핸들링 포인트를 정리한 글.
Conda에서 uv로 넘어가며 왜 속도, 표준 준수, 재현성이 개발 생산성을 바꾸는지 설명한 실무형 글.
SAM 3D Objects를 계기로 3D segmentation과 3D reconstruction의 차이를 시스템 관점에서 풀어낸 글.
Gaussian Splatting의 핵심 아이디어와, 왜 이 방식이 3D 표현과 재구성 맥락에서 중요한지 설명한 글.
MMS LiDAR 데이터를 써서 3D lane segmentation 시스템을 만든 경험과 전처리부터 모델링까지의 실전 노하우를 정리한 글.
실제 LiDAR 데이터에서 noise를 어떻게 제거하고 어떤 선택지가 있는지 정리한 실용적인 글.
BoostCamp에서 무엇을 배우고 어떤 문제를 직접 풀었는지, 성장 과정과 프로젝트 경험을 함께 돌아본 글.
열심의 한계와 방향성에 대해 스스로 점검한 개인적이지만 중요한 기준점 같은 글.
Categories
29 posts
LiDAR, point cloud, HD map, SLAM, IMU, and 3D perception posts connected to physical-world sensing problems.
11 posts
Computer vision, segmentation, SAM-family models, super-resolution, and image understanding posts.
7 posts
Tooling, environment setup, agent workflows, and practical ways of shipping or operating ML work.
31 posts
Attention, Transformers, reinforcement learning, generative models, and conceptual machine-learning writeups.
23 posts
Posts that show judgment, motivation, trajectory, and how work and growth are being framed over time.
21 posts
Programs, project retrospectives, portfolio traces, and milestone posts that show progression over time.
29 posts
LiDAR, point cloud, HD map, SLAM, IMU, and 3D perception posts connected to physical-world sensing problems.
IMU가 무엇인지부터 deskew와 gravity alignment에 왜 중요한지까지, LiDAR 전처리 관점에서 차근차근 설명한 글.
SAM 3D Objects를 계기로 3D segmentation과 3D reconstruction의 차이를 시스템 관점에서 풀어낸 글.
Gaussian Splatting의 핵심 아이디어와, 왜 이 방식이 3D 표현과 재구성 맥락에서 중요한지 설명한 글.
MMS LiDAR 데이터를 써서 3D lane segmentation 시스템을 만든 경험과 전처리부터 모델링까지의 실전 노하우를 정리한 글.
실제 LiDAR 데이터에서 noise를 어떻게 제거하고 어떤 선택지가 있는지 정리한 실용적인 글.
포인트클라우드는 자율주행, 디지털 트윈, 스마트시티 등에서 중요한 3D 데이터입니다. 특히 도로 주행 환경을 스캔한 포인트클라우드를 딥러닝에 활용하려면, 도로면을 평면으로 정렬 하거나 2D 이미지처럼 표현 하는 전처리 과정이 필요합니다. 이 글에서는 도로와 같은 경사 있고 굴곡진 포인트클라우드를 projection 하기 위한 4가지 대표적인 방법 중 네 번째를 소개합니다. 4. PCA(...
포인트클라우드는 자율주행, 디지털 트윈, 스마트시티 등에서 중요한 3D 데이터입니다. 특히 도로 주행 환경을 스캔한 포인트클라우드를 딥러닝에 활용하려면, 도로면을 평면으로 정렬 하거나 2D 이미지처럼 표현 하는 전처리 과정이 필요합니다. 이 글에서는 도로와 같은 경사 있고 굴곡진 포인트클라우드를 projection 하기 위한 4가지 대표적인 방법 중 세 번째를 소개합니다. 3. DTM(...
포인트클라우드는 자율주행, 디지털 트윈, 스마트시티 등에서 중요한 3D 데이터입니다. 특히 도로 주행 환경을 스캔한 포인트클라우드를 딥러닝에 활용하려면, 도로면을 평면으로 정렬 하거나 2D 이미지처럼 표현 하는 전처리 과정이 필요합니다. 이 글에서는 도로와 같은 경사 있고 굴곡진 포인트클라우드를 projection 하기 위한 4가지 대표적인 방법 중 두 번째를 소개합니다. 2. Movi...
포인트클라우드는 자율주행, 디지털 트윈, 스마트시티 등에서 중요한 3D 데이터입니다. 특히 도로 주행 환경을 스캔한 포인트클라우드를 딥러닝에 활용하려면, 도로면을 평면으로 정렬하거나 2D 이미지처럼 표현하는 전처리 과정이 필요합니다. 이글에서는 도로와 같은 경사 있고 굴곡진 포인트클라우드를 projection 하기 위한 4가지 대표적인 방법 중 첫 번째 방법을 소개합니다. 1. RANS...
비전 트랜스포머(ViT) 는 이미지를 입력으로 받아 Transformer 인코더 만으로 특징을 추출하는 모델입니다. ViT는 먼저 입력 이미지를 고정 크기의 패치(patch)들로 분할합니다. 예를 들어 224 ×224 RGB 이미지를 16 ×16 크기의 패치로 나누면 패치 1개는 16 ×16 ×3 픽셀이고, 전체 패치는 14 ×14=...
K-lane LLDN(Lidar Lane Detection Network ) 1. 역사 CLDN : 카메라 기반 차선 감지는 조명 조건에서 상당한 성능 문제가 존재하지만 라이다는 야간, 빛 등 다양한 조명 조건에 강함 카메라 기반 방법은 자차로부터의 거리에 따라 두께가 감소하여 동일한 소실점을 향하게 되어 차선 끝에 왜곡 문제 존재 LLDN : 초기 라이다 기반 차선 감지는 차선 표시를...
PTv3는 3D 점군 데이터를 처리하기 위한 Transformer 기반 U-Net 형태 백본 입니다. 전체 아키텍처는 U-Net처럼 4단계 인코더와 4단계 디코더 로 구성되며, 각 인코더 단계에서 일정 비율로 점들을 다운샘플링하고 연속된 Transformer 블록을 쌓은 뒤, 디코더 단계에서 업샘플링을 통해 원래 해상도로 복원합니다. 모델 전반의 설계 철학은 단순성과 효율성 을 극대화하...
오늘부터 point cloud data를 다루게됐습니다. 해본적이 없어서 앞으로 공부하고 정리할 내용이 많아질 것 같습니다. 기대가 되네요
ECW을 앞선 포스팅으로 해결하실수 있으시다면 그거슨 축복입니다.. 아래의 코드를 실행했을때 None이 나오지 않아야 ECW를 다룰수있는데요 저는 약 10일간의 고군분투를 하고있으나 여전히 None을 return 하고있는 상황입니다.. 이렇게 해서 해결 되신것 또한 축복입니다. 저는 gdal-x부분의 부분에서 뭔가 문제가 있는것 같은데 make를 하면서 나오는 각종 오류를 해결하는 중입...
우선 다양한 종류의 data를 종합하여 environment를 조성한다는 것을 이해해야 한다. DATA Input 1. LIDAR(light detection and ranging) - Data : Distance Measurements in the form of point clouds. - Usage : Provides highly accurate spatial information,...
1. Over of multi-modal learning(다중 감각) Challenge (1) - Different representations between modalities (2) - Unbalance between heterogeneous feature spaces - 1:N matching가능성 (3) - May a model be biased on a specific moda...
what is cGAN? Translating an image given "condition" \(P(X|condition)\) condition을 따르는 확률분포를 학습하는 것 Generative model vs Conditional generative model - Generative model generates a random sample - Conditional generativ...
Maximum Likelihood Learning - parameter가 주어졌을 때 데이터가 얼마나 likely 한지(뭐랑?), 이를 높이는 방향으로 학습함 - 뭘 Metric으로 삼을까? -> KL-divergence - minimizing KL-divergence <=> Maximizing the expected log-likelihood - empirical log-likelih...
Semantic segmentation(stuff + things) = pixel-wise classification object detection Instance Segmentation = Semantic segmentation + distinguishing instances two-stage Mask R-CNN = Faster R-CNN + Mask branch RoIAlign si...
Image - Low level feature map - mid level - high level -> output inference Image Filter visualization(first conv layer) Activation visualization(first conv layer) Model을 이해하기 위한 노력 vs data를 분석하기 위한 노력 Analysis of mode...
TASKS Image Segmentic segmentation instance segmentation (같은 클래스끼리 객체의 구분이 가능하냐) panoptic segmentation (instace segmentaion + alpha) Object Detection = classification + Box localization (label :(P_class, x_min, y_min,...
Abstract dominant한 sequence transduction models는 encoder 와 decoder를 포함한 복잡한 rnn 이나 cnn 구조에 기반을 두고있다. 성능이 좋은 모델들은 encoder와 decoder를 attention mechanism을 통해 연결한다. the Transformer: 독자적인 attention mechanisms에 기반하고 RNN, CN...
10818에서 막혔습니다. 처음에 시간 초과 에러가 나온 코드를 먼저 보여드리겠습니다. 너무 간단하게 생각해서 그냥 리스트에 다 때려 박고 min, max를 출력하면 되는 줄 알았습니다. 그래서 바꿔봤습니다! 조건을 걸어서 min max값을 업데이트하는것으로! 최소값과 최대값을 알려주었으니 맞춰서 업데이트 하는 형태로!! 근데 이것도 시간 초과라는군요!!!!!! 아마 for문 이 문제인...
Grad-CAM이 class-discriminative 하고 그 class에 연관된 image regions을 알려주지만, fine grained detail (pixel 공간의 gradient 시각화)을 highlight 해 주는 역할은 할 수 없습니다. Guided Backpropagation은 이미지에 대한 gradient들을 시각화해 줍니다. 직관적으로, Guided Backpr...
Grad-CAM generalizes CAM => Grad-CAM 이 CAM을 커버할 수 있다 로 이해하시면 무리 없습니다. paper에서 Grad-CAM이 CAM을 generalize 한다는 formal 한 증명을 준다고 하니 한번 자세히 들여다봅시다. 우선 CAM의 논리가 무엇인지 자세히 들여다보겠습니다. CAM은 Global Average Pooling 와 Softmax 두 개의...
\(L_{Grad-CAM}^c =\frac{1}{I\times J} ReLU(\sum\limits_{k=0}^{K-1} \sum\limits_{i=0}^{I-1}\sum\limits_{j=0}^{J-1} \frac {\partial y^c}{\partial A_{i, j}^k} A^k) \) 식을 이제 더 자세하게 파봅시다. 우선 \( L_{Grad-CAM}^c\) 의 사이즈는 \( A...
[그림 1] Grad-CAM overview Section 3. Grad-CAM Convolutional layers은 spatial 한 information 즉 feature map을 얻는데 이는 fully-connected layer에서 없어집니다. 이는 곧 convolutional layer의 결과가 object parts의 정보를 제공 한다는 의미로 해석될 수 있습니다. Grad...
https://arxiv.org/pdf/1610.02391.pdf Grad-Cam이 소개된 논문입니다. 제목은 Grad-CAM : Visual Explanations from Deep Networks via Gradient-based Localization 입니다. 참 명료하고 매력적인? 제목인것 같습니다! 제목만 보고도 무슨 내용인지 알 것 같은 동시에 확 궁금해지는 그런~ 제목에서...
Grad-Cam은 Cam의 개념에서 확장된 것입니다. 그렇다면 Cam을 먼저 이해할 필요가 있겠죠? CAM = Convolutional Activation Map의 약자입니다. Convolution의 결과가 어떻게 활성화되는지 시각화시켜주는 툴이라고 생각하시면 편합니다. CNN을 조금 접해보신 분들은 아래의 그림들을 한번쯤은 보셨으리라 생각합니다. [그림 1] target을 강아지로 잡...
11 posts
Computer vision, segmentation, SAM-family models, super-resolution, and image understanding posts.
SAM 3 논문과 코드를 함께 따라가며 concept prompt가 무엇을 가능하게 하는지 정리한 리뷰 글.
출처 : https://pyimagesearch.com/2024/06/03/sharpen-your-vision-super-resolution-of-cctv-images-using-hugging-face-diffusers/ 의 글을 한글 번역과 저의 의견 및 코드 수정을 거친 Post입니다. Sharpen Your Vision: Super-Resolution of CCTV Images U...
SAM2 모델의 배치 학습 구현하기 안녕하세요! 오늘은 SAM2(Segment Anything Model 2) 모델의 배치 학습을 구현하는 방법에 대해 알아보겠습니다. SAM2는 이미지 세그멘테이션 작업에 매우 효과적인 모델이지만, 기본 구현은 단일 이미지 처리에 초점이 맞춰져 있습니다. 여기서는 배치 학습을 통해 학습 효율성을 높이는 방법을 소개하겠습니다. 1. 필요한 라이브러리 임포...
SAM2 model의 custom 학습을 진행해 보겠습니다. 대화형 인터프리터 버전 우선 필요한 package들을 import 해줍니다. <그전에 sam2 model을 사용할 수 있도록 가상환경 등을 이용하여 환경설정을 해줘야 합니다.> sam2 모델은 선언해 주고 pretrained 모델을 load 해줍니다. 데이터를 image_original과 image_mask로 분리하여 원본과...
There are four types of resolution in the satellite image industry: Spatial Resolution : The real-world metric represented by one pixel. Spectral Resolution : The ability to measure specific bands or wavelength ranges...
1. object detection and segmentation on COCO도 잘하고 2. Semantic segmentation on ADE20K 도 잘하고 3. model efficiency도 낫다 In addition, Hybrid model = CNN + self attention이 연구되고 있다. Prior to ViT, the focus was on augmenting a...
In this work, we reexamine the design spaces and test the limits of what a pure ConvNet can achieve. We gradually “modernize” a standard ResNet toward the design of a vision Transformer, and discover sever...
https://www.youtube.com/watch?v=vMlLgA-nhuY&t=205s https://github.com/kairess/BSRGAN GitHub - kairess/BSRGAN: 4배 고해상도 복원 BSRGAN (옛날 사진, 인물 사진, 옛날 만화책) 4배 고해상도 복원 BSRGAN (옛날 사진, 인물 사진, 옛날 만화책). Contribute to kairess/BS...
Face Detector를 가볍게 뜯어보는데 잘 모르겠는 부분인 RGBA color model에 대해 부연설명하도록 하겠습니다. RGBA는 Red Green Blue Alpha의 첫 글자를 축약한 단어입니다. 기본적으로 RGB channel에 Alpha channel이 추가된 channel입니다. Alpha는 각각의 픽셀이 얼마나 투명한지(opaque)를 나타내는 부분입니다. 또한 al...
https://github.com/kairess/face_detector GitHub - kairess/face_detector Contribute to kairess/face_detector development by creating an account on GitHub. github.com https://www.youtube.com/watch?v=tpWVyJqehG4 오늘 해볼것은...
내가 왜 computer vision에 끌리는지, 어떤 문제들을 재밌어하는지 비교적 솔직하게 드러나는 초기 글.
7 posts
Tooling, environment setup, agent workflows, and practical ways of shipping or operating ML work.
SAM 3를 직접 설치하고 추론 결과를 다루면서, 새 모델을 실제 파이프라인에 붙일 때 중요한 핸들링 포인트를 정리한 글.
출처 : https://www.adobe.com/kr/creativecloud/file-types/image/raster/ecw-file.html ECW 파일 탐구: 향상된 압축 웨이브릿 형식 항공 사진이나 위성 사진과 같은 대규모 이미지를 처리할 때 파일 크기를 줄이면서도 품질을 유지하는 것은 매우 중요합니다. 이때 유용한 것이 ECW(Enhanced Compression Wavele...
어디에 무슨파일이 얼마나 용량을 차지하고있는지 확인 sudo du -ah /home/ | sort -rh | head -n 10 리스트로 터미널에 출력된다
1. Docker 소개 > - 가상화란? - 가상화는 서비스 운영에 사용하는 서버와 로컬 환경의 차이를 극복하는 개념입니다. Local 환경은 윈도우일 수 있고, 서버 환경은 Linux일 수 있습니다. 이 때문에 라이브러리, 파이썬 등을 다르게 설치해야 합니다. > - Docker 등장 전 - 가상화 기술로 VM(Virtual Machine)을 사용했습니다. VM은 호스트 머신 위에 O...
Landmark localization - 예시(facial landmark localization & Human pose estimation) Predicting the coordinate of keypoints 1. Coordinate regression : Usually inaccurate and biased 2. heatmap classification : better perfo...
Vision Transformer에 익숙하지 않으신 분들은 다음 tutorial을 공부하는것을 추천드립니다. Image classification with Vision Transformer . 간단하게 말씀드리면 영상(이미지)를 다루는데 기존의 convolution layer구조 가 아닌, Transfomer architecture with self-attention을 Image pat...
강화 학습 공부를 위해 이런저런 실습 코드를 따라 치던 도중 이러한 형태의 코드 자체가 실행이 안 되는 아주아주 답답한 상황에 이르렀다. 저 ~ 에 들어가는 부분은 게임의 이름들인데 1. classic control https://gym.openai.com/envs/#classic_control Gym: A toolkit for developing and comparing reinfor...
31 posts
Attention, Transformers, reinforcement learning, generative models, and conceptual machine-learning writeups.
Summary Transformer는 입력 시퀀스의 각 요소가 다른 모든 요소와 직접 연관성을 학습하도록 하는 Self-Attention 메커니즘을 핵심으로 하며, 각 요소에 대해 Query/Key/Value 벡터를 생성해 유사도(Attention Score)를 계산한 뒤 이 값으로 정보를 가중합 합니다. 여기에 Multi-Head Attention을 적용해 여러 시점의 관계를 동시에...
Translating an image given "condition" We can explicitly generate an image corresponding to a given "condition" Generative model vs Conditional generative model - Generative model generates a random sample - condition...
ConvNeXtT/S/B/L, to be of similar complexities to Swin-T/S/B/L. ConvNeXt-T/B is the end product of the “modernizing” procedure on ResNet-50/200 regime, respectively. In addition, we build a larger ConvNeXt...
https://github.com/apple/ml-fastvit?s=09 https://arxiv.org/pdf/2303.14189.pdf In this work, we introduce FastViT, a hybrid vision transformer architecture that obtains the state-of-the-art latency-accuracy trade-off....
1-2. Class attention The vanilla ViT는 image patches와 learnable CLS(classification) token이 서로 어떻게 상호작용하는지 모델링(학습) 하기 위해 self-attention (SA) layers를 사용합니다. SA : image pathces와 learnable CLS token의 상호작용 학습하는 연산 CaiT의 저자는...
Imports Step 1 : CaiT 에서 사용되는 block들 만들기 1-1. The LayerScale layer CaiT paper에서 제안된 두가지의 modification중에 하나인 LayerScale 를 우선 구현해 보겠습니다. ViT models에서 depth를 증가시킬 때, Loss Optimization이 불안정하여 수렴하지 않는 문제가 있습니다. ResNet구조에서...
https://pyimagesearch.com/2022/09/05/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-1/ Version 1과의 차이 딱봐도 softmax -> scaled softmax 밖에 없쥬? 이젠 고수가 된걸지도 모르겠어요 그래도 천천히 설명따라 가봅시다. Version 2에서는 Similarity Fu...
https://pyimagesearch.com/2022/09/05/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-1/ Attention의 역사를 따라가는 것은 겁나 어렵습니다. 하지만 7개로 나눠 놓은 Version steps를 따라가다 보면 알기 쉽겠다고 자랑을 했네요 1. Version 0 Attention을 직관적으로...
RNN 구조의 모델을 사용할때 Encoder와 Decoder를 활용하는 경우가 있습니다. 또한 이의 성능을 높이기 위해 Attention module을 사용한다는 것을 소개 해드리며 시작하겠습니다. 사실 Attention개념까지 검색해서 들어왔다는 것은 대강 기본적인것들에 대해 알고계신다는 거 아니겠습니까? 쉽게쉽게 넘어가겠습니다. Top-Down 방식의 이해를 먼저 시도하겠습니다. 이...
https://pyimagesearch.com/2022/09/05/a-deep-dive-into-transformers-with-tensorflow-and-keras-part-1/ A Deep Dive into Transformers with TensorFlow and Keras: Part 1 - PyImageSearch A tutorial on the evolution of the a...
ㅋㅋ 밑도 끝도 없지만 일단 가봅시다. Markov Chain은 이산시간 확률 과정이다. 마르코프 연쇄는 시간에 따른 계의 상태의 변화를 나타낸다. 매 시간마다 계는 상태를 바꾸거나 같은 상태를 유지한다. 상태의 변화를 전이라 한다. 마르코프 성질은 과거가 현재 상태가 주어 졌을 때의 미래상태의 조건부 확률 분포가 과거상태와는 독립적으로 현재 상태에 의해서만 결정된다는 것을 뜻한다 마르...
MDP는 의사 결정 과정을 모델링하는 수학적인 틀을 제공한다. 이때 의사결정의 결과는 의사결정자의 결정에도 좌우되지만, 어느 정도 임의적으로 주어진다. MDP는 동적 계획법과 강화 학습 등의 방법으로 푸는 넓은 범위의 최적화 문제풀이 방법이다. MDP는 이산시간 확률 제어 과정이다. 어떤 시점에, 마르코프 결정 과정은 어떤 상태 s에 존재한다. 의사결정자는 해당 상태 \(s\)에서 어떤...
https://www.gymlibrary.ml/content/environment_creation/ Environment Creation - Gym Documentation Previous API www.gymlibrary.ml 요거보고 따라 만들어 보겠습니다. 확실히 강화학습쪽으로 인력이 많이 필요하고, 가능성이 있어뵈나 뵙니다 ㅎㅎ 이렇게 사용하기 편하게 툴을 풀어주다니! 입력 해주...
gym에서 게임 드릅게 import 안되더니 API 페이지로 제대로 만드려고 그랬었나 봅니다. 모든 GYM 내용이 여기로 옮겨왔네요 https://www.gymlibrary.ml/ Gym Documentation Next API www.gymlibrary.ml 아무튼 편해졌으니까 다행입니다.
Space Invader 문제를 해결하려고 이것저것 해봤는데 아직 뚫어내지 못했당. 그래서 좀더 낮은 level의 문제를 해결하는지 확인해 보고자 Lunar Lander 게임으로 갈아탓다. 근데 이전의 시행착오 글에서와 같이 좀 쉬운게임은 코딩 환경설정부터 간단하다. 여기서 env.render()를 on 하면 실제 게임하는 장면을 눈으로 확인할 수 있다. 학습시킬땐 off 하라 이말이야~
https://www.youtube.com/watch?v=dRIhrn8cc9w&list=PLRQmQC3wIq9yxKVK1qc0r2nPuInn92LmK&index=3 https://www.youtube.com/watch?v=j080VBVGkfQ&list=PLRQmQC3wIq9yxKVK1qc0r2nPuInn92LmK&index=4 Model Free Evaluation - Policy Ev...
아주 간단한 tutorial을 소개해 드리고자 한다. 강화 학습은 Environment 와 Agent 의 Interaction 을 통해 학습하는데 . py 코드가 자연스럽게 세 개가 된다 Environment.py Agent.py Interaction.py 이렇게 딱딱 나눌 수 있는 그런 건 아니라서 조금 부가 설명을 하자면 main.py -> environment 설정과 intera...
window.ReactionButtonType = 'reaction'; window.ReactionApiUrl = '//handy-choi.tistory.com/reaction'; window.ReactionReqBody = { entryId: 63 } 공유하기 게시글 관리 Proble
window.ReactionButtonType = 'reaction'; window.ReactionApiUrl = '//handy-choi.tistory.com/reaction'; window.ReactionReqBody = { entryId: 62 } 공유하기 게시글 관리 Proble
window.ReactionButtonType = 'reaction'; window.ReactionApiUrl = '//handy-choi.tistory.com/reaction'; window.ReactionReqBody = { entryId: 60 } 공유하기 게시글 관리 Proble
window.ReactionButtonType = 'reaction'; window.ReactionApiUrl = '//handy-choi.tistory.com/reaction'; window.ReactionReqBody = { entryId: 51 } 공유하기 게시글 관리 Proble
making classification or regression based on a very small number of samples. ‘learn to learn’ 1000개의 이미지 다 구분해라! 가 아니고 비슷한 애들끼리 묶어봐~ 느낌 같은 애들끼리 묶어놓고 답지 줄테니까 그쪽으로 분류해놔! 문제정의 → 문제 간소화 (추상화) → divid...
참 힘들고 지치는 과정이셨죠? 하지만 전체적인 구조를 이해하기 위해 처음부터 끝까지 다 톺아보는 이 과정이 나중엔 정말 도움이 되실 거라 생각합니다. 매번 이렇겐 할수 없잖아요~? 그래서 다음 AlexNet 구현부터는 pytorch를 이용하여 해 보도록 하겠습니다. pytorch를 사용하면 간단한 코딩으로 우리가 복잡하게 계산했던 편미분들을 뚝딱 해준답니다~! 다음 카테고리 AlexNe...
그전까지의 코딩까지 묶어서 일단 한번 봅시다. 여기부터 feed 함수에 변경점이 있습니다. 미분하다 보니 간단하게 표현 가능하게 해주는 변수들이 있었잖아요? 그것들을 따로 빼주겠습니다. 여기가 이제 새롭게 추가되는 부분입니다~! 실제로 적용시켜 주는 모오습 보기 좋게 프린트 찍어보는 모 오습 맞는지 틀린 지 이미지들로 눈으로 한번 확인해봅시다~! 오우 예 여기 나온 그림들은 다 맞춘 거...
자 이제 \(W^0\)에 대한 미분도 이어서 해봅시다. [그림 1] 풀어본 모습 추가적인 설명을 적어 넣어 보도록 하겠습니다. [그림 2] 최종 결과 여기도 마찬가지~! 이제 수식으로 써볼껀 다써봤네여!!! 마지막으로 코딩해보고 끝내버립시다.
자 이제까지 데이터를 입력받으면 [1 x 10] 확률 벡터를 만들어 내는 계산을 완료했습니다. 이를 feed forward라 부릅니다. 문제를 풀어본 상태라고 이해하시면 됩니다. 이젠 문제를 맞힐 수 있도록 혼내줄 겁니다. Back propagation! feed_forward의 결과가 뭐였죠?! 다음과 같습니다. 이 길고 복잡해 보이는 식을 어떻게 건드려야 하나 두렵겠지만 어쨌든 하나...
google colab이나 jupyter notebook에서 작동 가능한 코드들입니다. MNIST데이터를 받기위한 사전 작업 해주시고~ 압축해제 해주시고~ 변수 저장 해주겠습니다~! 필요한 변수들을 설정해 주겠습니다. 아래에는 쓰여질 함수들!! Activation function 인 ReLU와 그의 미분, Softmax 함수 objective 함수이자 cost함수인 cross entro...
지난 포스팅에 행렬 계산을 해보았습니다. 저 정도 계산으로 특별한 성능을 기대한다면 너무 욕심이겠죠? 이제 진짜 시작입니다. 행렬 계산에 그치지 않고 우리는 Activation function을 적용해 줄 것입니다. 활성 함수라고 하죠 그 이유는 모델 전체에 Nonlinearity (비선형성) 성질을 부여하기 위함입니다. 사연이 있는 행위 지만 여기선 간단하게 '어려운 문제 풀기 위해...
지난 포스팅의 확장입니다. 실제 MNIST 데이터에 적용하기 MNIST 데이터의 크기는 [28 x 28]의 이미지라고 말씀드렸어 이걸 한 줄로 죽 늘어뜨리면 [1 x 784] vector로 표현할 수 있습니다. 그럼 지난 포스팅에서 봤던 input layer \( I \)의 크기는 어떻게 될까요? [1 x 784] vector가 바로 input layer \(I\)로 표현됩니다~ 그다음...
계획의 시작 MLP입니다. MLP with 2 layer 모델로 MNIST 분류 문제를 풀어보겠습니다. 우선 아주 쉽게 축소하여 한번 가봅시다! [그림 1] 2-layer MLP 의 축약 예시 입니다. 추상화? 보통 Hidden layer의 수와 Output layer의 수를 합쳐서 layer 수를 결정하는 것으로 추정됩니다. 아마 곱해지는 행렬이 2개라서 그런것 같습니다. [그림 1]...
앞으로 모델들은 Kaggle의 MNIST데이터를 이용하여 시동? 검증하려고 합니다. MNIST데이터 자체의 난이도가 너무 낮아 틀린 모델이더라도, 정확도가 높은 경우가 생길 수 있으니 ImageNet 데이터로 재차 검증을 해야 할지도 모르겠습니다. [귀찮아서 안 할 것 같긴 합니다. 하하] 일단 데이터부터 받아줍시다! 압축 해제를 해주시고요~~ 데이터 지정해주겠습니다. 필요한 변수들을...
23 posts
Posts that show judgment, motivation, trajectory, and how work and growth are being framed over time.
서브 에이전트 중심 워크스페이스를 직접 구성하면서, AI 도구를 생산 시스템처럼 다루는 방식을 정리한 글.
Abstract A purely peer-to-peer version of electronic cash would allow online payments to be sent directly from one party to another without going through a financial institution. Digital signatures provide part of the...
오늘 한일 그동안 chatGPT에 질문했던 수많은 내역을 folder별로 정리했다 ㅋㅋ ... 성공!
애플워치 울트라가 생겼습니다. 나이트 모드를 default로 사용하고 싶은데 검색해 본 결과 나이트 모드를 지원하는 way finder를 watch face로 선택한 다음 디지털크라운을 돌리면 된다고 뜨는데요! 이건 이제 안됩니다!! 안 되는 줄 알고 포기하고 있었는데요! 휴대폰의 watch app에서 가능합니다! 모든 face에서 가능한 것은 아니고, way finder, Modula...
SLAM은 이름에서부터 알 수 있듯 Localization과 Mapping을 동시에 하는 알고리즘이다. Key concpets of SLAM 1. Localization : Determining the position and orientation of the robot within the map. (map상에서 robot의 위치와 방향을 결정) 2. Mapping : building a...
It's great that you're thinking about becoming a remarkable individual in today's world. To achieve your goal of being a truly remarkable man, I'll break it down into some key steps and provide multiple perspectives:...
1⃣멋진남자란 시대를 초월함과 동시에 그 시대를 반영 하는 리더 멋진남자! 당신의 머릿속에 멋진 남자 하면 떠오르는 사람이 누구인가? 그 사람은 현 시대의 인물일수도, 과거의 인물일수도 있다. 왜 그럴까? 그 이유는 낭중지추,군계일학 즉, 아무리 열악한 상황이던 아무리 쉬운상황이던 시대를 대표하는 뛰어난 모습을 가지고 현대에 회자되고 후대에도 회자 될것이기 때문이다. 내가 생각하는 멋진...
"Under similar circumstances is more powerful than personality." This concept made me reflect on the importance of having the right skills and knowledge to tackle various situations in life. I used to believe that one...
\( P(x)\)를 학습한다 : input x에 대한 확률분포를 학습한다 Suppose that we are given images of dogs we want to learn a probability distribution \(p(x)\) such that - Generation : If we sample \(\tilde x ~ p(x), \tilde x \) should look l...
Starting Point is a ResNet-50 model을 Vision transformer가 학습하는 방식으로 학습시켰더니 performance가 더 좋았다. Deisign Decision (network modernization : CNN의 현대화) 1. Macro design 2. ResNeXt 3. Inverted bottleneck 4. Large kernel size...
아무리 빠르다 빠르다 한들 이렇게 빠를줄 상상이나 했겠냐고 공부를 다시 하다보니 매우 당연한 얘기지만 내가 공들여 3개월에서 6개월동안 쌓아온 지식이 5년이 지난 현재시점에서 10시간 만에 정리되는 내용이라니 exponent한 발전 속도를 따라잡으려면 일단 그래프를 향해 뛰어야 되고 계속 메달려있기위해 고군분투해야된다고 생각하고 말해왔지만 행동하지 않았던 지난날의 과오가 약간 아쉽다 그...
열심의 한계와 방향성에 대해 스스로 점검한 개인적이지만 중요한 기준점 같은 글.
[분야] AI 분석가(AI Analyst / Quantitative Researcher) [담당업무] ● 정량적 분석(통계, ML 등)을 통한 투자 전략 모델링 및 알고리즘 개발 - 운용 모델, 자산배분, 리스크탐지, 국면분석 등 ● 정량적 투자전략(통계, ML 등) 관련 최신 동향 리서치 및 구현 [자격요건] ● 정량적 분석 관련 전공자 (컴퓨터공학, 산업공학 등) ● 석사 학위 이상...
Do not think about the reasons for needing to earn money or wanting to earn money, because money is naturally necessary. Also, do not dwell on the reasons for quitting a job, as it's already in the past. Why I want to...
In order to foster individual potential, it is crucial to recognize and respect each person's freedom and independence. One of the key aspects to achieving this is to adopt a critical thinking mindset towards one's be...
https://www.youtube.com/watch?v=E3f2Camj0Is&list=PLRQmQC3wIq9yxKVK1qc0r2nPuInn92LmK&index=2 학습목표 1. MP, MRP, MDP Bellman operator, contraction operator, model, Q-value, Policy 정의 암기 2. Value Iteration, Policy Iteratio...
https://v6xcareer.notion.site/v6xcareer/500ba3f2fc1448be904ca0f9347ae50f 개발자(인턴/정직원) 채용 보이저엑스는 더욱 즐겁고 편리한 삶을 돕는 인공지능 소프트웨어를 개발하는 스타트업 입니다. v6xcareer.notion.site 보이저 엑스라는 회사에서 오픈해 놓은 recruit page를 보고 역시나 부족함을 느끼며, 딥러닝을...
제가 처음으로 막혔던 부분은 10951번 문제 입니다. 런타임 에러(EOFerror)로 잡혔네요 문제는 다음과 같고 제가 제출한 답은 아래 코드블럭으로 넣어봤습니다. 실제로 코드를 실행하고 input을 넣으면 제대로 출력이 되긴 합니다. 하지만 EOFerror는 End of File error의 약자인데 제 코드를 보면 while이 계속 도는 상황에서 입력이 끝났음을 알리는 부분에 대한...
https://plzrun.tistory.com/entry/%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%EB%AC%B8%EC%A0%9C%ED%92%80%EC%9D%B4PS-%EC%8B%9C%EC%9E%91%ED%95%98%EA%B8%B0 알고리즘 문제풀이(PS) 시작하기 이런건 고수들이나 써야 하지 않나 싶지만, 그래도 1년정도 공부하면서 이 분야를 어떻게 시작해...
\(\sum_{i=0}^{I-1} \) 요런 기호를 썼을 때 옆으로 붙으면 참 안 예쁘죠?! \sum_{i=0}^{I-1} 요 tex에 limts를 추가해주면 예쁘게 다음과같이 쓸 수 있습니다. 요렇게 말이죠 ! \sum\limits_{i=0}^{I-1} \(\sum\limits_{i=0}^{I-1} \) 이쁘져?
친구가 구글에 handy-choi 제 블로그 관리자 이름 검색했더니 2페이지에 뜬다고 하네요 저는 안뜹니다 하하 이유는 잘 모르겠어요 나중엔 개념을 검색해보신 분께서 들어와주셨으면좋겠네요~!
충격! 티스토리는 카카오 꺼라 다음에선 검색이 되는데 구글에선 검색이 안됩니다..ㅎ 근데 보통 뭔갈 알고싶을때 바로 url에 때려 넣지 않습니까?! 그래서 구글에 검색이 되도록 야 구글아 나 블로그 만들었다!라고 알려줘야 된답니다. 1. https://search.google.com/search-console/welcome 2. 오른쪽에 URL 접두어 창에 본인 티스토리 URL을 넣어...
1. 우선 관리자 페이지로 이동합니다. 2. 좌측 꾸미기 카테고리에 스킨편집으로 이동합니다. 3. 우측 상단 html 편집으로 이동합니다. 4. <haed> 와 <\head>사이에 다음 을 복사해서 붙여넣어줍니다. <script id="MathJax-script" async src=" https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml....
21 posts
Programs, project retrospectives, portfolio traces, and milestone posts that show progression over time.
Conda에서 uv로 넘어가며 왜 속도, 표준 준수, 재현성이 개발 생산성을 바꾸는지 설명한 실무형 글.
Sam2가 공개됐습니다. https://sam2.metademolab.com/demo <감사합니다 메타> 직접해보시면 아시겠지만 성능이 매우 뛰어납니다. 없어졌다 다시 나오는것도 찾아 tracking하구요. 이름은 Segment anything인데 yolo도 씹어먹을 tracking성능까지 뛰어난것을 확인 할 수 있습니다. https://github.com/facebookresearch...
Methodologies of Super-Resolution Techniques Super-resolution technology has evolved using three main methodologies: Convolutional Neural Networks (CNN), Generative Adversarial Networks (GAN), and Transformers. 1. CNN...
https://www.myfonts.com/pages/tags/compare-fonts Compare Fonts | MyFonts www.myfonts.com 이런식으로 내가 원하는 문구에 대한 폰트별 비교를 해보고싶은데 어디 없을까 여깄넹.. https://www.koreafont.com/fonts/list/ 한글마을 - 한글폰트 비교/검색 모두가 찾아보는 한글디자인,오래오래 보고 싶...
BoostCamp에서 무엇을 배우고 어떤 문제를 직접 풀었는지, 성장 과정과 프로젝트 경험을 함께 돌아본 글.
최현영_포트폴리오_compressed.pdf 5.59MB
R-CNN 1. Input image 2. Extract Region proposals - (sliding window, selective search) 3. Compute CNN features 4. Classify Regions SPPNet 1. Input image 2. Compute CNN features 3. Spatial pyramid pooling 4. Classify Re...
성능평가의 개념 mAP(mean aveage precision) mAP를 계산하기 위해 필요한 개념 - confusion matrix Ground Truth Prediction 1 0 1 TP(True Positive) FN(False Negative) 0 FP(False Positive) TN(True Negative) - Precision & Recall \(Precision = \...
# Introduction to Streamlit Streamlit is a powerful tool for building web services, especially useful for data scientists and analysts. It simplifies the process of turning data scripts into shareable web applications...
Going deeper GoogLeNet -> inception module : width 확장-> 1x1 convolution layer로 연산량 줄임 : bottleneck layer 1x1 convolution 이란? 이미지의 모든 채널에 대한 특정 픽셀 (x,y)에 1x1 kernel을 내적하여 계산 m개의 kernel을 사용한다면 output 채널이 m개 생성됨 -> 공간의 특...
Transfer Learning 1. F C Layer만 update하는 방법 (주로 데이터가 적을때) 2. Cov Layer의 learning rate는 낮게하고, FC layer는 learning rate를 높게 함(주로 데이터가 충분히 있을때) Knowledge distillation 모델압축에 유용하게 사용됨, pretrained된 모델의 inference를 unlabed d...
Bagging vs Boosting Bagging(Bootstrap Aggregating)과 Boosting은 앙상블 학습(Ensemble Learning) 기법으로, 다수의 기본 모델을 결합하여 더 강력한 예측 모델을 생성하는 데 사용됩니다. 그러나 두 기법은 다음과 같이 다릅니다: Bagging (Bootstrap Aggregating): Bagging은 다수의 독립적인 기본 모델을...
정리 PyTorch project flow 모든 구성에 대해 꼼꼼히 알자! 1. install environment 2. Data Loader 3. define model architecture, loss function, optimizer 4. Train model with multi gpu through DDP 5. monitoring model performance with Wan...
Python의 기본적인 개념과 언어의 특징을 공부했다. 기본적인 package들을 공부했다 pandas는 참 내용이 진짜 진짜 어이없이 많다. 많이 알고 있으면 활용이 더 쉽겠지 동료들도 좋고.. 아 그리고 정규식에 대해 처음으로 알게됐다. 문자 전처리등에 잘 쓰일 수 있을 것 같다. 프로젝트가 기대된다
회귀분석을 진행하고 모델을 평가할 때 Pearson Coefficient와 Coefficient of Determination를 Metric(평가지표)로서 사용하는 경우가 많습니다. Pearson Coefficient는 주로 r이라고 표현하고 Coefficient of Determination은 주로 r^2으로 편합니다. 그로 인해 Pearson Coefficient를 제곱 하면 Coe...
https://www.youtube.com/watch?v=FgzM3zpZ55o&list=PLRQmQC3wIq9yxKVK1qc0r2nPuInn92LmK&index=1 강화 학습 = Learn to make good sequences of decisions under uncertainty. 강화 학습은 5가지 category를 포함하고 있다. 1. Optimization - best out...
처음에 보고 도무지 어떻게 풀어야 할지 모르겠다는 느낌이 들었습니다. 그런데 보 다보다 고민하다 보니 점화식이라는 것을 알게 됐습니다. 점! 화! 식! 계단 올라가는 거죠 10칸짜리 계단을 올라가는데 올라갈 수 있는 방법이 세 가지라고 하는 거랑 같은 문제죠 예를 들어 2칸 올라간다, 3칸 올라간다, 1칸 내려간다 이 세가지 행동들을 최소한으로 취하여 올라가는 방법을 찾는 거조 여기서...
10991에서 막혔습니다. 구글에 찾아보았습니다. 마치 고등학교때 수학문제를 풀다가 답지를 봤는데 생각보다 너무 쉬워서 허탈한 그런 느낌적인 느낌입니다. (n-i)의 이용이 아주 유용하기 때문에 완벽한 이해와 함께 넘어가면 좋겠다는 생각을 했습니다. 하는김에 10992까지 풀어보겠습니다 아래코드가 완벽한 저의 스타일이네요 ㅋㅋㅋ 예외처리 없이 하면 참 좋을텐데 떠오르는 방법이 이런거 밖...
2242에서 막혔습니다. 잘 모르겠습니다. 하하 for문을 두개 쓸까 세개쓸까 이런생각만 하고있었는데, 구글에서 찾아보고 새로운 것을 알아버렸습니다~ 뭔지는 알겠는데 짜라고 하면 못짜겠네요~ ㅋㅋㅋ 배웠으니 익히고 제것으로 만들어 보겠습니다~ 2557, 1000, 2558, 10950, 10951, 10952, 10953, 11021, 11022, 11718, 11719, 11720,...
자 이제 저는 Guided Bakcpropagation에 대해 자세히 파보고, 그 뒤로 전체 코딩으로 완성해보겠습니다.
11720 에서 막혔습니다. 공백 없이 주어지는 숫자를 어떻게 해체해야하는지를 모르겠그등여 모르면 찾아봐야겠죠? 여기서 처음으로 함수(def)를 만들어서 사용하게 되네요! 다음과 같은 코드로 해결하게 됐습니다. 11721도 좀 절었습니다. 근데 어찌저찌 풀어냈습니다!! 2557, 1000, 2558, 10950, 10951, 10952, 10953, 11021, 11022, 11718,...