전체 글(135)
-
[Generative] Transparent Image Layer Diffusion using Latent Transparency (arxiv'24)
Paper : https://arxiv.org/pdf/2402.17113AuthorsLvmin Zhang et al, Stanford Univ., arxiv’24ControlNet 저자Main Ideapre-trained LDM을 활용해 transparent 이미지를 생성하도록 합니다.Task1. 하나의 transparent 이미지 생성Task2. multiple transparent layers 위 Task2 모델에서는 Shared Attention 메커니즘을 활용해 레이어간의 coherent하도록 학습합니다.HITL collection scheme을 활용해 데이터를 구축했습니다.Tasks : Transparent Image Generation (Unconditional, Conditional)Resu..
2024.05.02 -
[Generative] Diffusion-based Inversion과 Personalization에 대한 생각
개인적으로 Generative 관련된 결과를 내다보면, 학습된 모델을 이용해 결과를 얻어 내는 것도 좋지만 나만의 "새로운 컨셉"에 대한 결과를 얻는 것에 더 관심이 많은 것 같습니다. 이를 Personalization이라고 하기도 하는데, 이를 위한 다양한 기법을 비교하던 중 아래와 같은 의문들이 생겼습니다.새로운 컨셉을 학습시키고 싶은데, 단순히 fine-tuning을 한다면 내가 원했던 특징들도 사라지지는 않을까?내가 원했던 특징을 남기면서, 특정한 특징을 학습하려면 Fine-tuning 기법 / Personalization 기법 / Inversion기법 어떤 방법을 활용해야하며 무엇이 다르지?왜 위에서 보았던 다양한 기법들이 어떤 논문에서는 Controling style variants로 분류 되..
2024.04.19 -
[Git] 작업중인 Repository History 분석
A. 수단 - OS/Platform/Tool : Linux, Kubernetes(k8s), Docker, AWS - Package Manager : node.js, yarn, brew, - Compiler/Transpillar : React, Nvcc, gcc/g++, Babel, Flutter - Module Bundler : React, Webpack, Parcel B. 언어 - C/C++, python, Javacsript, Typescript, Go-Lang, CUDA, Dart, HTML/CSS C. 라이브러리 및 프레임워크 및 SDK - OpenCV, OpenCL, FastAPI, PyTorch, Tensorflow, Nsight 1. What? (현상) Git으로 작업된 Repository가..
2024.04.02 -
[Nvidia] GPU OOM Error 나는 경우 (+Tensorflow)
A. 수단 - OS/Platform/Tool : Linux, Kubernetes(k8s), Docker, AWS - Package Manager : node.js, yarn, brew, - Compiler/Transpillar : React, Nvcc, gcc/g++, Babel, Flutter - Module Bundler : React, Webpack, Parcel B. 언어 - C/C++, python, Javacsript, Typescript, Go-Lang, CUDA, Dart, HTML/CSS C. 라이브러리 및 프레임워크 및 SDK - OpenCV, OpenCL, FastAPI, PyTorch, Tensorflow, Nsight 1. What? (현상) 필자의 경우 tensorflow를 활용..
2024.04.02 -
[Generative] Diffusion 모델 원하는 위치에 받기
A. 수단 - OS/Platform/Tool : Linux, Kubernetes(k8s), Docker, AWS - Package Manager : node.js, yarn, brew, - Compiler/Transpillar : React, Nvcc, gcc/g++, Babel, Flutter - Module Bundler : React, Webpack, Parcel B. 언어 - C/C++, python, Javacsript, Typescript, Go-Lang, CUDA, Dart, HTML/CSS C. 라이브러리 및 프레임워크 및 SDK - OpenCV, OpenCL, FastAPI, PyTorch, Tensorflow, Nsight 1. What? (현상) Diffusion을 활용해 생성 모델을..
2024.03.28 -
[Gradio] Gradio 기초
A. 수단- OS/Platform/Tool : Linux, Kubernetes(k8s), Docker, AWS- Package Manager : node.js, yarn, brew, - Compiler/Transpillar : React, Nvcc, gcc/g++, Babel, Flutter- Module Bundler : React, Webpack, ParcelB. 언어- C/C++, python, Javacsript, Typescript, Go-Lang, CUDA, Dart, HTML/CSSC. 라이브러리 및 프레임워크 및 SDK- OpenCV, OpenCL, FastAPI, PyTorch, Tensorflow, Nsight 1. What? (현상) 빠르게 Interactive Web App을 py..
2024.03.25