분류 전체보기(124)
-
[Generative] InstanceDiffusion: Instance-level Control for Image Generation (CVPR'24)
Paper : https://arxiv.org/pdf/2402.03290AuthorsMeta + UC Berkeley Univ, CVPR’24Main Ideapretrained T2I모델을 control하기 위한 방법으로, 개별적인 instance들에게 각각 control을 제공하기 위한 모델** GLIGEN의 open-set grounded T2I문제와 비슷한 문제를 해결합니다.instance별로 각각 free-form language condition을 제공할 수 있으며, 아래와 같은 location에 대한 유연한 control을 제공할 수 있습니다.Single pointScribbleBounding boxInstance segmentation maskTasks : Text2Image + Contro..
2024.05.25 -
[Generative] Transparent Image Layer Diffusion using Latent Transparency (arxiv'24)
Paper : https://arxiv.org/pdf/2402.17113AuthorsLvmin Zhang et al, Stanford Univ., arxiv’24ControlNet 저자Main Ideapre-trained LDM을 활용해 transparent 이미지를 생성하도록 합니다.Task1. 하나의 transparent 이미지 생성Task2. multiple transparent layers 위 Task2 모델에서는 Shared Attention 메커니즘을 활용해 레이어간의 coherent하도록 학습합니다.HITL collection scheme을 활용해 데이터를 구축했습니다.Tasks : Transparent Image Generation (Unconditional, Conditional)Resu..
2024.05.02 -
[Generative] Diffusion-based Inversion과 Personalization에 대한 생각
개인적으로 Generative 관련된 결과를 내다보면, 학습된 모델을 이용해 결과를 얻어 내는 것도 좋지만 나만의 "새로운 컨셉"에 대한 결과를 얻는 것에 더 관심이 많은 것 같습니다. 이를 Personalization이라고 하기도 하는데, 이를 위한 다양한 기법을 비교하던 중 아래와 같은 의문들이 생겼습니다.새로운 컨셉을 학습시키고 싶은데, 단순히 fine-tuning을 한다면 내가 원했던 특징들도 사라지지는 않을까?내가 원했던 특징을 남기면서, 특정한 특징을 학습하려면 Fine-tuning 기법 / Personalization 기법 / Inversion기법 어떤 방법을 활용해야하며 무엇이 다르지?왜 위에서 보았던 다양한 기법들이 어떤 논문에서는 Controling style variants로 분류 되..
2024.04.19 -
[Git] 작업중인 Repository History 분석
A. 수단 - OS/Platform/Tool : Linux, Kubernetes(k8s), Docker, AWS - Package Manager : node.js, yarn, brew, - Compiler/Transpillar : React, Nvcc, gcc/g++, Babel, Flutter - Module Bundler : React, Webpack, Parcel B. 언어 - C/C++, python, Javacsript, Typescript, Go-Lang, CUDA, Dart, HTML/CSS C. 라이브러리 및 프레임워크 및 SDK - OpenCV, OpenCL, FastAPI, PyTorch, Tensorflow, Nsight 1. What? (현상) Git으로 작업된 Repository가..
2024.04.02 -
[Nvidia] GPU OOM Error 나는 경우 (+Tensorflow)
A. 수단 - OS/Platform/Tool : Linux, Kubernetes(k8s), Docker, AWS - Package Manager : node.js, yarn, brew, - Compiler/Transpillar : React, Nvcc, gcc/g++, Babel, Flutter - Module Bundler : React, Webpack, Parcel B. 언어 - C/C++, python, Javacsript, Typescript, Go-Lang, CUDA, Dart, HTML/CSS C. 라이브러리 및 프레임워크 및 SDK - OpenCV, OpenCL, FastAPI, PyTorch, Tensorflow, Nsight 1. What? (현상) 필자의 경우 tensorflow를 활용..
2024.04.02 -
[Generative] Diffusion 모델 원하는 위치에 받기
A. 수단 - OS/Platform/Tool : Linux, Kubernetes(k8s), Docker, AWS - Package Manager : node.js, yarn, brew, - Compiler/Transpillar : React, Nvcc, gcc/g++, Babel, Flutter - Module Bundler : React, Webpack, Parcel B. 언어 - C/C++, python, Javacsript, Typescript, Go-Lang, CUDA, Dart, HTML/CSS C. 라이브러리 및 프레임워크 및 SDK - OpenCV, OpenCL, FastAPI, PyTorch, Tensorflow, Nsight 1. What? (현상) Diffusion을 활용해 생성 모델을..
2024.03.28