Developers 공간 [SOTA](12)
-
[Generative] Simplifying, Stabilizing & Scaling Continuous Time Continuous-time Consistency Models (ICLR’25)
Paper : https://openreview.net/forum?id=LyJi5ugyJxAuthorsYang Song + OpenAI, ICLR’25Main Idea새로운 parametrization TrigFlow를 제안해 기존 discrete-time CM과 continuous-time CM 모두의 성능을 향상합니다.위 formulation은 기존의 EDM, Flow Matching, V-Prediction을 통합한 개념입니다.위 formulation을 통해 기존 continuous-time CM의 instability의 원인을 파악해 개선이 가능합니다.이런 formulation 내에서 instability를 극복하기 위한 네트워크 구조와 Training Objective를 제안해 학습한 sCM을 ..
2024.12.04 -
[Generative] Improved Precision and Recall Metric for Assessing Generative Models (NIPS'19)
Paper : https://proceedings.neurips.cc/paper_files/paper/2019/file/0234c510bc6d908b28c70ff313743079-Paper.pdfCode : https://github.com/kynkaat/improved-precision-and-recall-metricAuthorsNvidia, NIPS’19Main Idea생성모델에서 생성한 sample들의 coverage와 quality를 측정manifold의 explicit & non-parametric한 표현을 활용해 visualize가 가능한 새로운 metric을 제안Tasks : 2D Image GenerationResults : FFHQ, ImageNet0. Before Start... a..
2024.10.26 -
[Generative] Class-Balancing Diffusion Models (CVPR’24)
Paper : https://openaccess.thecvf.com/content/CVPR2023/papers/Qin_Class-Balancing_Diffusion_Models_CVPR_2023_paper.pdfAuthorsAustin Univ. + Shanghai AI Lab, CVPR’24Main IdeaLong-tailed Dataset으로 DM을 학습할 때 생기는 문제점을 해결하기 위한 CBDM이라는 모델을 제안합니다.이는 Adjusted Transfer Probability로 구현되는데, 다시 말해 MSE형태의 추가적인 regularizer를 통해 구현됩니다.Tasks : T2I GenerationResults : CIFAR10, CIFAR100, CIFAR10LT, CIFAR100LT0. B..
2024.10.14 -
[Generative] A Recipe for watermarking Diffusion Models (ICLR’24)
Paper : https://arxiv.org/pdf/2303.10137AuthorsSea AI Lab +Tsinghua Univ, ICLR’24Main IdeaDiffusion Model을 위한 watermarking 방법을 정리하고, 분석한 논문입니다.Tasks : Unconditional Generation, T2I GenerationResults : FFHQ, AFHQv2, ImageNet-1K(64x64), CIFAR-10(32x32)0. Before Start... a. Defense Model b. Threat Model1. Problem2. Approach a. Unconditional & Class-conditional Generation b. Text-To-Image ..
2024.10.07 -
[Generative] Shap·E: Generating Conditional 3D Implicit Functions (arxiv'23)
Paper : https://arxiv.org/pdf/2305.02463AuthorsOpenAI, arxiv’23Main Idea기존과 다르게 NeRF와 Textured Mesh 두가지 모두로 render되는 implicit function 파라미터를 생성합니다.기존 Point-E 모델에 비해 빠르게 Converge하면서도 좋은 퀄리티의 모델링이 가능합니다.Tasks : Text-To-3D Object GenerationResults : Rendered From RGBA data0. Before Start... a. INR(Implicit Neural Representations) b. 3D Representation with SDF c. Point-E1. Problem 2. Approac..
2024.09.21 -
[Generative] InstanceDiffusion: Instance-level Control for Image Generation (CVPR'24)
Paper : https://arxiv.org/pdf/2402.03290AuthorsMeta + UC Berkeley Univ, CVPR’24Main Ideapretrained T2I모델을 control하기 위한 방법으로, 개별적인 instance들에게 각각 control을 제공하기 위한 모델** GLIGEN의 open-set grounded T2I문제와 비슷한 문제를 해결합니다.instance별로 각각 free-form language condition을 제공할 수 있으며, 아래와 같은 location에 대한 유연한 control을 제공할 수 있습니다.Single pointScribbleBounding boxInstance segmentation maskTasks : Text2Image + Contro..
2024.05.25